00:00:00이제 AI 에이전트가 점점 더 유용해지고 우리 삶의 일부가 되어감에 따라,
00:00:05적어도 특정 작업들에 있어서는, 우리가 일종의 원점으로 되돌아가는 과정이 꽤 흥미롭다고 생각합니다.
00:00:11이게 무슨 뜻인지 설명해 드릴게요. 컴퓨터와 인터넷의 역사를
00:00:16전체적으로 살펴본다면, 아마도 이런 식의 '사용 편의성' 차트를 그릴 수 있을 겁니다.
00:00:23물론 이건 제가 임의로 만든 것이지만, 제 의도는 이해하실 거예요. 1970년대쯤부터 시작해서,
00:00:30정확한 연도는 따지지 말아 주세요. 어쨌든 그 무렵인 초기 시절에는
00:00:36여러분과 제가—사실 저는 태어나지도 않았지만—일반 가정에
00:00:41컴퓨터조차 없던 시절이었죠. 컴퓨터와의 상호작용은 주로 터미널 인터페이스를 통한,
00:00:47본질적으로 명령줄(CLI)을 통한 텍스트 전용 방식이었습니다. 그리고 화려한 그래픽 사용자 인터페이스(GUI)와
00:00:54다양한 웹사이트, 일반 사용자를 위해 만들어진 운영체제 같은 즐거운 것들은
00:01:0190년대와 2000년대에 들어서야 나타났고, 오늘날까지 계속 진화해 왔습니다.
00:01:09물론 지금도 여전히 진화 중입니다. 오해는 마세요, 이런 것들이 전부 사라질 거라는 뜻은 아닙니다.
00:01:14하지만 한 가지 분명하고 눈에 띄는 점은, AI 에이전트의 등장과 함께
00:01:22다시 텍스트 전용 입력, 터미널 인터페이스, CLI 도구, 마크다운, JSON 같은 기초적인 방식으로 돌아가는 강한 추세가 있다는 겁니다.
00:01:31단순히 'Claude Code'처럼 그래픽 인터페이스가 없는 도구들만 이야기하는 게 아닙니다.
00:01:37데스크톱 앱이 있긴 하지만 주로 명령줄 도구로 사용되는 것들 말이죠. 단지 그것만 뜻하는 게 아니라,
00:01:43대신 제가 말하고자 하는 바는, 이러한 모든 AI 에이전트나 에이전트 기반의 도구들이
00:01:48다른 명령줄 도구들이나 명령줄을 통해 호출할 수 있는 다른 프로그램들과
00:01:54상호작용하는 데 정말 뛰어나다는 점입니다. 그들은 마크다운처럼 단순하게 포맷팅된
00:02:02텍스트를 원하며, 바로 그 지점에서 진가를 발휘합니다. 그래서 점점 더 많은 기업이—
00:02:09예를 들어 제가 이걸 녹화하기 불과 몇 시간 전에도 구글이 더 많은 명령줄 도구를 출시했습니다.
00:02:15구글은 'Google Workspace CLI'를 출시했죠. 믿기지 않겠지만 지금까지는 존재하지 않았던 것으로,
00:02:21공식 CLI를 통해 Gmail이나 Google Drive 같은 구글 워크스페이스 서비스를
00:02:27사용할 수 있게 해주는 도구입니다. 이전에도 다른 해결책들은 있었습니다.
00:02:35예를 들어 OpenClaw의 제작자인 Peter Steinberger가 만든 'GOG CLI'가 있었죠.
00:02:41그는 구글 서비스와 상호작용할 수 있는 프로그래밍 방식의 CLI 기반 도구를 원했지만,
00:02:48몇 시간 전까지는 없었기에 직접 만들었습니다. 이제는 공식적으로 존재하게 되었죠. 이 영상은 구글의 유료 광고가 아니며,
00:02:54그저 서비스를 제공하는 기업들이 점점 더 이런 도구들을 내놓고 있다는 사실이 흥미로울 뿐입니다.
00:02:59MCP 서버도 비슷한 사례가 될 수 있겠지만,
00:03:04제 생각에 MCP는 몇 가지 단점이 있습니다. 저는 앞으로 CLI 도구와 API가—
00:03:11결국 CLI 도구가 API를 감싸는 형태가 되겠지만—에이전트 도구를 통해 서비스를 이용하는
00:03:18주요 방식이 될 것이라고 강력히 믿습니다. 구체적인 예를 하나 들어보겠습니다.
00:03:27지난 몇 주 동안 저는 'PyCoding' 에이전트를 사용해 보았습니다.
00:03:32PyCoding 에이전트는 Claude Code의 대안이라고 할 수 있습니다. 좋은 의미에서 더 단순하고,
00:03:37기능은 더 제한적이지만 매우 강력하며, 예를 들어 자신의 API 구독권과 함께 사용할 수 있습니다.
00:03:46이 영상은 주로 이 에이전트에 관한 것이 아니며, 사실 여러분이 무엇을 쓰든 상관없습니다.
00:03:51무엇을 쓰든 목적지에 도달하게 해 줄 겁니다. 하지만 저는 이 도구가 마음에 들고, 무엇보다 중요한 점은
00:03:57Claude Code처럼 이 도구도 이름과 달리 코딩이 아닌 작업에도 사용할 수 있다는 겁니다.
00:04:01예를 들어, 사실 이 Py 에이전트가 OpenClaw 내부에서 사용되고 있습니다.
00:04:07말하자면 OpenClaw의 논리적 핵심인 셈이죠. 그리고 OpenClaw는 거기에
00:04:13메모리 기능이나 텔레그램, 왓츠앱 같은 채널들을 추가한 것입니다.
00:04:19이것은 여러분의 시스템에서 무언가를 수행하기 위해 실행할 수 있는 에이전트 도구 중 하나입니다.
00:04:24물론 직접 에이전트를 만들 수도 있습니다. 저도 관련 강의가 있는데, 거기서 AI 에이전트의
00:04:30실제 작동 원리와 워크플로우와의 차이점을 다룹니다. 종종 진정한 에이전트보다
00:04:35단순 워크플로우를 원할 때도 있으니까요. 이에 대해 더 깊이 배우고 싶으시다면 제 강의를 참고해 주세요.
00:04:40Claude Code나 다른 도구들에 대한 강의도 준비되어 있습니다. 어떤 도구를 사용하든,
00:04:44정말 흥미롭고 분명하게 보이는 것은 이들이 다른 CLI 도구들과 얼마나 잘 상호작용하느냐는 것입니다.
00:04:49이는 매우 타당한 일인데, 에이전트들이 훈련 데이터에서 curl이나
00:04:54cd, ls 같은 리눅스 명령줄 명령어를 사용하는 수많은 CLI 작업을 보았기 때문입니다.
00:04:58에이전트들은 그런 표준 리눅스 명령어들을 이미 속속들이 알고 있을 뿐만 아니라,
00:05:03더 중요하게는 이러한 도구들을 '어떻게' 사용하는지도 배웠습니다. CLI 도구들을 연결하는 법이나
00:05:10한 도구의 결과를 다른 도구로 전달(pipe)하는 법 말이죠. 그들은 이런 작업에 능숙합니다.
00:05:16또한 '--help'를 사용해 도구에 대해 더 알아낼 수 있다는 사실도 알고 있습니다.
00:05:21이 덕분에 그들은 훈련 데이터에 없었던 새로운 도구들도 아주 잘 다룰 수 있게 됩니다.
00:05:28방금 말씀드린 새로운 Google Workspace CLI 같은 것들이 그렇죠.
00:05:35물론 에이전트를 통해 이를 사용하려고 하면 훈련 데이터에는 없었을 테니
00:05:41어떻게 쓰는지 모를 겁니다. 하지만 여러분이 공식 문서 링크를 주거나,
00:05:47설령 주지 않더라도 에이전트는 '--help'를 사용해 스스로 사용법을 알아낼 가능성이 큽니다.
00:05:52결국 그저 또 다른 CLI 도구일 뿐이니까요. 대규모 언어 모델(LLM)은
00:05:57이러한 CLI 도구들을 이해하고 설명하며 사용하는 데 탁월합니다.
00:06:01예를 들어 바로 어제 저에게 작은 문제가 하나 있었습니다. 웹사이트에
00:06:05PDF 문서를 업로드해야 했는데요, 여러분도 여러 문서를 한 파일로 합치라고 하면서
00:06:11용량은 5MB를 넘으면 안 된다고 요구하는 사이트들을 아실 겁니다. 바로 그런 상황이었죠.
00:06:17당연히 PDF 문서를 압축해야만 했습니다.
00:06:20압축해 주는 웹사이트를 찾을 수도 있었겠지만, 저는 제 개인 자료를
00:06:26아무 웹사이트에나 업로드하는 것을 별로 좋아하지 않습니다. 그래서 망설여졌죠.
00:06:32제 시스템에 도움이 될 만한 도구가 있는지 확인할 수도 있었겠지만,
00:06:38더 이상 Adobe 구독을 하지 않아서 조사하는 데 시간이 꽤 걸렸을 겁니다. 결국엔
00:06:43미심쩍은 웹사이트에 올리게 됐을지도 모르죠. 하지만 AI가 있다면 다릅니다. 물론 에이전트를 써서
00:06:49작은 변환/압축 도구 코드를 뚝딱 만들어낼 수도 있었을 것이고,
00:06:55그것도 아마 잘 작동했겠지만 저는 Py 에이전트를 실행했습니다.
00:07:01그리고 그냥 이 PDF 파일을 살펴보고 품질은 최대한 유지하면서
00:07:07압축해 달라고 요청했습니다. 그게 전부였습니다. 그게 제 유일한 프롬프트였죠.
00:07:13그러자 에이전트가 작업을 시작해서 명령줄에서 일련의 명령어를 실행하고 작은 스크립트들을 돌렸습니다.
00:07:19참고로 저는 이걸 제 시스템에서 실행하고 있지만, 가드레일 확장을 설치해 두었습니다.
00:07:26Py에는 확장을 설치할 수 있는 개념이 있거든요. 그래서 에이전트가
00:07:33제 하드 드라이브를 함부로 지우지 못하게 하는 확장을 설치했습니다. 또한 에이전트가
00:07:36수행하려는 작업을 설명할 때 면밀히 지켜보고 있었습니다. 작업을 맡겼고
00:07:41여러 과정을 거치더니 마침내 완료되었습니다. 결과적으로 성공적이었고,
00:07:46문서를 성공적으로 압축해 용량을 대폭 줄였습니다. 이건 아주 단순한 예시일 수 있고,
00:07:53다른 대안들도 있었을 겁니다. 하지만 제 요점은 에이전트가 터미널의 명령줄에서
00:07:59우리의 프로그램들을 사용해 그 모든 일을 해냈다는 점입니다. 그리고 당연히
00:08:06프로그램이 컴퓨터를 사용하는 것이기에 이는 매우 합리적입니다. 우리가 아는
00:08:11화려한 그래픽 인터페이스와 웹사이트들은 여러분과 저 같은 '인간'을 위해 만들어진 겁니다.
00:08:18그런 것들이 사라지지는 않겠지만, 우리가 지금 하는 작업 중 일부라도 수행할 수 있는
00:08:25작은 유틸리티 AI 에이전트를 시스템에서 돌리고 싶다면, 그들에게 컴퓨터를
00:08:29더 효율적으로 사용할 수 있는 방법을 제공해야 합니다. 왜냐하면 인간을 위해 만들어진
00:08:36그래픽 인터페이스나 앱, 웹사이트는 컴퓨터 프로그램에게는 최적의 방식이 아니기 때문입니다.
00:08:41프로그램은 스크린샷을 찍고, 버튼 위치를 파악하고, 마우스를 옮겨 클릭한 뒤,
00:08:46새 페이지 내용을 보려고 다시 스크린샷을 찍어야 합니다. 그건 너무 비효율적이고 토큰 낭비도 심하며 시간도 오래 걸립니다.
00:08:53그것이 바로 AI 에이전트와 LLM이 등장하기 훨씬 전부터 API라는 개념이 있었던 이유입니다.
00:08:59우리가 웹사이트든 앱이든 프로그램을 작성할 때,
00:09:03다른 프로그램이나 서비스와 상호작용하고 싶다면 과거에도 이미 API를 사용했습니다.
00:09:09인간이 쓰라고 만든 웹사이트를 굳이 스크립트로 억지로 돌리려 하지 않았죠. 그것이 API가 존재하는 이유이며,
00:09:13구글 워크스페이스 CLI 같은 명령줄 프로그램들도 결국 API를 감싸고 있는 것에 불과합니다.
00:09:18하지만 그것이 바로 에이전트가 소비하기에 가장 적합한 형태의 프로그램입니다.
00:09:24에이전트는 예쁜 버튼 같은 것엔 관심이 없으니까요. 에이전트는 일을 처리하기 위해
00:09:31다양한 명령을 호출할 수 있는 단순한 방식을 원합니다. 이것이 바로 지금의 흐름이 타당한 이유입니다.
00:09:37또한 마크다운이 어느 때보다 중요해진 이유이기도 하며, 많은 문서 페이지들이
00:09:43내용을 마크다운으로 쉽게 복사할 수 있는 버튼을 제공하는 이유이기도 합니다.
00:09:49복사해서 여러분이 즐겨 쓰는 LLM이나 채팅 세션, 코딩 도구에 바로 붙여넣을 수 있도록 말이죠.
00:09:56어떤 웹사이트들은 URL 끝에 '.md'를 붙여 기사를 마크다운 형식으로 받을 수 있게 지원하기도 하는데,
00:10:03이는 우리가 특정 서비스와 콘텐츠가 주로 에이전트에 의해 소비되는 미래로 가고 있기 때문입니다.
00:10:10예를 들어 'TanStack Start' 같은 라이브러리나 프레임워크의 문서를 생각해 보세요.
00:10:15요즘 그런 사이트를 구축한다면—물론 어떤 기술 스택을 쓰든 요점은 같습니다만—
00:10:22아마도 코딩 에이전트나 Cursor 같은 도구의 도움을 받을 가능성이 큽니다.
00:10:28만약 에이전트에게 라이브러리 사용법을 알려주기 위해 특정 문서를 가리킨다면,
00:10:32이런 일반 웹사이트를 그대로 보여주고 싶지는 않을 겁니다. 에이전트가 HTML 코드를
00:10:38전부 내려받아 불필요하게 토큰을 낭비하게 하고 싶지 않겠죠. 이것이 바로 CLI 도구들이
00:10:46점점 더 중요해지는 것과 같은 맥락입니다. 우리는 적어도 일부 작업들이
00:10:52AI 에이전트의 도움을 받거나 에이전트에 의해 독점적으로 수행되는 미래로 이동하고 있으니까요.
00:10:58이는 또한 여러분이 만약 인간이 주된 소비자가 아닌 어떤 서비스를 만들고 있다면,
00:11:03미래에 사람들이 에이전트를 통해 여러분의 서비스를 이용할 수 있도록
00:11:09API뿐만 아니라 CLI도 구축하는 것을 강력히 고려해야 한다는 뜻입니다.
00:11:15물론 우리는 아직 아주 초기 단계에 있습니다. 대다수 사람은 아직 에이전트에 관심조차 없죠.
00:11:20AI 에이전트가 얼마나 더 좋아질지, 미래에 어떤 작업들을 처리할 수 있을지 단정하기엔 이릅니다.
00:11:25어쩌면 지금처럼 몇 가지 일은 할 수 있지만 여전히 인간의 감독이 필요한 수준에
00:11:32머물러 있을지도 모릅니다. 하지만 그 상태에서도 에이전트가 수행할 수 있는 작업들이 있고,
00:11:38에이전트가 우리의 서비스나 웹사이트와 쉽게 상호작용할 수 있게 적절한 도구를 제공함으로써
00:11:42그들을 더 유용하고 강력하게 만들 수 있습니다. 이것이 바로 우리가 원점으로 되돌아가는 이유입니다.
00:11:49당연히 그래픽 인터페이스나 웹사이트가 사라진다는 뜻은 아니며,
00:11:54인간이 소비하도록 설계되어 에이전트가 쓸 이유가 없는 앱이나 사이트들은 항상 존재할 겁니다.
00:12:02예를 들어 넷플릭스 같은 것 말이죠. 에이전트가 저에게 어떤 영화의 내용을
00:12:09요약해 주는 게 큰 이점이 있다고 보지는 않습니다. 영화는 제가 직접 보고 싶으니까요.
00:12:14하지만 많은 서비스들, 특히 SaaS 비즈니스나 전문 서비스 분야에서는
00:12:20이것이 확실히 나아가야 할 방향입니다. 분명 초기 단계이긴 하지만
00:12:26여기서 우리가 볼 수 있는 명확한 발전 방향이라고 생각합니다.
00:12:31적어도 그것이 제 의견입니다. 하지만 언제나 그렇듯 여러분의 생각도 궁금합니다. 그러니 공유해 주세요.
00:12:37여러분의 생각은 어떤지, 제가 놓치거나 간과한 부분은 없는지 알려주세요. 그리고
00:12:421~2년 뒤의 CLI 도구 세상은 또 어떤 모습일지 함께 지켜봅시다.
00:12:49일종의 원점으로 되돌아가고 있는 것입니다. 당연히 이것이 그래픽 사용자 인터페이스나
00:12:55웹사이트가 사라진다는 뜻은 아닙니다. 아마도 에이전트가 소비하는 것이 별 의미가 없는,
00:13:01인간이 소비하도록 만들어진 앱이나 웹사이트는 항상 존재할 것입니다. 제 말은,
00:13:07넷플릭스 같은 것 말이죠. 에이전트가 저에게 특정 영화의 내용이 무엇인지
00:13:13설명해 주는 것에서 큰 장점을 느끼지 못합니다. 영화는 직접 보고 싶으니까요. 하지만 많은 서비스, 특히 SaaS
00:13:21비즈니스나 전문 서비스 분야에서는 이것이 확실히 나아가야 할 방향입니다. 제 생각에
00:13:28분명 초기 단계이긴 하지만, 여기서 우리가 볼 수 있는 명확한 발전 방향이라고 봅니다. 적어도
00:13:34그것이 제 의견입니다. 하지만 언제나 그렇듯 여러분의 생각도 알고 싶습니다. 그러니 자유롭게
00:13:39공유해 주세요. 제가 놓치거나 간과한 부분이 있다면 알려주세요. 그리고
00:13:441~2년 뒤의 CLI 도구 세상은 또 어떤 모습일지 함께 지켜봅시다.