AI 에이전트가 CLI에 열광하는 이유

한국어العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 Português Русский 中文

MMaximilian Schwarzmüller

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00이제 AI 에이전트가 점점 더 유용해지고 우리 삶의 일부가 되어감에 따라,

00:00:05적어도 특정 작업들에 있어서는, 우리가 일종의 원점으로 되돌아가는 과정이 꽤 흥미롭다고 생각합니다.

00:00:11이게 무슨 뜻인지 설명해 드릴게요. 컴퓨터와 인터넷의 역사를

00:00:16전체적으로 살펴본다면, 아마도 이런 식의 '사용 편의성' 차트를 그릴 수 있을 겁니다.

00:00:23물론 이건 제가 임의로 만든 것이지만, 제 의도는 이해하실 거예요. 1970년대쯤부터 시작해서,

00:00:30정확한 연도는 따지지 말아 주세요. 어쨌든 그 무렵인 초기 시절에는

00:00:36여러분과 제가—사실 저는 태어나지도 않았지만—일반 가정에

00:00:41컴퓨터조차 없던 시절이었죠. 컴퓨터와의 상호작용은 주로 터미널 인터페이스를 통한,

00:00:47본질적으로 명령줄(CLI)을 통한 텍스트 전용 방식이었습니다. 그리고 화려한 그래픽 사용자 인터페이스(GUI)와

00:00:54다양한 웹사이트, 일반 사용자를 위해 만들어진 운영체제 같은 즐거운 것들은

00:01:0190년대와 2000년대에 들어서야 나타났고, 오늘날까지 계속 진화해 왔습니다.

00:01:09물론 지금도 여전히 진화 중입니다. 오해는 마세요, 이런 것들이 전부 사라질 거라는 뜻은 아닙니다.

00:01:14하지만 한 가지 분명하고 눈에 띄는 점은, AI 에이전트의 등장과 함께

00:01:22다시 텍스트 전용 입력, 터미널 인터페이스, CLI 도구, 마크다운, JSON 같은 기초적인 방식으로 돌아가는 강한 추세가 있다는 겁니다.

00:01:31단순히 'Claude Code'처럼 그래픽 인터페이스가 없는 도구들만 이야기하는 게 아닙니다.

00:01:37데스크톱 앱이 있긴 하지만 주로 명령줄 도구로 사용되는 것들 말이죠. 단지 그것만 뜻하는 게 아니라,

00:01:43대신 제가 말하고자 하는 바는, 이러한 모든 AI 에이전트나 에이전트 기반의 도구들이

00:01:48다른 명령줄 도구들이나 명령줄을 통해 호출할 수 있는 다른 프로그램들과

00:01:54상호작용하는 데 정말 뛰어나다는 점입니다. 그들은 마크다운처럼 단순하게 포맷팅된

00:02:02텍스트를 원하며, 바로 그 지점에서 진가를 발휘합니다. 그래서 점점 더 많은 기업이—

00:02:09예를 들어 제가 이걸 녹화하기 불과 몇 시간 전에도 구글이 더 많은 명령줄 도구를 출시했습니다.

00:02:15구글은 'Google Workspace CLI'를 출시했죠. 믿기지 않겠지만 지금까지는 존재하지 않았던 것으로,

00:02:21공식 CLI를 통해 Gmail이나 Google Drive 같은 구글 워크스페이스 서비스를

00:02:27사용할 수 있게 해주는 도구입니다. 이전에도 다른 해결책들은 있었습니다.

00:02:35예를 들어 OpenClaw의 제작자인 Peter Steinberger가 만든 'GOG CLI'가 있었죠.

00:02:41그는 구글 서비스와 상호작용할 수 있는 프로그래밍 방식의 CLI 기반 도구를 원했지만,

00:02:48몇 시간 전까지는 없었기에 직접 만들었습니다. 이제는 공식적으로 존재하게 되었죠. 이 영상은 구글의 유료 광고가 아니며,

00:02:54그저 서비스를 제공하는 기업들이 점점 더 이런 도구들을 내놓고 있다는 사실이 흥미로울 뿐입니다.

00:02:59MCP 서버도 비슷한 사례가 될 수 있겠지만,

00:03:04제 생각에 MCP는 몇 가지 단점이 있습니다. 저는 앞으로 CLI 도구와 API가—

00:03:11결국 CLI 도구가 API를 감싸는 형태가 되겠지만—에이전트 도구를 통해 서비스를 이용하는

00:03:18주요 방식이 될 것이라고 강력히 믿습니다. 구체적인 예를 하나 들어보겠습니다.

00:03:27지난 몇 주 동안 저는 'PyCoding' 에이전트를 사용해 보았습니다.

00:03:32PyCoding 에이전트는 Claude Code의 대안이라고 할 수 있습니다. 좋은 의미에서 더 단순하고,

00:03:37기능은 더 제한적이지만 매우 강력하며, 예를 들어 자신의 API 구독권과 함께 사용할 수 있습니다.

00:03:46이 영상은 주로 이 에이전트에 관한 것이 아니며, 사실 여러분이 무엇을 쓰든 상관없습니다.

00:03:51무엇을 쓰든 목적지에 도달하게 해 줄 겁니다. 하지만 저는 이 도구가 마음에 들고, 무엇보다 중요한 점은

00:03:57Claude Code처럼 이 도구도 이름과 달리 코딩이 아닌 작업에도 사용할 수 있다는 겁니다.

00:04:01예를 들어, 사실 이 Py 에이전트가 OpenClaw 내부에서 사용되고 있습니다.

00:04:07말하자면 OpenClaw의 논리적 핵심인 셈이죠. 그리고 OpenClaw는 거기에

00:04:13메모리 기능이나 텔레그램, 왓츠앱 같은 채널들을 추가한 것입니다.

00:04:19이것은 여러분의 시스템에서 무언가를 수행하기 위해 실행할 수 있는 에이전트 도구 중 하나입니다.

00:04:24물론 직접 에이전트를 만들 수도 있습니다. 저도 관련 강의가 있는데, 거기서 AI 에이전트의

00:04:30실제 작동 원리와 워크플로우와의 차이점을 다룹니다. 종종 진정한 에이전트보다

00:04:35단순 워크플로우를 원할 때도 있으니까요. 이에 대해 더 깊이 배우고 싶으시다면 제 강의를 참고해 주세요.

00:04:40Claude Code나 다른 도구들에 대한 강의도 준비되어 있습니다. 어떤 도구를 사용하든,

00:04:44정말 흥미롭고 분명하게 보이는 것은 이들이 다른 CLI 도구들과 얼마나 잘 상호작용하느냐는 것입니다.

00:04:49이는 매우 타당한 일인데, 에이전트들이 훈련 데이터에서 curl이나

00:04:54cd, ls 같은 리눅스 명령줄 명령어를 사용하는 수많은 CLI 작업을 보았기 때문입니다.

00:04:58에이전트들은 그런 표준 리눅스 명령어들을 이미 속속들이 알고 있을 뿐만 아니라,

00:05:03더 중요하게는 이러한 도구들을 '어떻게' 사용하는지도 배웠습니다. CLI 도구들을 연결하는 법이나

00:05:10한 도구의 결과를 다른 도구로 전달(pipe)하는 법 말이죠. 그들은 이런 작업에 능숙합니다.

00:05:16또한 '--help'를 사용해 도구에 대해 더 알아낼 수 있다는 사실도 알고 있습니다.

00:05:21이 덕분에 그들은 훈련 데이터에 없었던 새로운 도구들도 아주 잘 다룰 수 있게 됩니다.

00:05:28방금 말씀드린 새로운 Google Workspace CLI 같은 것들이 그렇죠.

00:05:35물론 에이전트를 통해 이를 사용하려고 하면 훈련 데이터에는 없었을 테니

00:05:41어떻게 쓰는지 모를 겁니다. 하지만 여러분이 공식 문서 링크를 주거나,

00:05:47설령 주지 않더라도 에이전트는 '--help'를 사용해 스스로 사용법을 알아낼 가능성이 큽니다.

00:05:52결국 그저 또 다른 CLI 도구일 뿐이니까요. 대규모 언어 모델(LLM)은

00:05:57이러한 CLI 도구들을 이해하고 설명하며 사용하는 데 탁월합니다.

00:06:01예를 들어 바로 어제 저에게 작은 문제가 하나 있었습니다. 웹사이트에

00:06:05PDF 문서를 업로드해야 했는데요, 여러분도 여러 문서를 한 파일로 합치라고 하면서

00:06:11용량은 5MB를 넘으면 안 된다고 요구하는 사이트들을 아실 겁니다. 바로 그런 상황이었죠.

00:06:17당연히 PDF 문서를 압축해야만 했습니다.

00:06:20압축해 주는 웹사이트를 찾을 수도 있었겠지만, 저는 제 개인 자료를

00:06:26아무 웹사이트에나 업로드하는 것을 별로 좋아하지 않습니다. 그래서 망설여졌죠.

00:06:32제 시스템에 도움이 될 만한 도구가 있는지 확인할 수도 있었겠지만,

00:06:38더 이상 Adobe 구독을 하지 않아서 조사하는 데 시간이 꽤 걸렸을 겁니다. 결국엔

00:06:43미심쩍은 웹사이트에 올리게 됐을지도 모르죠. 하지만 AI가 있다면 다릅니다. 물론 에이전트를 써서

00:06:49작은 변환/압축 도구 코드를 뚝딱 만들어낼 수도 있었을 것이고,

00:06:55그것도 아마 잘 작동했겠지만 저는 Py 에이전트를 실행했습니다.

00:07:01그리고 그냥 이 PDF 파일을 살펴보고 품질은 최대한 유지하면서

00:07:07압축해 달라고 요청했습니다. 그게 전부였습니다. 그게 제 유일한 프롬프트였죠.

00:07:13그러자 에이전트가 작업을 시작해서 명령줄에서 일련의 명령어를 실행하고 작은 스크립트들을 돌렸습니다.

00:07:19참고로 저는 이걸 제 시스템에서 실행하고 있지만, 가드레일 확장을 설치해 두었습니다.

00:07:26Py에는 확장을 설치할 수 있는 개념이 있거든요. 그래서 에이전트가

00:07:33제 하드 드라이브를 함부로 지우지 못하게 하는 확장을 설치했습니다. 또한 에이전트가

00:07:36수행하려는 작업을 설명할 때 면밀히 지켜보고 있었습니다. 작업을 맡겼고

00:07:41여러 과정을 거치더니 마침내 완료되었습니다. 결과적으로 성공적이었고,

00:07:46문서를 성공적으로 압축해 용량을 대폭 줄였습니다. 이건 아주 단순한 예시일 수 있고,

00:07:53다른 대안들도 있었을 겁니다. 하지만 제 요점은 에이전트가 터미널의 명령줄에서

00:07:59우리의 프로그램들을 사용해 그 모든 일을 해냈다는 점입니다. 그리고 당연히

00:08:06프로그램이 컴퓨터를 사용하는 것이기에 이는 매우 합리적입니다. 우리가 아는

00:08:11화려한 그래픽 인터페이스와 웹사이트들은 여러분과 저 같은 '인간'을 위해 만들어진 겁니다.

00:08:18그런 것들이 사라지지는 않겠지만, 우리가 지금 하는 작업 중 일부라도 수행할 수 있는

00:08:25작은 유틸리티 AI 에이전트를 시스템에서 돌리고 싶다면, 그들에게 컴퓨터를

00:08:29더 효율적으로 사용할 수 있는 방법을 제공해야 합니다. 왜냐하면 인간을 위해 만들어진

00:08:36그래픽 인터페이스나 앱, 웹사이트는 컴퓨터 프로그램에게는 최적의 방식이 아니기 때문입니다.

00:08:41프로그램은 스크린샷을 찍고, 버튼 위치를 파악하고, 마우스를 옮겨 클릭한 뒤,

00:08:46새 페이지 내용을 보려고 다시 스크린샷을 찍어야 합니다. 그건 너무 비효율적이고 토큰 낭비도 심하며 시간도 오래 걸립니다.

00:08:53그것이 바로 AI 에이전트와 LLM이 등장하기 훨씬 전부터 API라는 개념이 있었던 이유입니다.

00:08:59우리가 웹사이트든 앱이든 프로그램을 작성할 때,

00:09:03다른 프로그램이나 서비스와 상호작용하고 싶다면 과거에도 이미 API를 사용했습니다.

00:09:09인간이 쓰라고 만든 웹사이트를 굳이 스크립트로 억지로 돌리려 하지 않았죠. 그것이 API가 존재하는 이유이며,

00:09:13구글 워크스페이스 CLI 같은 명령줄 프로그램들도 결국 API를 감싸고 있는 것에 불과합니다.

00:09:18하지만 그것이 바로 에이전트가 소비하기에 가장 적합한 형태의 프로그램입니다.

00:09:24에이전트는 예쁜 버튼 같은 것엔 관심이 없으니까요. 에이전트는 일을 처리하기 위해

00:09:31다양한 명령을 호출할 수 있는 단순한 방식을 원합니다. 이것이 바로 지금의 흐름이 타당한 이유입니다.

00:09:37또한 마크다운이 어느 때보다 중요해진 이유이기도 하며, 많은 문서 페이지들이

00:09:43내용을 마크다운으로 쉽게 복사할 수 있는 버튼을 제공하는 이유이기도 합니다.

00:09:49복사해서 여러분이 즐겨 쓰는 LLM이나 채팅 세션, 코딩 도구에 바로 붙여넣을 수 있도록 말이죠.

00:09:56어떤 웹사이트들은 URL 끝에 '.md'를 붙여 기사를 마크다운 형식으로 받을 수 있게 지원하기도 하는데,

00:10:03이는 우리가 특정 서비스와 콘텐츠가 주로 에이전트에 의해 소비되는 미래로 가고 있기 때문입니다.

00:10:10예를 들어 'TanStack Start' 같은 라이브러리나 프레임워크의 문서를 생각해 보세요.

00:10:15요즘 그런 사이트를 구축한다면—물론 어떤 기술 스택을 쓰든 요점은 같습니다만—

00:10:22아마도 코딩 에이전트나 Cursor 같은 도구의 도움을 받을 가능성이 큽니다.

00:10:28만약 에이전트에게 라이브러리 사용법을 알려주기 위해 특정 문서를 가리킨다면,

00:10:32이런 일반 웹사이트를 그대로 보여주고 싶지는 않을 겁니다. 에이전트가 HTML 코드를

00:10:38전부 내려받아 불필요하게 토큰을 낭비하게 하고 싶지 않겠죠. 이것이 바로 CLI 도구들이

00:10:46점점 더 중요해지는 것과 같은 맥락입니다. 우리는 적어도 일부 작업들이

00:10:52AI 에이전트의 도움을 받거나 에이전트에 의해 독점적으로 수행되는 미래로 이동하고 있으니까요.

00:10:58이는 또한 여러분이 만약 인간이 주된 소비자가 아닌 어떤 서비스를 만들고 있다면,

00:11:03미래에 사람들이 에이전트를 통해 여러분의 서비스를 이용할 수 있도록

00:11:09API뿐만 아니라 CLI도 구축하는 것을 강력히 고려해야 한다는 뜻입니다.

00:11:15물론 우리는 아직 아주 초기 단계에 있습니다. 대다수 사람은 아직 에이전트에 관심조차 없죠.

00:11:20AI 에이전트가 얼마나 더 좋아질지, 미래에 어떤 작업들을 처리할 수 있을지 단정하기엔 이릅니다.

00:11:25어쩌면 지금처럼 몇 가지 일은 할 수 있지만 여전히 인간의 감독이 필요한 수준에

00:11:32머물러 있을지도 모릅니다. 하지만 그 상태에서도 에이전트가 수행할 수 있는 작업들이 있고,

00:11:38에이전트가 우리의 서비스나 웹사이트와 쉽게 상호작용할 수 있게 적절한 도구를 제공함으로써

00:11:42그들을 더 유용하고 강력하게 만들 수 있습니다. 이것이 바로 우리가 원점으로 되돌아가는 이유입니다.

00:11:49당연히 그래픽 인터페이스나 웹사이트가 사라진다는 뜻은 아니며,

00:11:54인간이 소비하도록 설계되어 에이전트가 쓸 이유가 없는 앱이나 사이트들은 항상 존재할 겁니다.

00:12:02예를 들어 넷플릭스 같은 것 말이죠. 에이전트가 저에게 어떤 영화의 내용을

00:12:09요약해 주는 게 큰 이점이 있다고 보지는 않습니다. 영화는 제가 직접 보고 싶으니까요.

00:12:14하지만 많은 서비스들, 특히 SaaS 비즈니스나 전문 서비스 분야에서는

00:12:20이것이 확실히 나아가야 할 방향입니다. 분명 초기 단계이긴 하지만

00:12:26여기서 우리가 볼 수 있는 명확한 발전 방향이라고 생각합니다.

00:12:31적어도 그것이 제 의견입니다. 하지만 언제나 그렇듯 여러분의 생각도 궁금합니다. 그러니 공유해 주세요.

00:12:37여러분의 생각은 어떤지, 제가 놓치거나 간과한 부분은 없는지 알려주세요. 그리고

00:12:421~2년 뒤의 CLI 도구 세상은 또 어떤 모습일지 함께 지켜봅시다.

00:12:49일종의 원점으로 되돌아가고 있는 것입니다. 당연히 이것이 그래픽 사용자 인터페이스나

00:12:55웹사이트가 사라진다는 뜻은 아닙니다. 아마도 에이전트가 소비하는 것이 별 의미가 없는,

00:13:01인간이 소비하도록 만들어진 앱이나 웹사이트는 항상 존재할 것입니다. 제 말은,

00:13:07넷플릭스 같은 것 말이죠. 에이전트가 저에게 특정 영화의 내용이 무엇인지

00:13:13설명해 주는 것에서 큰 장점을 느끼지 못합니다. 영화는 직접 보고 싶으니까요. 하지만 많은 서비스, 특히 SaaS

00:13:21비즈니스나 전문 서비스 분야에서는 이것이 확실히 나아가야 할 방향입니다. 제 생각에

00:13:28분명 초기 단계이긴 하지만, 여기서 우리가 볼 수 있는 명확한 발전 방향이라고 봅니다. 적어도

00:13:34그것이 제 의견입니다. 하지만 언제나 그렇듯 여러분의 생각도 알고 싶습니다. 그러니 자유롭게

00:13:39공유해 주세요. 제가 놓치거나 간과한 부분이 있다면 알려주세요. 그리고

00:13:441~2년 뒤의 CLI 도구 세상은 또 어떤 모습일지 함께 지켜봅시다.

Key Takeaway

AI 에이전트 시대에는 인간 중심의 시각적 인터페이스(GUI)보다 AI가 이해하기 쉽고 효율적으로 조작할 수 있는 명령줄 인터페이스(CLI)가 다시금 핵심적인 도구로 급부상하고 있습니다.

Highlights

AI 에이전트가 발전함에 따라 컴퓨팅 환경이 과거의 텍스트 기반 인터페이스(CLI)로 회귀하는 흥미로운 현상이 발생하고 있습니다.

에이전트는 GUI보다 마크다운, JSON, 터미널 명령어와 같은 구조화된 텍스트 데이터를 처리할 때 훨씬 효율적입니다.

구글 워크스페이스 CLI 출시 사례처럼 기업들이 AI 에이전트의 접근성을 높이기 위해 공식 명령줄 도구를 제공하기 시작했습니다.

LLM은 훈련 데이터를 통해 리눅스 명령어 사용법을 이미 숙지하고 있으며, '--help' 기능을 통해 새로운 도구 사용법도 스스로 학습할 수 있습니다.

GUI는 인간을 위한 인터페이스인 반면, CLI와 API는 AI 에이전트가 토큰 낭비 없이 컴퓨터를 제어하기 위한 최적의 방식입니다.

미래의 서비스 제공자들은 인간 사용뿐만 아니라 AI 에이전트의 효율적인 소비를 위해 CLI 구축을 필수적으로 고려해야 합니다.

Timeline

AI 에이전트와 CLI로의 회귀

화자는 AI 에이전트의 등장이 컴퓨팅 역사의 '사용 편의성' 차트에서 다시 원점으로 돌아가는 흥미로운 흐름을 만들고 있다고 설명합니다. 1970년대 텍스트 전용 인터페이스에서 90년대 이후 화려한 GUI로 진화했던 역사가 이제는 에이전트를 위해 다시 CLI와 마크다운 방식으로 회귀하고 있습니다. 이는 단순히 과거로 가는 것이 아니라, AI가 소통하기 가장 편한 언어가 텍스트 기반의 구조화된 데이터이기 때문입니다. 이러한 추세는 'Claude Code'와 같은 도구들의 인기를 통해 증명되고 있습니다. 결과적으로 텍스트 전용 입력 방식이 현대 컴퓨팅 환경에서 다시금 강력한 트렌드로 자리 잡고 있음을 시사합니다.

기업들의 대응과 Google Workspace CLI 사례

기업들이 AI 에이전트의 효율성을 높이기 위해 전용 CLI 도구를 출시하는 구체적인 사례들이 언급됩니다. 특히 구글이 최근 Gmail과 드라이브 등을 명령줄에서 제어할 수 있는 'Google Workspace CLI'를 공식 출시한 점에 주목합니다. 이전에는 개인이 만든 비공식 도구에 의존해야 했지만, 이제 대기업들이 직접 에이전트 친화적인 인터페이스를 제공하기 시작한 것입니다. 화자는 MCP(Model Context Protocol) 서버의 한계를 언급하며, 결국 CLI가 API를 감싸는 형태가 에이전트 서비스 이용의 주류가 될 것이라고 예측합니다. 이는 기업들이 에이전트 경제에 대비하는 중요한 전략적 변화임을 강조합니다.

실제 활용 사례: PyCoding 에이전트와 PDF 압축

화자는 'PyCoding' 에이전트를 사용하여 개인적인 PDF 압축 문제를 해결한 경험을 공유합니다. 개인 정보를 보호하기 위해 신뢰할 수 없는 웹사이트에 파일을 올리는 대신, 에이전트에게 CLI 도구를 사용하여 압축해 달라고 요청한 사례입니다. 에이전트는 프롬프트를 이해하고 시스템 내부에서 일련의 스크립트와 리눅스 명령어를 실행하여 성공적으로 용량을 줄였습니다. 이때 가드레일 확장을 통해 시스템 보안을 유지하며 작업을 수행했다는 점이 중요한 포인트입니다. 이 사례를 통해 복잡한 GUI 도구 없이도 에이전트가 CLI를 통해 얼마나 강력한 유틸리티 역할을 수행할 수 있는지 보여줍니다.

GUI의 한계와 AI 에이전트의 효율성

인간을 위해 설계된 GUI가 왜 AI 에이전트에게는 비효율적인지 기술적인 관점에서 분석합니다. 에이전트가 GUI를 사용하려면 스크린샷을 찍고 버튼 위치를 파악하며 클릭하는 과정을 반복해야 하는데, 이는 시간과 토큰 소모가 매우 큽니다. 반면 CLI는 에이전트가 직접 명령을 호출할 수 있어 훨씬 빠르고 경제적이며 정확한 결과를 도출합니다. 최근 웹사이트들이 문서 내용을 마크다운(.md) 형식으로 제공하기 시작한 것도 이러한 에이전트의 소비 방식을 지원하기 위함입니다. 결국 프로그램이 컴퓨터를 사용하는 시대에는 그들에 최적화된 통로가 필요하다는 논리를 전개합니다.

미래 전망과 서비스 설계의 방향성

마지막으로 화자는 미래의 서비스 개발자들이 AI 에이전트를 고려하여 API뿐만 아니라 CLI도 함께 구축해야 한다고 조언합니다. 넷플릭스처럼 인간이 직접 감각적으로 소비해야 하는 서비스는 GUI가 유지되겠지만, SaaS나 전문적인 서비스 분야는 에이전트 중심의 인터페이스가 필수가 될 것입니다. 비록 지금은 초기 단계이고 대중의 관심이 적을 수 있지만, 발전 방향은 명확하게 에이전트 친화적인 환경으로 향하고 있습니다. 화자는 1~2년 뒤의 CLI 생태계가 어떻게 변화할지 기대감을 표하며 시청자들의 의견을 묻습니다. 결론적으로 AI와 인간이 각기 다른 방식으로 컴퓨터와 상호작용하는 공존의 시대를 전망하며 마무리합니다.

Community Posts

AI 에이전트의 귀환: 왜 다시 GUI를 버리고 CLI를 선택하는가

makedream6 मार्च 20267990

Write about this video