2026년 사용한 모든 AI 툴 순위 매기기 (진짜 쓸만한 건?)

CChase AI
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:002026년에는 AI 도구가 너무 많아져서
00:00:05어떤 것이 시간과 돈을 투자할 가치가 있는지 알아내기란 불가능해졌습니다. 그래서 딱히 할 일도 없기에,
00:00:10지난 몇 달간 수많은 도구를 테스트해 봤습니다. 오늘 그 도구들을 전부 순위 매겨 보려고 합니다.
00:00:15기본적인 챗봇부터 본격적인 코딩 에이전트까지
00:00:20그 사이의 모든 것을 다룰 겁니다. 이 영상이 끝날 때쯤이면 무엇에 집중해야 할지 알게 되실 겁니다.
00:00:27표준 티어 리스트 형식을 사용해 순위를 매길 겁니다. S 티어가 최고,
00:00:32D 티어가 최악이며, 모든 도구는 기능별로 분류될 겁니다.
00:00:36이제 특정 도구를 평가할 때는 두 가지 관점에서 볼 겁니다. 하나는
00:00:42같은 부류의 다른 도구들과 비교했을 때 어떤가 하는 점입니다. 예를 들어 N8N은 다른 노코드 자동화
00:00:49도구인 Make나 Zapier와 비교해서 어떤지 보는 거죠. 하지만 거시적인 관점에서도 살펴볼 겁니다. 왜냐하면
00:00:56노코드 자동화 같은 분야에서 최고라 하더라도, 그게 자동으로 S 티어라는 뜻은
00:01:00아니기 때문이죠. 자기 카테고리에서 1등을 했다고 다가 아닙니다. 왜냐하면 이 모든 것은
00:01:05서로 연관되어 있기 때문이죠. 이 도구들은 서로 상호작용합니다. 6개월 전엔 좋았던 도구가 오늘날엔
00:01:11문제가 있을 수도 있고요. 그러니 제가 여러분이 좋아하는 도구를 D 티어에 넣더라도 댓글로
00:01:14제 주관적이고 매우 모호한 평가 기준을 얼마나 싫어하는지 알려주세요. 다음번에 꼭 참고하겠습니다.
00:01:20그럼 챗봇부터 시작해 보죠. 첫 번째로 순위를 매길 도구는 ChatGPT입니다.
00:01:26많은 사람이 처음 시작한 곳이 여기죠. 수치상으로는 여전히 대부분 사람이 이곳에 머물러 있습니다.
00:01:31거시적인 관점에서 볼 때 ChatGPT는 분명 제 순위에서 올라가고 있습니다. 왜냐하면 모델들이
00:01:35정말 탄탄하기 때문이죠. 5.4 모델은 훌륭합니다. 하지만 챗봇 자체에 대해 이야기하자면,
00:01:40그냥 평범하다는 느낌만 듭니다. 가장 무난한 챗봇이 되어 버렸죠.
00:01:47결과물이 싫지도 않고, 그렇다고 너무 좋지도 않습니다. 안타깝게도,
00:01:51프롬프팅을 잘 못 하면 매우 일반적인 답변만 받게 되죠. 우리 모두 이제는
00:01:56ChatGPT 특유의 말투를 알아볼 수 있습니다. 하지만 한 달에 20달러면 꽤 많은 것을 얻을 수 있고,
00:02:00이미지 생성 같은 부가 기능도 몇 가지 있습니다. 새로운 이미지 생성 모델은 정말 뛰어납니다.
00:02:04이미지 생성 이야기가 나왔으니 다른 챗봇에 대해서도 이야기해 보죠. 바로 Gemini입니다.
00:02:10Gemini는 시작하자마자 말씀드리죠, A 티어입니다. 만약 한 달에 20달러를
00:02:15AI 챗봇에 쓰기로 마음먹고 일상적인 도구를 찾는 사람이라면 Gemini가 단연코
00:02:21최고의 선택입니다. 그런 면에서 Claude보다 낫다고 봅니다. 그게 무슨 뜻이냐고요?
00:02:25일반 사용자로서 충분한 활용도를 얻을 수 있다는 뜻입니다. 게다가 Gemini는 이미지 생성 기능도
00:02:31제공하고, 나노 바나나 프로는 동급 최고입니다. 비디오 생성도 가능하고요. 무엇보다 중요한 건,
00:02:36다른 어떤 챗봇 모델보다 비디오 자체를 다루는 능력이 탁월하다는 점입니다. Gemini에 유튜브 영상을 주고,
00:02:42숏폼 영상, 릴스, 틱톡 등 무엇이든 주면 실제로 분석할 수 있습니다. 다른 도구들은
00:02:46그 부분에서 정말 고전하거나 아예 못하죠. 자, 순수하게 3.1 모델이
00:02:505.4나 곧 다룰 Opus보다 나은가? 아니요. 하지만 종합적으로 봤을 때,
00:02:55월 20달러를 내는 일상적인 사용자라면 Gemini를 써야 합니다. 그리고 Anthropic이 있네요. Claude는 어디에 둘까요?
00:03:00이건 좀 어렵네요. Claude와 Opus 4.7에 대해 이야기하자면, Opus 4.7은 현재
00:03:08게임 체인저이자 최고의 모델이라고 생각합니다. 제 생각엔 Anthropic이
00:03:123대 주요 기업 중 최고입니다. 하지만 챗봇 기능만 놓고 보고 20달러
00:03:18플랜을 사용 중이라면, C 티어라고 주장할 수 있습니다. 철저히 사용량 제한 문제 때문이죠. 만약 20달러
00:03:26플랜을 쓰면서 Opus로 실제 프로젝트를 진행하거나 무엇인가를
00:03:31생성하려고 한다면, 금방 한계에 부딪히고 스스로에게 물을 겁니다. 내가 뭘 하고 있는 거지?
00:03:35왜냐하면 20달러면 95% 수준의 결과물을 내주는 다른 모델을
00:03:41수백만 번 사용할 수 있으니까요. 반면에 Anthropic은 100달러나 200달러 플랜이
00:03:45아니면 사용량을 매우 엄격하게 제한합니다. 게다가 Sauna나 Opus 같은 경우,
00:03:50텍스트와 코드, 아티팩트만 다룰 수 있습니다. 이미지나 비디오는 안 되죠. 그냥 텍스트뿐입니다.
00:03:58그러니 챗봇만 사용하는 일반적인 AI 사용자라면 저는 C 티어라고 생각합니다.
00:04:05하지만 100달러나 200달러 플랜을 쓰고 있다면 S 티어입니다. 비디오나 이미지 작업을
00:04:14하려는 게 아니라면 말이죠. 그러니 Claude는 사용 사례와 사용량에 매우 의존적입니다.
00:04:20길가다 들른 일반적인 사람이 AI에 월 20달러를 쓴다면 C 티어입니다.
00:04:25하지만 진지하게 이 분야를 파고 있고 100달러나 200달러 플랜을 쓴다면 S 티어죠.
00:04:31그리고 Grok이 있죠. Grok은 어디에 둘까요? 코딩 작업은 다른 것들보다 못합니다.
00:04:37이미지 모델도 ChatGPT나 Gemini보다 훨씬 떨어집니다. 비디오 모델도 Gemini보다 못하고요.
00:04:44정말로 가진 장점은 규제가 적고 현시점에 세상에서 무슨 일이 일어나고 있는지
00:04:50파악하는 데는 꽤 괜찮다는 점입니다.
00:04:55트위터 뇌를 가진 사람들에게는 아마 B+ 티어 정도 되겠네요. 하지만
00:05:00일반 사용자에게는 솔직히 C 티어입니다. 그리고 사람들이 뭐 비디오 처리에
00:05:06뛰어나다고 말하는 걸 들어보면, 트위터 게시물을 넣으면 무슨 일인지 알 수 있다 정도죠. 다시 말하지만,
00:05:10트위터 기능에만 과도하게 집중한다면 A 티어일지도 모르죠. 일반 사용자에게는 잘해야 C 티어입니다. 트위터에 하루
00:05:174시간씩 상주하지 않는 사람에게는 절대 추천하지 않을 겁니다. 코딩 에이전트 순위를
00:05:21매기기 전에 Claude 코드 마스터클래스를 잠시 홍보하고 싶네요.
00:05:26지난달에 출시되었는데, 기술적 배경지식이 없는 분들이 제로에서 AI 개발자로 성장하는
00:05:31최고의 방법입니다. 매주 업데이트하고 있고 최근에는
00:05:35Claude 코드로 구동되는 에이전트 OS를 구축하고 메모리용 Obsidian이나
00:05:42Google Suite와 연결할 수 있는 GWS 같은 도구를 통합하는 데 집중하고 있습니다. 관심 있으신 분들은
00:05:48Chase AI Plus에서 찾아보실 수 있으며 고정 댓글에 링크가 있을 겁니다. 챗봇은 이쯤 하고요.
00:05:52이제 코딩 에이전트나 Codex, Claude 코드와 같은 코딩 하네스에 대해 이야기해 보죠.
00:05:57Claude 코드를 첫 번째로 다루겠습니다. 저에게 Claude 코드는 S 티어입니다.
00:06:03하지만 이전과 같은 종류의 논의가 필요하죠. 사용량 측면에서 무엇을 의미할까요?
00:06:1020달러 플랜을 가지고 Claude 코드에서 무언가를 얻을 수 있다고 생각한다면
00:06:15크나큰 착각입니다. 여기서는 S 티어를 유지할 건데, Claude 코드를 사용하면서
00:06:19개발에 진지하게 임한다면 최소 100달러나 200달러 플랜을 사용할 것이기 때문이죠.
00:06:24사용량 문제에 대해 앉아서 불평할 수는 있습니다.
00:06:29하지만 업계 표준이 된 데에는 이유가 있습니다.
00:06:33좋기 때문이죠. 그리고 100달러나 200달러 가격대에서도
00:06:38Opus 4.7 같은 API를 직접 사용할 때 발생하는 토큰 비용보다 90% 정도 절감된 비용으로
00:06:44사용할 수 있다는 점을 기억하세요. 자, Claude 코드가 너프되었다고,
00:06:50Opus 4.6이 너프되었다고, 4.7에 문제가 있다고 말하는 열성적인 그룹이 있는 건 사실입니다. 네.
00:06:55하지만 그건 도구의 인기와 관련된 온라인 담론의 현실일 뿐,
00:07:02Claude 코드를 너프하려는 비밀 음모보다는 사용자의 기술적인 문제인 경우가 더 많습니다.
00:07:08하지만 Claude 코드가 S 티어라고 해서 유일한 도구는 아닙니다.
00:07:12Anthropic이 내리막길이라고 생각하거나 Opus 4.6, 4.7 릴리스가 수준 이하였다고 생각한다면
00:07:19선택지가 있죠. 바로 OpenAI의 Codex인데, ChatGPT 제작사가 만든 Claude 코드의 버전입니다.
00:07:26당장 말씀드리자면 이것도 S 티어입니다. 그리고
00:07:31Claude 코드보다 몇 가지 확실한 장점이 있습니다. 가장 큰 건 사용량입니다. Claude 코드보다
00:07:38Codex에서 훨씬 더 많은 토큰을 얻을 수 있습니다. 게다가 OpenAI의 모델들은 훌륭합니다.
00:07:45Opus 4.6이나 4.7로 하는 일은 GPT 5.4로도 할 수 있습니다. 물론 아주 극단적인 복잡성까지는
00:07:52이야기가 다를 수 있지만, 서로 장단점이 있죠.
00:07:56수많은 사람이 OpenAI 모델을 선호하겠지만 99%의 사람들에게는
00:08:02큰 차이가 없을 겁니다. 그러니 Claude 코드를 써야 할지 Codex를 써야 할지 물으신다면
00:08:07그냥 개인 취향에 맞는 걸 고르라고 하고 싶네요. 그럼 하네스 겸 IDE 같은
00:08:12역할을 하는 Anti-Gravity는 어떨까요? 이 공간에 여전히 머물러 있긴 한데,
00:08:18어디에 둘까요? 얼마 전까지만 해도 저는 S 티어에 두고 코딩 에이전트의 3대장 중 하나라고 했을 겁니다.
00:08:21하지만 요즘은 A 티어에 둘 것 같네요. 사실
00:08:27Anti-Gravity를 Gemini 3.1 같은 다른 Google 모델과 함께 사용할 때는
00:08:32Opus를 사용하는 Claude 코드나 5.4를 사용하는 Codex만큼 좋지 않습니다. 차라리 그 모델들에는
00:08:39Anti-Gravity를 쓰는 게 더 낫겠지만, 애초에 왜
00:08:44Anti-Gravity 셸을 쓰겠습니까? Claude 코드나 원래 설계된 모델들을 가진 OpenAI를 쓰는 게 낫죠.
00:08:49게다가 요즘은 Anti-Gravity 사용량에 대해서도 불만 섞인 목소리가 나오기 시작했습니다.
00:08:52처음 나왔을 때는 평생 무료처럼 사용할 수 있게 해줬었죠. 다음으로 다룰 도구는
00:08:58코딩 에이전트나 하네스는 아니지만 종종 같이 언급되니 포함하겠습니다.
00:09:03OpenClaw입니다. 저는 과거에도 OpenClaw에 대한 불호를 꽤
00:09:07분명히 밝혀왔고, 솔직히 그 생각은 변함없습니다. C 티어, 심지어 D 티어라고 생각합니다.
00:09:12OpenClaw는 공연예술에 가깝습니다. OpenClaw를 사용할 때는 대시보드도 있고, 무언가 연결되고,
00:09:18하트비트가 있고 대화도 하니까 마치 뭔가 대단한 일이 벌어지는 것 같습니다.
00:09:23움직임은 많은데 실질적인 전진은 없습니다.
00:09:28무언가를 하고 있다는 느낌을 주니 많은 사람에겐 그것만으로 충분할지 모르지만
00:09:32사실 넉 달, 석 달이 지났고 3년이 지난 뒤에도 여전히 그럴 겁니다.
00:09:39저는 누군가가 와서 내게 OpenClaw만의 사용 사례를 알려주길 기다리고 있습니다.
00:09:44Claude 코드나 Codex로는 할 수 없거나, 더 효율적으로 처리할 수 없는 사례 말이죠.
00:09:52아침 보고나 브리핑 같은 걸 말씀하신다면 채널에서 추방하겠습니다.
00:09:57OpenClaw의 낮은 순위는 Anthropic이 OpenClaw 안에서 Max 구독을
00:10:02사용할 수 없다고 발표한 이후 더욱 분명해졌습니다.
00:10:10즉 Opus 4.7 같은 것을 위해 API 비용을 지불해야 한다는 뜻이죠. 오늘 마침 Caveat이 나왔는데
00:10:16OpenClaw 문서에 Anthropic 직원과 이야기해 보니 괜찮아졌다고 적혀 있더군요.
00:10:21글쎄요, 문서에 한 줄 적어놓은 것보다 더 많은 증거가 필요해 보입니다.
00:10:28그러니 그게 확정되기 전까지는 OpenClaw가 Claude 코드의 대체제라고
00:10:36생각하는 건 미친 짓입니다. 둘이 같은 건 아니라는 건 알지만, 여전히 사람들은 다른 것보다
00:10:40이걸 쓰거나 내 OpenClaw가 무언가를 처리하기 위해 Claude 코드를 호출한다고 말하죠.
00:10:46왜 그러죠? 그냥 직접 Claude 코드를 호출하면 되지 않나요? 논의를 이쯤에서
00:10:52마무리할까 합니다. OpenClaw나 Hermes도 비슷한 상황입니다. Hermes는
00:10:59좀 더 낫다고 생각하지만, 확실하게 C 티어에 두겠습니다. 이것들은 생산성 연극일 뿐입니다.
00:11:06뭔가 많이 하는 것처럼 느껴지지만 실제 코딩 에이전트 내에서 다 할 수 있는 것들입니다.
00:11:12Hermes는 스스로 기술을 업데이트하는 영리한 부분들이 있긴 합니다.
00:11:18하지만 스스로 기술을 업데이트한다는 것 자체가 무언가 좋은 일이 일어나고 있다는 환상에
00:11:25가깝습니다. 15번의 도구 호출마다 기술을 검토하고 다시 작성한다는데,
00:11:29정말 그럴 필요가 있을까요? 어떻게 그 새로운 기술이 실제로 작동한다고 판단하는 거죠?
00:11:36차라리 Claude 코드를 사용하여 제가 정기적으로 사용하는 기술을 보거나,
00:11:40실제로 결과물을 보고 직접 판단하는 게 낫지 않을까요? 이런
00:11:46종류의 도구들, 예컨대 Paperclip 같은 것들도 넣어볼 수 있겠네요. 많은 일이 벌어지는 것 같지만 아무것도 안 일어납니다.
00:11:53OpenCode 같은 인기 있는 코딩 하네스를 다루지 않는 이유를 눈치채셨을 겁니다.
00:11:58사실 제가 많이 사용해 보지 않아서 똑똑하게 이야기할 수 없다고 느끼기 때문입니다.
00:12:01이건 오픈 소스 모델 쪽의 논의로 이어지는 부분이라고 생각합니다.
00:12:08오픈 소스, 오픈 모델 경로에 깊숙이 들어가 있다면 무엇을 하고 있는지
00:12:15이미 알고 계실 겁니다. 일반인은 그런 도구를 건드리지도 않고, 수준급으로
00:12:21처리할 하드웨어도 없으니까요.
00:12:25OpenCode나 Pi에 대해서는 좋은 소식만 들었으니 좋아하신다면 계속 사용하세요.
00:12:29이제 Lovable이나 N8N 같은 노코드 빌더들로 넘어가 보죠. N8N과 Lovable은 서로
00:12:36성격이 다르긴 하지만 모두 하나의 우산 아래에서 평가해 보겠습니다.
00:12:40첫 번째는 Lovable입니다. 만약 9개월 전쯤 제게 물었다면,
00:12:48Lovable을 S 티어에 두었을 겁니다. 나왔을 때 정말 좋아했었죠.
00:12:56그 당시 Sonnet 3.5나 Opus 3의 기반을 가져와
00:13:02멋진 프론트엔드 디자인을 제공하도록 튜닝했기 때문입니다. 비싸긴 했지만
00:13:08미친 수준은 아니었죠. 지금의 Lovable은... 글쎄요, 무슨 의미가 있을까요?
00:13:16Lovable이 1~2년 뒤에도 존재할까요? 언제 누군가에게 Lovable을 추천하시겠습니까?
00:13:27Codex가 있고, Claude 코드가 있고, 심지어 일반 챗봇들도 존재하는데,
00:13:33원클릭 Superbase 설정이나 원클릭 배포를 위해 미친듯한 프리미엄을
00:13:40지불하는 건... 다른 시스템들이 너무 좋아졌습니다. 특히 Claude 코드가 말이죠.
00:13:47Lovable이 만드는 것만큼 좋은 프론트엔드 디자인을 만들어내니,
00:13:52편의성을 위해 얼마까지 지불하시겠습니까? 한 달에 편의성만을 위해
00:13:57지불하는 비용이 너무나 과합니다.
00:14:01실제 앱을 만들 때는 어떤 도구를 쓰든 기술적인 복잡성이나
00:14:06장벽을 마주하게 됩니다. 그걸 해결할 수 있다면
00:14:11Anti-Gravity로도 할 수 있겠죠. Lovable이 나쁜 제품은 결코 아니지만,
00:14:17경쟁자와 전체적인 생태계와 비교해 보면 존재 가치를 정당화하기 힘듭니다.
00:14:23요즘 누가 Lovable을 추천할까요? 저는 확실히 아닙니다. Bolt도 마찬가지입니다.
00:14:29시점상 Bolt도 Lovable의 다른 버전에 불과합니다. Bolt가 처음에 나왔을 때
00:14:33정말 신기했었죠. 앱을 처음부터 끝까지 만든다고? 그리고
00:14:381년 반 정도 지난 지금 저는 D 티어라고 생각합니다. 죽어가는 시장이죠.
00:14:43Replit 같은 것들은 사용해보지 않아서 좋은 대답을 드리긴 어렵지만,
00:14:49앞으로의 방향성을 본다면,
00:14:53결국 Claude 코드나 Codex, Anti-Gravity와 경쟁해야 할 텐데,
00:14:59그런 도구들은 계속해서 더 사용자 친화적으로 변할 겁니다.
00:15:05Co-work 같은 도구를 보세요. 더 사용하기 쉬워질 겁니다.
00:15:11지금 시대정신은 Claude입니다. Replit이나 Base 44, Bolt, Lovable이
00:15:17장기적으로 승산이 있을까요? 좋아 보이진 않습니다. Cursor는 흥미로운데,
00:15:22Claude 코드나 Codex와 조합해서 쓸 수 있기 때문이죠. 저도 오랫동안 그렇게
00:15:27사용했습니다. Cursor를 IDE로, 즉 VS Code의 강화판으로 쓰고 Claude 코드를
00:15:34사용했었죠. Claude 코드가 99%의 작업을 수행하고, 교차 검증을 하고 싶으면
00:15:39Cursor 내에서 GPT 5.4가 Claude 코드가 한 작업을 직접 확인하게 하는 식이었습니다.
00:15:46쉽게 사용할 수 있는 제2의 눈이었죠.
00:15:52요즘은 그게 필요할까요? 일단 필요 없습니다. 왜냐하면 Claude 코드 내에서
00:16:02Codex를 사용할 수 있는 플러그인이 있어서 대립적인 코드 리뷰를 할 수 있으니까요.
00:16:08Composer 2.0이 좋은지 물으신다면, 아마 취향에 따라 A 티어일 수도 있겠네요.
00:16:15Anti-Gravity와 비슷한 공간에 있다고 볼 수 있겠죠.
00:16:21하지만 요즘 저에게는 B 티어입니다. 제품이 나쁜 건 절대 아닙니다.
00:16:25Cursor를 쓰지 말라는 게 아닙니다. 좋은 제품이에요. 그냥
00:16:30누가 Cursor의 고객인지, 왜 다른 도구 대신 Cursor를 선택하는지 의문일 뿐이죠.
00:16:37Lovable 문제와도 한 끗 차이라고 생각합니다. 이전 섹션에서 다뤘어야 했는데,
00:16:41Gemini CLI는 어떤가요? 구글 직원이 아닌 사람 중에 Gemini CLI를 쓰는 10명만 대보세요.
00:16:47아무도 없겠죠. 논의에서 완전히 배제되어 있다는 건
00:16:55실제로 쓰는 사람이 없다는 뜻이고, 아마 그럴 만한 이유가 있겠죠.
00:16:59구글 직원이 아닌 사람 중 Gemini CLI를 사용한다고 말하는 사람을 한 명도
00:17:04알지 못합니다. 그게 많은 걸 말해준다고 생각합니다. N8N은 어떤가요? 한때 정말 열광했었는데,
00:17:11오랫동안 S 티어였습니다. 요즘 N8N은
00:17:18코딩 없이 AI 에이전트와 자동화를 만드는 도구에서 매우
00:17:26틈새시장을 노리는 도구가 되었습니다. 솔직히 말해서 N8N이 할 수 있는 모든 건 Claude 코드가 할 수 있고,
00:17:33Codex도 할 수 있습니다. 모든 걸 더 잘 처리하는데,
00:17:40존재 이유를 증명할 아주 설득력 있는 차별점, 즉 사용 편의성이나 비용, 틈새 기능 등이 있어야 하죠.
00:17:48N8N은 여전히 틈새 기능과 사용 편의성이 있습니다.
00:17:55요즘 저는 클라이언트 프로젝트가 아주 기술적이지 않은 팀이라서,
00:18:01어떤 이유로든 직접 손을 대야 할 필요가 있을 때만 N8N을 사용합니다.
00:18:06자동화 내부에 들어가서 한두 가지를 조정해야 할 때 N8N은 아주 쉽죠.
00:18:11비주얼 설정은 훌륭합니다. 하지만 사용 편의성이라는 차별점이
00:18:19Claude 코드보다 훨씬 빠르냐 하면 그건 아닙니다. Claude 코드 안에서
00:18:27N8N 자동화를 구현하는 게 더 빠를 정도니까요. 그게
00:18:32장기적 생존에 문제입니다. 노코드 AI 공간에서 아주
00:18:39흔했던 도구가 이제는 특정 이유로 필요할 때만 쓰는 도구가 되었습니다.
00:18:45제품 자체는 그대로 잘 작동하지만, N8N의
00:18:50직접적인 경쟁자인 Make나 Zapier는 D 티어입니다. 더 비싸고 유연성도 떨어지는데 왜 쓰겠습니까?
00:19:00차별점이 없다면 도태될 뿐입니다. legacy 이유를 제외하고 왜 쓰는지 모르겠군요. 이제 뒤처진 것들을
00:19:04이제 그만 넘어가죠. 대체 왜 지금 시점에 메이크나 재피어를 쓰는지 모르겠네요. 레거시 때문이 아니라면 말이죠.
00:19:09자, 그럼 이제 남은 것들을 다뤄보죠. 노트북 LM은 어디에 속할까요? 그건 그냥 틈새 AI 도구 같은 거예요.
00:19:15코딩 에이전트도 아니고, 노코드 도구라고 하기도 애매하죠. 물론 그렇게 주장할 수도 있긴 합니다.
00:19:20왜냐면 프롬프트와 컨텍스트를 주면 결과물을 만들어내니까요. 그런 의미에서는,
00:19:25뭐 그렇다고 볼 수 있겠네요. 그래도 노트북 LM은 정말 놀랍고, 단발성 AI 도구로서는 단연 S급입니다.
00:19:33노트북 LM은 최고예요. 솔직히 말해서 구글 제품 중 최고라고 생각합니다.
00:19:38클로드 코드나, 뭐 반중력(anti-gravity) 같은 거랑 연동해서 쓸 수 있다는 사실도 그렇고요.
00:19:43노트북 LM 파이 CLI 같은 것들을 활용하면 생산성이 정말 엄청나게 향상되거든요.
00:19:50게다가 구글은 이걸 거의 무료로 풀고 있는데, 정말 대단하죠. 수준 높은 결과물도 만들 수 있고요.
00:19:55슬라이드 덱이나 인포그래픽 같은 것들 말이죠. 제 생각에 유튜브 영상을 많이 다루는 연구에는 이보다 좋은 도구가 없습니다.
00:20:01그래서 저도 클로드 코드와 노트북 LM을 결합하는 콘텐츠를 많이 만들었죠.
00:20:07정말 훌륭한 이유가 있어서죠. 노트북 LM은 대단하고, 또 무료니까요. 그리고 하나 더 안 다룬 게 있는데,
00:20:13챗봇 섹션에서 퍼플렉시티 이야기를 했어야 했나 싶네요. 퍼플렉시티는 챗봇이긴 한데, 과연 사람들이
00:20:20퍼플렉시티만 단독 챗봇으로 쓸까요? 글쎄요, 요즘 퍼플렉시티에 대한 주장은,
00:20:26다른 챗봇들을 모아서 쓸 수 있게 해주는 챗봇이라는 점이죠. 한동안 제게는 S급이었습니다.
00:20:34그런데 다른 많은 도구들처럼 요즘은 힘이 빠지기 시작했어요. 저는 퍼플렉시티를 C급 정도로 봅니다.
00:20:40그건 아마 제가 퍼플렉시티의 주변 도구들을 잘 안 써서 그럴지도 모르겠네요. 예를 들면,
00:20:47컴퓨터(Computer)나 코멧(Comet) 같은 브라우저요. 그래서 저는 퍼플렉시티를 정말 제한적으로만 씁니다.
00:20:53프로 플랜을 구독 중인데, 제가 이걸 쓰는 건 오직 이거 하나예요. 바로 오늘 일어난 일에 대해
00:20:58정보를 얻고 싶을 때죠. 출처도 필요하고요. 클로드나 챗GPT한테 매번 웹 검색을 하라고 일일이 시키기 귀찮으니까요.
00:21:03그걸 다 해달라고 말하는 게 번거롭잖아요. 그래서 일종의,
00:21:10그록(Grok)을 강화한 버전 같은 느낌이죠. 웹 데이터를 가져오는 데 최적화되어 있고,
00:21:16본래 그런 용도로 만들어졌으니까요. 하지만 데일리 드라이버로 쓸 수 있을까요? 아니죠. 다른 도구들에 추가로 매달 20달러를 더 낼 가치가 있을까요?
00:21:22아니요. 있으면 좋은 정도, 딱 그 정도입니다. 마지막 카테고리로 넘어가서,
00:21:28콘텐츠 생성 도구들, 그러니까 이미지 생성기나 영상 생성기 같은 것들에 대해 이야기해보죠. 자,
00:21:33첫 번째는 최근에 나온 '클로드 디자인'입니다. 진공 상태에서 평가하자면 이건
00:21:42S급입니다. 정말 사랑하는 도구예요. 지난 며칠 동안 정말 많이 썼거든요. 기본적인 클로드 코드보다도 훨씬 뛰어나고,
00:21:49시중에 나와 있는 대부분의 도구들보다도 한참 앞서 있어요.
00:21:55프론트엔드 디자인 기능이나 UI/UX 프로 기능은 비교도 안 될 정도로 압도적이죠.
00:22:00처음부터 시각적인 요소들을 굉장히 빠르게
00:22:05반복해서 수정할 수 있게 해주니까요. 하지만, 문제가 하나 있습니다. 사용량 제한이 살면서 본 것 중에 최악이에요.
00:22:12토큰이 말도 안 되는 속도로 소모됩니다. 한 달에 200달러를 내는데도 추가 사용량을 안 줘요.
00:22:18왜 프로 플랜 사용자와 같은 제한을 받는 건지 이해가 안 갑니다. 그리고 뭐가 토큰을 그렇게 잡아먹는지도 전혀 불투명해요.
00:22:23나름 실험을 좀 해보고 나서야 깨달았죠.
00:22:26디자인 시스템을 만들면 토큰의 30%가 날아가고, 간단한 랜딩 페이지를 하나 요청해도
00:22:32토큰의 한 5% 정도가 사라집니다. 사용량이 정말 혹독하죠. 진공 상태에선 S급인데, 사용량 때문에 D급입니다.
00:22:39결국 B급 정도가 적당할 것 같네요. 중간 정도로 타협하죠. 정말 좋은 도구이긴 한데,
00:22:50사용량 문제만 해결되면 최고의 제품이 될 거예요. 하지만 지금은 일반 사용자가 쓰기엔 좀 무리가 있습니다.
00:22:55벌써 추가 사용량을 다 쓰고 있거든요. 아, 맞다. 코파일럿 언급을 안 할 뻔했네요.
00:23:00코파일럿은 아예 잊고 있었어요. 아마 그게 정답일 겁니다. 코파일럿은
00:23:06어쩔 수 없이 강제로 써야 할 때나 쓰는 거죠. 굳이 이걸 따로 쓰는 사람은 아무도 없어요. 가끔 괜찮다는 의견도 있긴 하지만,
00:23:11기업 차원에서 통합되어 있으니까요. 음, C 마이너스 급입니다.
00:23:21제가 존재 자체를 잊고 있었다는 사실이 이미 많은 걸 말해주죠. 자, 다음은 클링(Cling)입니다.
00:23:263.0 버전인데요. 혹시 모르는 분들을 위해 말하자면, 이건 영상 모델이고 아주 탄탄한 A급입니다. 정말 훌륭해요.
00:23:33직접적인 경쟁자는 비오(Veo) 3, 아니 요즘은 3.1 버전이 있죠. 그건 B급으로 칩니다. 이젠 좀 구식이 된 느낌이고
00:23:40무엇보다 비용이 너무 비싸요. 그리고,
00:23:47시드 댄스(Seed Dance) 2.0이 있습니다. 최근에 AI 영상을 조금이라도 보셨다면 그게 다 시드 댄스였을 거예요. 한 달 전쯤에
00:23:53베타 버전이 나오면서 모든 것들, 배우들이나
00:23:59영화 장면들을 똑같이 재현해내던 그 영상들, 그게 다 시드 댄스였죠. 정말 훌륭합니다. 비오나 클링보다 한 단계 위예요.
00:24:04시각적인 표현력이 정말 끝내줍니다. 놀라울 정도예요. 비교적 가격도 그렇게 비싸지 않고요.
00:24:11자, 이제 이미지 모델을 보죠. 나노 바나나 프로는 S급입니다. 한동안 동급 최강이었죠.
00:24:20그리고 챗GPT에 새로 나온 이미지 젠 2(Image Gen 2)도 있죠. 제가 조금 만져본 바로는
00:24:28S급이 될 것 같긴 한데, 충분히 써보질 않아서 아직 판단하기 어렵네요. 예외적인 상황들도 좀 더 확인해야 하고요.
00:24:34그러니까 이건 뭐랄까, 이걸 긍정적으로 보면 S급이라고 할 수 있겠네요.
00:24:42하지만 신중하게 지켜보고 싶다면 일단 A급 정도가 적당할 것 같습니다. 일단은 A급으로 두죠.
00:24:49나중에 어떻게 될지 보죠. 어쨌든 훌륭한 이미지 모델은 챗GPT에 큰 힘이 됩니다. 왜냐하면
00:24:56수많은 사람들이 이미지 생성을 사용하기 때문이죠. 제미나이가
00:25:01챗GPT 대비 항상 앞서 있던 점이 바로 우월한 이미지 모델이었거든요. 자, 정리는 이 정도로 하죠. 이 내용이
00:25:09여러분이 무엇에 집중해야 할지, 시간 낭비는 무엇인지 파악하는 데 도움이 되었으면 합니다.
00:25:15아예 처음 들어보는 새로운 AI 도구들을 알게 되어 한번 써보고 싶은 마음도 드셨길 바랍니다.
00:25:20메이저 도구들은 크게 놀랍지 않죠. 클로드 코드나 코덱스가 오랫동안 지배해왔으니까요.
00:25:24하지만 무엇보다 중요한 건, C급 이하의 도구들은 멀리하라는 겁니다. 우리가 이야기했던 것처럼,
00:25:30클로드의 챗봇 같은 예외적인 경우를 제외하면요. 너무 깊게 빠져들다 보면
00:25:36돈만 엄청나게 날릴 수 있습니다. 특히 헤르메스나 오픈
00:25:40클로드 같은 것들은 말할 것도 없고요. 러버블(lovable) 같은 도구도 마찬가지고요. 여러분의 시간은 성과를 가져다줄 A급, S급 도구들에 투자하세요.
00:25:47클로드 코드, 코덱스, 반중력 같은 것들 말이죠. 이런 도구들에
00:25:53능숙해진다면, 그건 여러분이
00:25:59AI로 빌딩하는 근본적인 원리에 통달했기 때문일 겁니다. 그러니 만약 다음 주에 클로드 코드가 갑자기 망하고,
00:26:05코덱스가 사라지고 다른 하니스가 S급으로 떠올라서
00:26:10모두가 그걸 쓰게 된다고 해도, 여러분이 배운 건 다 옮길 수 있는 기술입니다. 특정 플랫폼이나 특정 도구에
00:26:15종속된 게 아니라는 거죠. 여러분은 지금 어떻게 빌딩하는지, 그 방법을 배우고 있는 겁니다.
00:26:20소프트웨어 아키텍처의 근본을 배우고 있는 거니까요. 그게 바로 가장 중요한 핵심이고, 여러분이 지향해야 할 방향입니다.
00:26:25오늘 영상이 도움 됐길 바랍니다. 의견은 언제든 알려주세요. 항상 그렇듯, 제 클로드 코드 마스터클래스를 보고 싶다면
00:26:31체이스 AI 플러스(Chase AI Plus)를 확인해주세요. 다음 영상에서 뵙죠.

Key Takeaway

특정 AI 툴에 종속되지 말고 Claude 코드나 Codex와 같은 하네스를 통해 소프트웨어 빌딩의 근본 원리를 익혀야 장기적인 성과를 낼 수 있다.

Highlights

월 20달러 수준의 일상적인 챗봇 사용자에게는 Gemini가 비디오 분석 및 이미지 생성 기능을 포함한 종합적인 측면에서 최고의 선택이다.

Claude 코드와 OpenAI Codex는 전문적인 개발 프로젝트를 위한 S 티어 코딩 하네스로, 실제 개발 시 100달러나 200달러 플랜 사용이 필수적이다.

Claude 코드는 Opus 4.7 API 직접 사용 대비 토큰 비용을 약 90% 절감한다.

Lovable이나 Bolt 같은 노코드 빌더들은 Claude 코드와 같은 코딩 에이전트의 발전으로 인해 장기적인 생존 경쟁력이 낮아지고 있다.

Notebook LM은 유튜브 영상 분석 및 연구 도구로 최상위 성능을 보여주며, 무료로 사용할 수 있는 고효율 도구다.

OpenClaw나 Hermes와 같은 도구는 실제 생산성 향상보다는 시각적인 퍼포먼스에 치중한 생산성 연극에 가깝다.

Timeline

일상적인 챗봇 및 AI 모델 평가

  • ChatGPT는 모델 성능은 탄탄하나 일상적인 챗봇 기능 측면에서는 평범한 수준에 머물러 있다.
  • Gemini는 비디오 분석 및 고품질 이미지 생성 기능을 제공하여 월 20달러 사용자에게 가장 권장된다.
  • Claude Opus 4.7은 고성능 모델이나 20달러 플랜에서는 엄격한 사용량 제한으로 인해 실무용으로 C 티어에 해당한다.

다양한 챗봇의 사용자 경험을 비교한다. ChatGPT는 범용적인 대화에는 적합하나 특유의 말투가 고착화되어 있다. Gemini는 유튜브 영상 분석 등 비디오 다루는 능력에서 압도적인 우위를 점한다. 반면 Claude는 고성능 모델임에도 불구하고 일반 플랜에서는 사용량 제한 문제가 커서 진지한 프로젝트 수행에는 고가 플랜이 필수적이다.

코딩 에이전트 및 코딩 하네스 분석

  • Claude 코드는 개발 하네스 분야의 업계 표준으로 S 티어이며 대규모 프로젝트에 적합하다.
  • OpenAI Codex는 Claude 코드의 대안으로 S 티어이며 토큰 사용량 측면에서 더 여유로운 이점을 가진다.
  • OpenClaw 및 Hermes는 시각적인 대시보드와 하트비트 기능으로 생산성을 연기할 뿐 실제 실무 처리 능력은 떨어진다.

개발자가 사용하는 코딩 하네스를 심층 분석한다. Claude 코드와 Codex는 실제 개발에 필수적인 도구로 평가받는다. 반면 시중에 유행하는 상당수의 코딩 도구들은 실질적인 전진보다는 '뭔가 하고 있다'는 느낌을 주는 생산성 연극에 불과하며, 실무자는 직접적인 코드 에이전트 호출을 통해 효율성을 극대화해야 한다.

노코드 빌더 및 생산성 도구

  • Lovable 및 Bolt와 같은 초기 노코드 빌더들은 이제 Claude 코드와 같은 강력한 코딩 에이전트와의 경쟁에서 밀리고 있다.
  • N8N은 일반적인 자동화 도구에서 특정 틈새시장을 위한 도구로 입지가 축소되었다.
  • Notebook LM은 영상 기반 연구와 데이터 정리에 최적화된 S급 무료 도구이다.

노코드 플랫폼의 생존 가능성을 점검한다. 과거 인기를 끌었던 Lovable 등은 개발 도구의 발전으로 인해 존재 가치를 정당화하기 어려워졌다. N8N 또한 범용적인 자동화보다는 특정 상황에서만 필요한 도구로 전환되었다. 반면 Notebook LM은 유튜브 연구 등에 특화된 효율적인 생산성 도구로 명확한 위치를 차지한다.

콘텐츠 생성 및 이미지/영상 모델

  • 클로드 디자인은 시각적 기능은 S급이지만 혹독한 사용량 제한으로 인해 실사용 시 B급 수준이다.
  • 시드 댄스(Seed Dance) 2.0은 인물 재현 능력이 뛰어난 영상 모델로 비오나 클링보다 우위에 있다.
  • 나노 바나나 프로는 이미지 생성 분야에서 동급 최강의 성능을 유지하고 있다.

시각적 콘텐츠 생성 도구들을 평가한다. 클로드 디자인은 디자인 시스템 생성 능력은 뛰어나지만 토큰 소모 속도가 매우 빨라 사용성이 떨어진다. 영상 모델에서는 시드 댄스 2.0이 현재 시장의 주류로 자리 잡았으며, 이미지 모델에서는 나노 바나나 프로가 강력한 성능을 보여준다.

Community Posts

View all posts