Kimi K2.6로 40분 만에 창업하기! (전체 모델 상세 분석)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00보시다시피, 이 예제를 통해 여러분도 자신만의 작은 웹 에이전시
00:00:04사업을 이 Kimi 기능을 사용해 40분 만에 시작할 수 있습니다.
00:00:07자, 여러분, 문샷 AI(Moonshot AI)가 자사 플래그십 모델인 Kimi의 업데이트 소식을 들고 돌아왔습니다.
00:00:13Kimi K 2.6은 최신 모델로, 최첨단 코딩과
00:00:18장기 호라이즌 실행, 그리고 에이전트 스웜 기능을 약속합니다.
00:00:22오늘 영상에서는 이 새로운 모델을 살펴보고, 다양한
00:00:27에이전트 작업에서 어떤 성능을 보여주는지, 정말 광고만큼 인상적인지 확인해 보겠습니다.
00:00:32아주 재미있을 것 같으니, 바로 시작해 보죠.
00:00:34몇 달 전, 저는 Kimi K 2.5를 리뷰했는데 프론트엔드 디자인에서 정말 뛰어난 성능을 보여줬습니다.
00:00:44그리고 저는 그들의 에이전트 스웜 기능에 진심으로 감명받았습니다.
00:00:48또한 그들이 자사 챗봇 페이지의 UX에 많은 노력을 기울인 점도 마음에 들었습니다.
00:00:54그래서 이번 차기 버전에서 Kimi는 우리가 실제 프로덕션 환경에서
00:00:57AI 에이전트를 사용하는 방식에 엄청난 도약을 약속합니다.
00:01:02첫 번째로, 에이전트 스웜 규모가 기본적으로 3배 커졌습니다.
00:01:05K 2.5에서는 약 100개의 서브 에이전트를 다뤘지만, K 2.6은 이를 수평적으로 확장하여
00:01:12최대 4,000개의 조정된 단계를 실행할 수 있는 300개의 전문 에이전트를 지원합니다.
00:01:18꽤 엄청난 업데이트라고 할 수 있죠.
00:01:20이제 더 많은 병렬 작업을 동시에 실행할 수 있습니다.
00:01:24또한 '보존된 사고 모드(preserved thinking mode)'라는 새로운 기능을 추가했는데,
00:01:26멀티 턴 작업 전반에 걸쳐 모델의 추론 흔적을 일관되게 유지해 줍니다.
00:01:31복잡한 워크플로우를 깊게 파고들 때 흔히 발생하는 메모리 드리프트 현상을 막아줍니다.
00:01:36다음은 장기 호라이즌 작업입니다.
00:01:39자체 테스트 결과, 13시간짜리 엔지니어링 작업을 처리하면서 185%의 처리량 향상을 달성했습니다.
00:01:46미적인 측면에서는 코딩 기반 디자인으로 나아갔습니다.
00:01:51단순히 예쁜 랜딩 페이지를 만드는 대신, K 2.6은 자체 네이티브 비전 인코더인
00:01:57MoonVIT를 사용하여 UI와 UX 구조를 더 깊은 수준에서 추론합니다.
00:02:03이제 인증부터 데이터베이스 로깅까지 풀스택 워크플로우를 처리할 수 있으며,
00:02:08단일 시각적 참조나 프롬프트를 사용하여 완전히 기능하는 대화형 프로토타입으로 전환합니다.
00:02:14GSAP 애니메이션과 스크롤 트리거 효과, 그 외의 온갖 멋진 기능들을 포함해서 말이죠.
00:02:19그런데 이 모든 기능은 비전 인코더를 포함해 오픈 소스입니다.
00:02:23원한다면 Kimi의 아키텍처와 분리하여
00:02:26Hugging Face에서 모델을 가져와 독립적으로 실행할 수도 있습니다.
00:02:30자, 이론상으로는 매우 인상적인데, 실제로 테스트해서 어떻게 작동하는지 확인해 보죠.
00:02:35Kimi 모델은 오픈 소스라서 이론적으로는 어떤 설정에서든 사용할 수 있습니다.
00:02:40하지만 에이전트 스웜을 제대로 테스트하기 위해 저는 그들의 챗봇 인터페이스를
00:02:46사용해서 최상의 결과를 얻어보겠습니다. 먼저 새로운 에이전트 스웜 기능을 시도해 보죠.
00:02:50사이트의 예시들을 보다가 제 눈길을 끈 것이 하나 있었습니다.
00:02:54K 2.6을 사용해 공식 웹사이트가 없는 로스앤젤레스의 소매점 30곳을 식별하고
00:03:01구글 맵에서 정보를 가져와 각각의 업체를 위한 고전환 랜딩 페이지를 생성하는 섹션이었습니다.
00:03:06인스타그램에서 이런 트렌드를 봐서, 저도 실제로 시도해서
00:03:11나만의 작은 웹 에이전시를 만들 수 있는지 확인하고 싶었습니다. 그래서 이 테스트를 진행하기로 했죠.
00:03:16저는 토론토에 사는데, 주변의 많은 공증인 사무소들이 웹사이트가 아예 없거나
00:03:21매우 오래되었다는 사실을 알게 되었습니다. 그래서 토론토 광역권의
00:03:26공증인 20곳을 식별하여 구글 맵이나
00:03:32캐나다 옐로우 페이지에서 조회한 뒤 각각의 고전환 랜딩 페이지를 만드는 것이 좋은 아이디어라고 생각했습니다.
00:03:37이 작업을 위해 Kimi는 5개의 서브 에이전트를 가동했고, 각 에이전트는 서브 작업 하나씩을 전담했습니다.
00:03:43서브 에이전트들이 실제로 웹을 탐색하고 웹사이트를 방문하는 것을 보니 흥미로웠습니다.
00:03:48그들은 심지어 자체 판단을 사용하여 해당 웹사이트가 오래되었는지 아닌지까지 추정했습니다.
00:03:53전체 워크플로우를 완료하는 데 대략 40분이 걸렸습니다.
00:03:58작업이 끝날 무렵, Kimi는 각 웹사이트에 대한 조사 내용을 담은
00:04:03매우 상세한 분석 보고서를 생성했습니다. 심지어 잠재 고객에게 웹사이트 제안을 보낼 수 있는
00:04:09샘플 아웃리치 이메일과, 전체 시장 규모 및 매출
00:04:16잠재 영향력에 관한 별도의 보고서까지 작성해 주었죠. 물론 그와 함께 생성된 모든 파일도 받았습니다. 그리고
00:04:22Kimi가 생성한 랜딩 페이지를 미리 볼 수 있는 전용 페이지도 있습니다. 솔직히
00:04:27이 랜딩 페이지들이 전부 똑같이 보여서 좀 실망스러웠습니다. 하지만 아마도
00:04:32제가 프롬프트를 충분히 상세하게 제공하지 않은 탓일지도 모르겠네요. 물론 그들의 웹사이트도 제가 사용한 것과
00:04:38같은 프롬프트를 썼겠지만요. 아마 그들은 미리 구성된 하네스가 있었나 봅니다. 그래서 후속 작업으로,
00:04:43각 페이지를 하나씩 살펴보고 고유한 스타일을 적용해 달라고 Kimi에게 요청했고, 이미지를 추가해서
00:04:49랜딩 페이지를 더 흥미롭게 만들어 달라고 했습니다. 여기서 Kimi가 실제로 각 사이트에 맞는
00:04:55커스텀 이미지를 생성한 것을 볼 수 있습니다. 재미있는 사실은, Kimi가 자기 자신을
00:05:00칭찬하는 것을 좋아한다는 점이에요. 예를 들어, 여기 20개의 이미지가 모두 훌륭하다는 식으로요. 이제 완전히 독창적인
00:05:0620개의 랜딩 페이지를 만들게요. 그러니까, 그래 Kimi, 네 말이 맞는지 내가 판단해 보지. 어쨌든, Kimi가
00:05:12이 후속 작업을 끝내는 데는 17분 정도 걸렸습니다. 다시 한번 여기서 Kimi가 랜딩 페이지가 아주
00:05:17환상적이라며 스스로를 칭찬하는 것을 볼 수 있습니다. 알겠어 Kimi, 알겠어. 이제 새로운 미리보기 페이지가 생겼는데,
00:05:23이건 이상하게 깨져 있네요. 아마 CSS 스타일링 문제 같은데, 괜찮습니다.
00:05:28무시하고 넘어가죠. 저는 웹 페이지 자체에 더 관심이 있으니까요. 새 페이지들은 확실히 훨씬
00:05:34좋아 보입니다. 멋진 CSS 애니메이션이 들어갔고, 각 웹 페이지마다 이미지
00:05:40헤더가 포함되었거든요. AI가 생성한 것이긴 하지만, 그래도 멋진 헤더입니다. 하지만 각 페이지들이
00:05:45여전히 같은 패턴을 따르고 있다는 점도 발견했습니다. 똑같은 섹션, 똑같은 사이트 구조예요. 그래서
00:05:51페이지들이 다 다르게 보이긴 하지만, 여전히 같은 보일러플레이트를 사용하고 있어서
00:05:56좀 실망스럽긴 합니다. 저는 좀 더 독특한 접근을 기대했거든요. 하지만 좋은 시작임은
00:06:02분명합니다. 보시다시피, 이 예제를 통해 여러분도 자신만의 작은 웹 에이전시
00:06:07사업을 40분 만에 시작할 수 있습니다. Kimi의 에이전트 스웜에게 지역 비즈니스를
00:06:13탐색하게 시키고, 커스텀 웹사이트와 맞춤형
00:06:18아웃리치 이메일로 제안을 보내면 꽤 괜찮은 부업이 될 거예요. 이 영상 이후에는 모든 소규모
00:06:25지역 업체들이 AI가 생성한 커스텀 웹사이트와 함께 수백 통의
00:06:29제안 이메일을 받기 시작할 것 같네요. 하지만 뭐, 어쩔 수 없죠. 그리고 이 에이전트
00:06:36스웜 기능을 사용하려면 '알레그레토(Allegretto)' 플랜을 이용해야 한다는 점을 알아두세요. 하지만 제가 확실히 말할 수 있는 건,
00:06:41Claude Code에게 똑같은 작업을 시키는 것보다 훨씬 저렴하다는 것입니다. 다만 Kimi의
00:06:46사용량 통계에서 이 거대한 40분짜리 작업에 토큰이 얼마나 쓰였는지 자세한 정보가
00:06:53안 나온다는 점은 아쉽네요. 하지만 Claude로 똑같은 작업을 했다면 진작에 사용량 제한을
00:06:58다 써버렸을 거란 느낌이 듭니다. 어쨌든, 이게 개선된 에이전트 스웜입니다. 그리고
00:07:04혹시 최근에 Kimi의 에이전트 스웜으로 재미있는 실험을 해보셨다면, 댓글로
00:07:09결과를 공유해 주세요. 이제 Kimi의 코딩 능력이 얼마나 개선되었는지 테스트해 보겠습니다.
00:07:14그들은 2.6 버전이 안정적인 일반화 성능과 함께 장기 호라이즌 코딩 작업에서
00:07:20강력한 개선을 이뤘다고 주장합니다. 그래서 이번 작업으로, 웹 크롤링을 처리하는
00:07:26프론트엔드와 백엔드 인터페이스를 갖춘 간단한 웹 앱을 만들어 달라고 요청했습니다. 최근 몇 달간 RAM 가격이
00:07:31정말 미친 듯이 비싸졌다는 건 다들 들으셨을 겁니다. 그래서
00:07:36여러 RAM의 가격 데이터를 능동적으로 크롤링하여 가장 저렴한 옵션을 찾을 수 있는
00:07:42가격 비교 웹사이트를 만들면 좋겠다는 생각이 들었습니다. Kimi가 이 작업을 완료하는 데 대략 12분이
00:07:47걸렸습니다. 그리고 최신 CLI 버전에는 이제 토큰 카운터가
00:07:52추가된 것을 확인할 수 있네요. 그래서 실제 토큰 사용량을 추적할 수 있는데, 아주 멋진 기능입니다. 자, 여기가
00:07:59최종 결과물입니다. 보시다시피, 사이트에 멋진 다크 테마가 적용되었습니다. 그리고
00:08:05브랜드별로 토글해서 볼 수 있고,
00:08:11각 RAM에 대한 여러 매장의 가격 옵션도 볼 수 있습니다. 더 멋진 점은 실시간 새로고침 기능을 트리거하면
00:08:16상점 데이터를 다시 스크래핑한다는 것입니다. 제품 이미지 대부분을 불러오지 못한 건
00:08:21아쉽지만, 기능은 거의 다 구현되어 있습니다. 비교 섹션도 있지만, 추가할 방법이
00:08:27없었습니다. 그래서 후속 작업으로 이 문제를 해결하라고 Kimi에게 요청했습니다. 그러자 이제 '비교에 추가(add to compare)' 버튼이
00:08:34생겼습니다. 비교 탭으로 이동하면, 이제 선택한 모든 RAM을 보여주는 cool한 비교 테이블이
00:08:41나옵니다. 아주 좋네요. 코드를 보니, 이 사이트를
00:08:46기본 Node JS와 Express로 구축했더군요. React조차 사용하지 않고,
00:08:53모든 변경 사항이 내부 HTML 요소를 직접 수정하는 바닐라 자바스크립트 버전을 선택했는데, 흥미로운
00:08:59선택이네요. 그래도 작동만 잘한다면 불평할 이유는 없습니다. 마지막으로, axios와 cheerio를 사용하여
00:09:05아마존, 뉴에그, 베스트바이 사이트를 크롤링하는 멋진 스크래퍼 함수들까지 추가했습니다. 참
00:09:13멋지네요. 자, 이렇게 해서 새로운 Kimi K 2.6 모델을 살펴보았습니다. 솔직히,
00:09:19오늘 진행한 테스트들을 종합해 보면, 2.5버전에 비해 엄청난 도약이라고 말하긴 어렵습니다.
00:09:25하지만 정말 훌륭한 사용자 편의 기능들이 개선되었습니다. 그리고 문샷 AI가
00:09:30플랫폼을 꾸준히 개선하고 있다는 점이 좋습니다. 또한 Claude Code와 같은 비싼 서비스에 비해 훨씬
00:09:36저렴한 대안을 제공한다는 점도 마음에 듭니다. 전반적으로,
00:09:43문샷 AI는 아주 잘하고 있습니다. 앞으로 Kimi가 어떻게 개선될지
00:09:48정말 기대됩니다. 여러분, 이번 영상이 유용하거나 정보가 되었다면,
00:09:53영상 아래의 '좋아요' 버튼을 눌러주세요. 그리고 채널 구독도 잊지 마셔서
00:09:58앞으로 올라올 기술 분석 영상들을 놓치지 마세요. 베터 스택(Better Stack)의 안드레스였습니다.
00:10:04다음 영상에서 뵙겠습니다.

Key Takeaway

Kimi K2.6은 에이전트 스웜 규모를 3배 확장하고 185%의 작업 처리량 개선을 이루어, 복잡한 풀스택 프로토타이핑과 비즈니스 자동화 워크플로우를 1시간 내로 수행할 수 있다.

Highlights

  • Kimi K2.6 모델은 최대 300개의 전문 에이전트를 지원하며 총 4,000개의 조정된 단계를 동시에 실행할 수 있다.

  • 멀티 턴 작업 중 추론 흔적을 유지하는 '보존된 사고 모드'는 복잡한 워크플로우의 메모리 드리프트 현상을 차단한다.

  • 13시간 분량의 엔지니어링 작업에서 이전 버전 대비 185%의 처리량 향상을 달성했다.

  • MoonVIT 비전 인코더를 활용하여 단일 시각적 참조만으로도 기능이 구현된 대화형 프로토타입 생성이 가능하다.

  • 지역 비즈니스 웹사이트 조사와 20개의 랜딩 페이지 생성 작업을 완료하는 데 총 57분이 소요된다.

  • RAM 가격 비교 웹사이트 구축 테스트에서 12분 만에 스크래퍼 함수와 동적 비교 테이블을 구현했다.

Timeline

Kimi K2.6 모델 업데이트 및 기술 사양

  • 에이전트 스웜 규모가 100개에서 300개의 전문 에이전트로 3배 확장되었다.
  • 보존된 사고 모드를 통해 멀티 턴 작업 시 메모리 드리프트 현상을 방지한다.
  • 네이티브 비전 인코더인 MoonVIT가 풀스택 워크플로우 구조를 더 깊게 추론한다.

이번 업데이트는 에이전트의 병렬 처리 능력을 대폭 강화하는 데 초점을 맞추었다. 추론 흔적을 일관되게 유지하는 기능은 복잡한 작업 수행 시 모델의 논리적 오류를 줄인다. 또한 시각적 정보를 처리하는 MoonVIT 인코더는 독립적인 오픈 소스 모델로 배포되어 접근성을 높였다.

지역 웹 에이전시 사업 자동화 테스트

  • 지역 공증인 사무소 20곳을 대상으로 시장 조사 및 랜딩 페이지 생성을 완료했다.
  • 초기 랜딩 페이지 생성 후 17분의 후속 작업을 통해 각 사이트별 커스텀 스타일과 이미지를 적용했다.
  • 알레그레토 플랜을 통한 에이전트 스웜 기능은 Claude Code 대비 비용 효율적인 대안이다.

실제 테스트에서는 구글 맵과 옐로우 페이지 데이터를 활용해 웹사이트가 없는 지역 업체를 식별했다. 5개의 서브 에이전트가 각기 다른 세부 작업을 전담하여 40분 만에 분석 보고서와 랜딩 페이지를 구축했다. 초기에 동일한 구조를 보인 보일러플레이트 문제는 후속 프롬프트를 통해 개별 스타일을 적용하여 해결했다.

코딩 기반 웹 앱 구축 및 성능 평가

  • RAM 가격 비교 웹사이트를 12분 만에 구현하여 실시간 크롤링 기능을 탑재했다.
  • Node JS와 Express 환경에서 바닐라 자바스크립트를 사용하여 효율적인 코드를 생성했다.
  • CLI 내장 토큰 카운터로 정밀한 사용량 추적이 가능하다.

코딩 능력 검증을 위해 아마존, 뉴에그 등의 사이트 데이터를 크롤링하는 인터페이스를 구축했다. axios와 cheerio 라이브러리를 사용하여 가격 비교 기능을 구현했으며, 누락된 비교 테이블 기능도 2차 작업을 통해 추가했다. K2.6은 안정적인 일반화 성능을 바탕으로 복잡한 풀스택 구현에서도 실용적인 결과를 나타냈다.

Community Posts

View all posts