이 'Fable 5' 에이전트 OS 없이 Claude Code를 쓰지 마세요

CChase AI
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00자비스, 오늘 상황 좀 알려줘.
00:00:03좋은 아침입니다.
00:00:04현재 모든 플랫폼을 합쳐 팔로워는 약 46만 6천 명이며, 이번 주에 약 3천 명 증가했습니다.
00:00:12최신 영상들은 하루에 4천 조회수를 기록하고 있으며, 지금까지 1만 7천 조회수를 달성했습니다.
00:00:18오늘 AI 분야의 큰 뉴스는 미국 정부의 지시로 앤스로픽이 '미토스(Mythos)' 클래스에 대한 대중의 접근을 중단했다는 소식입니다.
00:00:27오늘 가장 중요한 안건은 자비스 HUD 공개 영상을 편집하고 배포하는 것입니다.
00:00:33일일 편지함 감사를 실행할까요, 아니면 다른 하실 말씀 있으신가요?
00:00:37자, 정확히 뭘 보고 있는 거지?
00:00:39네, 이건 '자비스'이고 우리 클로드 페이블 5 OS입니다.
00:00:43페이블 5라고 말하는 건 이게 페이블 5를 사용해 빌드됐다는 의미지만, 구동을 위해 반드시 페이블 5가 필요한 건 아닙니다.
00:00:51사실 여기서 보시는 많은 부분은 완전히 로컬에서 실행되며, 원하시는 거의 모든 모델에서 구동할 수 있습니다.
00:00:58제 이전 에이전트 OS 영상을 보셨다면 대충 어떤 내용인지 아실 겁니다.
00:01:01Claude Code에 레이어를 하나 더 추가해서 터미널 안에서는 얻을 수 없는 기능들을 구현했습니다.
00:01:08시각적 지표나 버튼으로 전환된 기술 같은 것들인데, 이건 단순히 보여주기식 기능이 아닙니다.
00:01:15다양한 영역에서 작업하는 사람에게 진정한 효율을 높여주고, 기술적이지 않은 팀원이나 고객을 위해 쉽게 패키징할 수 있는 시스템입니다.
00:01:26자비스는 이 에이전트 OS 모델의 다음 진화 형태입니다.
00:01:30그 기반은 여전히 강력하고 완전히 맞춤 설정이 가능한 클로드 코드 기술 아키텍처로, 일상적인 수동 워크플로우와 작업들을 기술과 자동화로 바꿔줍니다.
00:01:43이런 토대 위에 우리는 이것을 구축합니다.
00:01:46오늘 영상에서는 이 시스템이 어떻게 작동하는지, 진정한 가치는 어디에 있는지, 그리고 직접 어떻게 만들 수 있는지 보여드리겠습니다.
00:01:53특히 로컬 음성 모델 방식 등 이 프로젝트에서 배울 점이 많다고 생각합니다.
00:01:58본격적으로 시작하기 전에, 오늘 영상을 후원해준 저에게 감사 인사를 전합니다.
00:02:02체이스 AI 플러스(Chase AI+)에서는 오늘 영상에서 보시는 제 설정 환경에 접근할 수 있을 뿐만 아니라, AI 개발자가 되기 위한 최고의 방법인 클로드 코드 마스터클래스도 제공합니다.
00:02:14이 과정은 매주 업데이트되며, 코덱스(Codex) 마스터클래스도 포함되어 있습니다.
00:02:18AI의 최첨단 트렌드를 유지하고 싶은 분이라면 여기가 바로 여러분을 위한 곳입니다.
00:02:23현재 멤버십 할인 행사를 진행 중이니 관심 있으신 분들은 고정 댓글을 확인해주세요.
00:02:28그럼 자비스의 전반적인 구성을 빠르게 살펴보고, 실제 무엇을 보고 있는지 이해해보도록 하죠.
00:02:34그 후에 내부 구조를 살펴보고 직접 맞춤 설정하고 구축하는 방법을 이해해보겠습니다.
00:02:41우선 전면에 있는 음성 기능은 완전히 로컬에서 작동하며, 덕분에 일레븐랩스(11Labs) 같은 서비스로 라우팅하는 것보다 훨씬 빠르고 즉각적입니다.
00:02:53영상 초반에 자비스가 제 최신 영상 실적, 팔로워 수, AI 뉴스 같은 내용을 들려주는 걸 들으셨을 겁니다.
00:03:01그건 미리 짜여진 대본이 아닙니다.
00:03:03자비스에게 '오늘 상황 알려줘'나 '오늘 무슨 일 있었어?'라고 물어보면, 제 옵시디언 볼트(Obsidian Vault)에 자동 생성된 보고서들을 확인하고 무엇이 중요한지 판단해서 알려주는 것입니다.
00:03:18설명하는 동안 보셨듯이 여러 팝업이 떴는데, 이 작은 팝업들은 대화 내용과 관련 있는 보고서나 링크들입니다.
00:03:29예를 들어 제 최근 영상 성과에 대해 언급하면서 해당 영상으로 바로 이동하는 '최신 배포' 팝업을 띄워줬죠.
00:03:37앤스로픽 관련 내용으로 페이블 5가 정부에 의해 사실상 중단된 이슈도 언급했습니다.
00:03:42그럼 뭘 할까요?
00:03:43해당 기사 원문을 불러옵니다.
00:03:44그 외 AI 뉴스나 트렌드 관련 내용들도 아침 보고서에서 가져온 것입니다.
00:03:49클릭하면 상세 내용을 확인할 수 있습니다.
00:03:52이 보고서는 옵시디언 안에 저장됩니다.
00:03:54이 전체 시스템은 옵시디언과 연결되어 있습니다.
00:03:56여기서 읽을 수도 있지만 '옵시디언에서 열기'를 클릭하면 원본 보고서가 옵시디언 안에서 열립니다.
00:04:04링크들을 클릭하면 서로 다 연결되어 있습니다.
00:04:07자비스가 설명 마지막에 '편지함 분류를 해드릴까요?'라고 물어본 것도 기억하실 겁니다.
00:04:12제 Gmail에 들어가서 중요한 내용을 확인하고 응답할지 물어본 것이죠.
00:04:15그건 하나의 기술이고, 이런 기술들과 자동화 기능은 오른쪽 상단에 표시됩니다.
00:04:21이를 통해 버튼 클릭 한 번으로 모든 클라우드 코드 기술이나 자동화를 즉시 실행할 수 있습니다.
00:04:26지난주에 옵시디언 안에 만들었던 클라우드 OS와 정확히 같은 개념입니다.
00:04:33이 기능의 추가 가치는 기술적 지식이 없는 팀이나 고객과 함께 사용할 때 더욱 빛을 발합니다.
00:04:39그들은 클라우드 코드로 기술과 자동화를 실행하고 싶어 하지만 터미널을 직접 열어볼 사용자는 아니니까요.
00:04:44이 모든 기능을 쉽게 사용할 수 있고 완전히 맞춤 설정도 가능합니다.
00:04:49예를 들어 편지함 요약을 받고 싶다고 해보죠.
00:04:52오른쪽 상단에서 '편지함 요약'을 클릭하면 즉시 대기열에 추가되었다고 뜹니다.
00:05:00여기서 진행 상황을 볼 수 있고, 진행 표시줄(프로진스 바)이 자동화가 수행 중임을 보여줍니다.
00:05:09완료되면 서면 보고서를 생성할 뿐만 아니라, 무엇이 중요하고 어떤 일이 있는지 구두로 브리핑해줍니다.
00:05:16이처럼 빠르게 구두로 브리핑을 해주고, 실제 보고서는 항상 그렇듯 옵시디언에 링크되어 확인할 수 있습니다.
00:05:34팝업은 유용하고 관련성이 높으며 필요한 정보로 바로 연결해주고, 언제든 지울 수 있습니다.
00:05:39오른쪽을 좀 더 살펴보죠.
00:05:41이미 얘기했듯이,
00:05:43언제든 바꿀 수 있는 다양한 기술들이 준비되어 있습니다.
00:05:45클릭 한 번으로 실행됩니다.
00:05:47그 아래에는 일정이 있습니다.
00:05:50구글 캘린더와 연동된 제 일상적인 스케줄입니다.
00:05:53클릭하면 캘린더가 뜹니다.
00:05:56오디오 섹션도 있습니다.
00:05:58얘기하고 있을 때 그래프가 움직이는 걸 보셨을 텐데, 제대로 작동 중인지 알려줍니다.
00:06:05그 아래에는 AI 뉴스 요약이 있습니다.
00:06:10여기 보이는 모든 것은 방금 얘기한 모든 것과 마찬가지로 완전히 맞춤 설정이 가능합니다.
00:06:15구글 캘린더 일정을 표시하고 싶지 않을 수도 있죠.
00:06:18오디오 시각화나 AI 뉴스 와이어 같은 건 필요 없을지도 모릅니다.
00:06:21이런 에이전트 OS의 아름다움은 '원 사이즈'가 아니라는 점입니다.
00:06:22제가 보여드리는 도구들은 여러분이 가져가서 원하는 대로 활용할 수 있는 세트일 뿐입니다.
00:06:29여러분과 제 지표는 다를 겁니다.
00:06:34클릭 한 번으로 실행하고 싶은 항목들도 저와는 많이 다를 겁니다.
00:06:36각자의 일상적인 워크플로우나 업무 성격에 따라 달라지는 거죠.
00:06:40좋은 점은 클라이언트나 팀원에게 제공할 때, 그들을 위해 무엇이든 맞춤형으로 만들 수 있다는 겁니다.
00:06:44왼쪽도 마찬가지입니다.
00:06:51제 통계(vitals)로 구독자 수나 최신 영상 관련 지표들을 보여줍니다.
00:06:53최근 5시간 동안의 클로드 토큰 사용량을 추적하는 지표도 있습니다.
00:06:58지시 사항(directives) 같은 것도 있죠.
00:07:01오늘 작업해야 할 상위 3가지 사항을 보여줍니다.
00:07:03물론 이것도 완전히 동적이며 클로드 코드가 제 일정을 바탕으로 파악합니다.
00:07:06문서 트레일도 있습니다.
00:07:10자비스가 생성하거나 참조하는 모든 것은 팝업으로만 뜨지 않습니다.
00:07:13여기에 저장됩니다.
00:07:18아까 아침 보고서처럼 클릭하고 싶을 때 바로 확인할 수 있습니다.
00:07:18이게 사용자 인터페이스입니다.
00:07:22자비스의 시각적인 면이죠.
00:07:23이제 핵심적인 원리를 얘기해보죠.
00:07:25내부적으로는 어떻게 돌아가는 걸까요?
00:07:28솔직히 그게 진짜 중요한 거니까요.
00:07:29이게 그냥 화려한 UI에 그친다면, 생산성만 그럴싸하게 보여주는 '생산성 연극'이 될 뿐입니다.
00:07:32터미널에서 계속 작업하는 것보다 실제로 유의미한 변화를 만들려면 제대로 된 백본(기반)이 필요합니다.
00:07:37바로 그걸 보시는 겁니다.
00:07:43자비스와 대화해서 작업을 시키면 어떤 일이 일어나는지, 그리고 어떤 경로들을 거치는지 단계별로 알아보겠습니다.
00:07:45예를 들어, 자비스에게 '오늘 아침 보고서 업데이트해줘'라고 말한다고 가정해보죠.
00:07:53매일 아침 실행하는 자동화 루틴이 있습니다.
00:08:00관련 정보를 수집하고 자비스가 그걸 알려주길 원하는 거죠.
00:08:03직접 읽고 싶진 않으니까요.
00:08:07자비스가 이걸 직접 실행하거나 이미 실행됐다면 결과를 들려주길 바라는 겁니다.
00:08:07마이크를 통해 자비스에게 '오늘 아침 보고서 상황이 어때?'라고 묻습니다.
00:08:12그 음성은 마이크를 사용했기 때문에 'Faster Whisper'로 전달됩니다.
00:08:18'Faster Whisper'는 무료로 제공되는 로컬 소스 프로그램으로, 당신이 말한 음성을 텍스트로 변환합니다.
00:08:25물론 로컬 음성 변환 프로그램은 세상에 아주 많습니다.
00:08:34취향껏 다른 걸로 바꾸셔도 됩니다.
00:08:39그저 제가 써보니 잘 작동해서 선택한 겁니다.
00:08:40아무튼 그렇게 음성이 스크립트(텍스트)로 변환되었습니다.
00:08:42이제 이걸 어떻게 처리할까요?
00:08:46페이블 5에 대해 많이 얘기했지만 말이죠.
00:08:47모든 질문을 클로드 코드로 보내서 페이블 5가 실행되고 확인해야 할까요?
00:08:50아니, 당연히 아닙니다.
00:08:55전체가 페이블 5 기반으로 구축됐지만, 내부적으로는 대부분 Opus나 Sonnet 모델이 돌아갑니다.
00:08:56혹은 이런 기능들 대부분에 로컬 모델을 쓸 수도 있습니다. 왜냐하면 자비스는 작업이 가능하긴 해도,
00:09:02페이블을 쓰라고 지시하면 문제없이 사용할 수 있으니까요.
00:09:08이걸로 새로운 프로젝트를 창조하는 건 아니죠.
00:09:11이건 비서 영역이나, 비슷한 작업을 항상 반복하면서도 이해하기 쉬운 UI를 원하는 비기술 팀을 위한 것입니다.
00:09:13큰 그림을 보자면 그렇습니다.
00:09:17자, 그럼 대화 내용이 스크립트로 변환됐습니다.
00:09:22이제 이걸 가지고 무엇을 할지 결정해야 합니다.
00:09:24세 가지 선택지가 있습니다.
00:09:26가장 먼저 물어볼 질문은,
00:09:28이 스크립트나 질문을 정규식(Regex)을 통해 라우팅할 수 있는가입니다.
00:09:30이 결정론적 코드 스크립트는 AI가 관여하지 않으며, 단지 스크립트를 보고 판단합니다.
00:09:39특정 작업이 필요하다고 미리 코딩해둔 특정 구절들과 매칭되는지 확인하는 거죠.
00:09:45무슨 뜻인지 이해하시겠나요?
00:09:52소개할 때 뭐라고 했었죠?
00:09:55'오늘 상황(rundown) 알려줘'라고 했죠.
00:09:56'Rundown'이라는 단어를 썼잖아요.
00:09:58'Rundown'은 특정 트리거 단어라서 정규식이 인식하고 자동으로 특정 작업을 수행하도록 라우팅합니다.
00:10:00그 특정 작업이 바로 영상 초반에 보신 겁니다.
00:10:03보고서를 확인하고, 상황을 알려주고, 오늘 브리핑을 해주는 거죠.
00:10:11기본적인 요약을 제공하기 위해 특정 키워드를 자동으로 잡아내 실행하는 겁니다.
00:10:14이 방식은 코드일 뿐이라 비용도 안 들고, AI가 관여하지 않아 매우 빠릅니다.
00:10:19완벽한 세상이라면 모든 걸 이렇게 처리해서 응답을 아주 빨리 받을 수 있겠지만,
00:10:24대부분의 경우 AI에게 시키는 일은 모호하기 마련입니다.
00:10:32무엇을 할지, 어떻게 라우팅할지 파악하기 위해 약간의 지능이 필요하죠.
00:10:36그때 두 번째 옵션인 '하이쿠(Haiku)'를 사용합니다.
00:10:43왜 하이쿠를 쓰냐고요?
00:10:47앤스로픽 모델 중 왜 가장 멍청한 모델을 쓰냐고요?
00:10:51싸고 빠르니까요.
00:10:52이 단계에서 하는 일은 단순한 라우팅입니다.
00:10:54정규식으로 바로 처리할 수 있는 게 아니라면 아무것도 하지 않죠.
00:10:57응답을 어디로 보낼지, 누가 처리해야 할지만 파악하는 단계입니다.
00:11:01하이쿠는 이 작업에 아주 탁월합니다.
00:11:06자비스에게 시키는 일들 대부분은 그리 복잡하지 않습니다.
00:11:11어느 경로로 보낼지 이해만 하면 되는데, 하이쿠가 그 일을 해줍니다.
00:11:13다시 말하지만, 요청당 비용은 1센트의 일부분에 불과합니다.
00:11:18세 번째 옵션으로, 제 시스템에는 포함했지만 개인 취향에 따라 완전히 로컬 모델로만 돌릴 수도 있습니다.
00:11:22하이쿠는 아예 안 써도 됩니다.
00:11:26로컬 컴퓨터에서 모델을 구동하면 시스템 전반에 걸쳐 로컬 환경을 유지할 수 있고, 같은 역할을 수행합니다.
00:11:34스크립트를 보고 어디로 라우팅할지 파악하는 거죠.
00:11:35여기서는 라우팅만 합니다.
00:11:42요약하자면, 당신이 말하면 텍스트로 변환되고, 정규식이나 하이쿠 또는 로컬 모델이 뭘 할지 결정합니다.
00:11:45이제 자비스에게 그 요청을 전달했습니다.
00:11:46'아침 보고서 내용 알려줘'.
00:11:54하이쿠는 '옵시디언을 살펴보자'고 할 겁니다.
00:11:59이미 존재하는 파일인가?
00:12:01디스크에 있는 보고서라면 아주 빠르고 쉽게 읽고 답변할 수 있습니다.
00:12:06옵시디언 안에 없다면 어떻게 할까요?
00:12:08그럼 클로드 코드에게 아침 보고서를 작성하라고 명령합니다.
00:12:16하이쿠가 라우팅은 하지만 실행은 하이쿠가 하지 않습니다.
00:12:19더 강력한 모델이 필요하니까요.
00:12:24기본적으로 Opus를 사용하지만 Sonnet으로 바꿀 수도 있습니다.
00:12:28제정신이 아니라면 페이블 5가 돌아왔을 때 그걸로 써도 되고요.
00:12:30생성된 게 없다면 뭘 할까요?
00:12:34클로드 코드의 헤드리스 버전을 씁니다.
00:12:38클로드 코드를 여는 것과 같지만 보이지 않게 실행되죠.
00:12:42그리고 '-P'를 사용합니다.
00:12:44참고로 헤드리스 클로드 코드에서 '-P'를 사용하면 구독료에서 차감되지 않습니다.
00:12:47아시겠나요?
00:12:49매달 제공되는 200달러 추가 API 크레딧에서 차감됩니다.
00:12:57이게 문제가 될까요?
00:12:57엄청난 규모라면요?
00:13:02네.
00:13:04그래서 대부분의 작업을 Sonnet으로 처리해야 합니다.
00:13:05실제로 문제가 될까요?
00:13:06딱히 그렇지 않다고 봅니다.
00:13:10자비스 같은 시스템의 목적이 뭐죠?
00:13:13개인 비서이자 작업 관리자로 활동하는 거죠.
00:13:15우린 자비스로 페이스북을 만들려는 게 아닙니다.
00:13:17정말 그런 걸 만든다면 터미널에서 하드코딩하겠죠.
00:13:21이건 개인 비서나 비기술 팀원을 위한 도구입니다.
00:13:24특정 수준 이상의 복잡한 작업엔 안 씁니다.
00:13:27이게 그럴 용도의 도구가 아니거든요.
00:13:31즉 Sonnet을 사용한다면 200달러 크레딧을 다 소진할 가능성은 낮다는 겁니다.
00:13:33그다지 큰 문제는 아니죠.
00:13:35생각해볼 만한 문제긴 합니다.
00:13:44그게 부담된다면 클로드 코드를 안 쓰면 그만입니다.
00:13:46이름은 '페이블 5 OS'지만 솔직히,
00:13:48코덱스로 바꿔도 됩니다.
00:13:52전체를 로컬 모델로 바꿀 수도 있고요.
00:13:55꼭 클로드 코드일 필요는 없습니다.
00:13:56인프라는 얼마든지 원하는 걸로 교체 가능한 구조입니다.
00:13:59아까 예시로 돌아가서 아침 보고서를 원한다고 했었죠.
00:14:02옵시디언에 없었으니, 이제 헤드리스 클로드 코드를 실행해서 보고서를 생성합니다.
00:14:07그 보고서가 옵시디언에 업로드되면 그걸 읽고 요약 응답을 생성합니다.
00:14:10그 요약은 '코코로(Kokoro)'로 전달됩니다.
00:14:16'코코로'는 클로드 코드가 생성한 요약 텍스트를 음성으로 변환해주는 또 다른 로컬 오픈소스 모델입니다.
00:14:25컴퓨터 속의 '미니 11랩스'라고 생각하시면 됩니다.
00:14:29그럼 코코로가 '오늘 아침 보고서 내용은 어쩌고 저쩌고' 하면서 당신에게 말해줍니다.
00:14:39오늘 들으신 자비스의 목소리가 코코로가 낸 것입니다.
00:14:43그럼 Kokoro가 '오늘 아침 보고 내용은 이렇습니다'라며 쭉 말해주고 그게 여러분에게 전달되죠.
00:14:49오늘 Jarvis에게서 들으신 그 목소리가 바로 Kokoro가 만든 겁니다.
00:14:53원하는 목소리로 얼마든지 바꿀 수 있죠.
00:14:55이렇듯 로컬 방식이라 맞춤 설정이 가능합니다.
00:14:56결국 여러분이 Jarvis에게 무언가를 요청하면 이런 경로를 거쳐서 실행되는 방식입니다.
00:15:04아마 많이 헷갈리실 테니, 무슨 일이 일어나는지 마지막으로 한 번 더 요약해 드릴게요.
00:15:10먼저 Jarvis에게 무언가를 요청합니다.
00:15:13그 요청은 텍스트로 변환되어야 하죠.
00:15:16Faster Whisper가 무료로 이 작업을 수행합니다.
00:15:18텍스트가 확보되면 이제 어떻게 처리할지 경로를 정해야 합니다.
00:15:22정규 표현식이나 저렴한 Haiku 모델, 혹은 로컬 모델을 사용하죠.
00:15:28그다음엔 이 요청이 Obsidian에 이미 존재하는 내용인지, 아니면 Cloud Code를 호출해 보고서를 생성해야 하는지 판단합니다.
00:15:38생성해야 할 것이 만들어지면, Obsidian 내에 보고서를 만들거나 HTML 페이지 형태로 출력합니다.
00:15:44어떤 방식이든 최종 응답은 Kokoro로 보내지고, Kokoro가 이를 음성으로 변환해 우리가 들을 수 있게 전달하는 거죠.
00:15:53간단하죠?
00:15:54이제 한 걸음 더 들어가서, 내부적으로는 무슨 일이 벌어지는지 살펴볼까요.
00:15:57우리가 '아침 보고'를 요청하거나 'A, B, C 스킬을 실행해'라고 말할 때 실제로는 뭘 의미할까요?
00:16:01바로 이것입니다.
00:16:03모든 것의 뼈대가 되는 '스킬 아키텍처'를 말하는 거죠.
00:16:08아침 보고가 도대체 뭘까요?
00:16:09뭐든 될 수 있죠.
00:16:10스킬이라는 건 여러 소규모 스킬들로 구성된 하나의 큰 틀로, 특정 정보를 위해 여러 소스를 확인하거나 소셜 미디어 페이지를 체크하는 등 다양한 작업을 수행하게 만듭니다.
00:16:24하지만 계속 강조하듯이, 이 스킬 아키텍처는 여러분이 어떻게 만드느냐에 따라 성능이 결정됩니다.
00:16:30그럼 이걸 어떻게 만들까요?
00:16:31제 다른 영상들을 보셨다면 제 지론을 아실 겁니다.
00:16:34핵심은 여러분의 일상 업무 흐름을 어떻게 자동화할지 찾아내는 것입니다.
00:16:38일상 업무 흐름이란 게 뭘까요?
00:16:40개인 생활이나 비즈니스에서 매일 반복적으로 수행하는 일들을 말합니다.
00:16:43계속해서 되풀이되는 공통적인 업무들이 무엇인지 생각해보세요.
00:16:47Cloud Code를 다룰 줄 아는 분이라면, 직접 Cloud Code 앞에 앉아서 '내가 매일 하는 일은 이거야'라고 말해본 적 있으신가요?
00:16:55그 업무들을 개별 작업 단위로 쪼갤 수 있을까요?
00:16:58그리고 그 작업들을 스킬로 전환할 수 있을까요?
00:17:01더 나아가 합리적이라면 자동화로 연결하는 겁니다.
00:17:04그렇게 스킬 아키텍처를 구축하는 거죠.
00:17:06이게 바로 진정한 힘의 원천입니다.
00:17:08예를 들어, 여기 보시는 건 제가 하는 다양한 스킬들 중 '콘텐츠 리서치' 같은 겁니다.
00:17:14대부분은 콘텐츠 제작자가 아니니 여러분의 경우는 완전히 다를 겁니다.
00:17:17하지만 원리는 동일합니다.
00:17:19리서치를 위해 전 뭘 할까요?
00:17:20당연히 유튜브 같은 곳을 살펴봐야 하죠.
00:17:24그래서 유튜브 검색을 'YT 파이프라인' 스킬로 만들었습니다. 영상들을 Notebook LM으로 보내서 요약본을 받아보는 식이죠.
00:17:35유튜브를 넘어 트위터나 인터넷 전반을 아우르는 심층 리서치도 필요합니다.
00:17:43그건 '심층 리서치 스킬'로 아예 따로 만들었습니다.
00:17:47또 제가 과거에 했던 작업들에 대한 방대한 정보가 담긴 'LightRag' 기반의 GraphRag 시스템도 있죠.
00:17:52그래서 뭘 했냐고요?
00:17:53그 전체 쿼리 시스템을 스킬로 전환했습니다.
00:17:56계속 이런 식으로 확장하는 거죠.
00:17:58콘텐츠, 커뮤니티, 에이전시, 영업 등 제 개인적 삶과 비즈니스의 전 영역에 걸쳐 이를 반복했습니다.
00:18:07실무적으로는 Cloud Code를 열고 '내 일상 업무는 이거야'라고 의식의 흐름대로 나열하기만 하면 됩니다.
00:18:15그다음 '이것들을 스킬로 바꿀 수 있을까?'라고 묻는 거죠.
00:18:17'Chase Heia Plus'와 아래 링크에는 필요하신 분들을 위해 Cloud Code에 바로 적용할 수 있는 전체 스크립트를 올려두었습니다.
00:18:25정리하자면, Jarvis에게 'X, Y, Z 스킬을 실행해'라고 명령하면 전사 및 경로 설정 과정을 거치고, 그 과정에서 headless Cloud Code가 실행되어 백그라운드에서 작업을 수행하는 겁니다.
00:18:42만약 그게 간단한 스킬이라면, 과정이 이미 정해져 있기 때문에 정확하고 일관된 결과물을 얻을 수 있습니다.
00:18:53우연에 맡길 부분이 전혀 없다는 거죠.
00:18:55AI 시스템을 더 결정론적으로 만들 수 있을수록 좋습니다.
00:19:02AI가 마음대로 할지 아닐지 걱정하는 일련의 문제들로부터 자유로워질 수 있으니까요.
00:19:08스킬을 구축함으로써 특정 작업들을 코드화한 것이니까요.
00:19:11이 모든 걸 종합해 보면 Jarvis는 단순한 UI나 화려한 지표를 보여주는 도구가 아니라, 그 아래에 아주 많은 작업이 돌아가는 시스템임을 알 수 있습니다.
00:19:22이면에 엄청난 기능들이 숨어 있죠.
00:19:23또한 이것이 웹 앱이기 때문에 팀원이나 고객들과 공유할 수 있다는 점이 정말 강력한 장점입니다.
00:19:30만약 여러분이 제작자라면, 고객은 어떤 커스터마이징을 원하는지만 말하면 됩니다.
00:19:36진짜 핵심은 전체 스킬 아키텍처와, 업무를 코드화하는 과정을 단계별로 안내해 준다는 점입니다.
00:19:46누구든 이 자리에 앉아서 제가 매일 사용하는 스킬과 자동화 기능들의 80~90%를 즉시 활용할 수 있게 되니까요.
00:19:56클릭 한 번이면 가능합니다.
00:19:58그게 바로 여러분이 제공하는 가치죠.
00:20:00물론 다른 기능을 원하면 음성 기능도 추가할 수 있고요.
00:20:03결국 이 모든 것 위에 씌운 하나의 화려한 레이어일 뿐입니다.
00:20:07이게 전체 시스템을 한마디로 요약한 것입니다.
00:20:09높은 커스터마이징 수준과 다양한 로컬 기능들을 연결할 수 있다는 점이 정말 마음에 듭니다.
00:20:14창의력을 발휘해서 무엇이든 연결하고 실행할 수 있으니까요.
00:20:18슬랙 에이전트 같은 외부 소스를 추가로 연동하는 것도 얼마든지 가능합니다.
00:20:26자, 오늘 이야기는 여기서 마무리하겠습니다.
00:20:30제 정확한 설정 파일이 궁금하시다면 고정 댓글의 링크를 확인해 주세요.
00:20:36오늘 영상 어떠셨나요? 댓글로 알려주시고 다음 영상에서 뵙겠습니다.

Key Takeaway

자비스 에이전트 OS는 Claude Code 아키텍처를 기반으로 일상 업무를 자동화 스킬로 코드화하고, 이를 시각적 UI와 로컬 모델로 연결하여 생산성을 극대화하는 맞춤형 개인 비서 시스템이다.

Highlights

  • 자비스(Jarvis)는 Claude Code 기반의 에이전트 OS로, 터미널 명령을 시각적 버튼과 자동화 스킬로 패키징하여 비기술 팀원도 사용할 수 있게 구현한다.

  • 음성 처리에는 로컬 오픈소스 모델인 Faster Whisper와 Kokoro를 사용하여 클라우드 API 라우팅보다 빠르고 즉각적인 응답을 실현한다.

  • 정규 표현식(Regex)을 이용한 결정론적 라우팅 방식을 도입하여, AI 모델 호출 없이 단순 작업을 0비용으로 즉시 처리한다.

  • 모든 시스템은 옵시디언(Obsidian)과 연동되어 있으며, AI가 생성한 보고서와 링크가 옵시디언에 자동으로 저장되고 관리된다.

  • 헤드리스(Headless) Claude Code 모드는 매달 제공되는 200달러 API 크레딧 내에서 실행되어 추가 구독료 없이 운영 가능하다.

  • 스킬 아키텍처는 일상적인 반복 업무를 코드화한 단위로, 이를 조합하여 사용자 맞춤형 워크플로우를 생성한다.

Timeline

에이전트 OS 자비스의 개념과 기능

  • 자비스는 Claude Code 기술 아키텍처 위에 구축된 시각적 인터페이스 중심의 에이전트 OS이다.
  • 음성, 일정, 통계 지표, AI 뉴스 요약 등 모든 구성 요소는 사용자의 업무 흐름에 맞춰 완전히 맞춤 설정이 가능하다.
  • 터미널 작업이 불가능한 고객이나 비기술 팀원을 위해 클릭 기반의 자동화 제어 환경을 제공한다.

영상 초반에는 일일 팔로워 수, 조회수, AI 뉴스 등 자비스가 제공하는 일상적인 비서 기능을 소개한다. 이는 미리 짜여진 대본이 아니라 옵시디언 볼트에 생성된 보고서를 분석하여 답변하는 구조이다. 오른쪽 상단에는 각종 자동화 기술을 실행할 수 있는 버튼이 배치되어 있고, 작업 진행 상황은 프로그레스 바를 통해 시각적으로 표시된다.

자비스의 작동 원리와 라우팅 시스템

  • 사용자의 음성 요청은 Faster Whisper를 통해 텍스트로 변환된다.
  • 변환된 텍스트는 정규 표현식, 저렴한 하이쿠(Haiku) 모델, 또는 로컬 모델 중 하나를 통해 실행 경로가 결정된다.
  • 복잡한 작업은 헤드리스 클로드 코드(Headless Claude Code)를 실행하여 백그라운드에서 처리하고, 결과는 Kokoro 모델이 음성으로 변환하여 전달한다.

실제 동작 프로세스는 단계별로 라우팅을 거쳐 효율성을 극대화한다. 단순한 문구는 정규식으로 처리하여 비용과 속도를 최적화하고, 모호한 요청은 하이쿠 모델이 경로를 결정한다. 최종 결과물은 옵시디언에 저장하거나 화면에 표시하며, Kokoro를 통해 즉각적인 음성 브리핑이 이루어진다.

스킬 아키텍처 구축과 업무 코드화

  • 스킬 아키텍처는 일상적인 반복 업무를 개별 작업 단위로 쪼개어 자동화한 구조이다.
  • 개인 리서치, 콘텐츠 제작, 영업 등 업무 전반에 걸쳐 스킬을 정의하고 이를 시스템에 통합한다.
  • 결정론적 스킬 구축은 AI의 불확실성을 배제하고 일관된 결과물을 도출하게 한다.

시스템의 진정한 가치는 업무를 코드화하는 과정에서 발생한다. 콘텐츠 리서치나 데이터 분석과 같은 반복 업무를 스킬로 전환하여 자동화 파이프라인을 구축한다. 이렇게 만들어진 스킬 세트는 팀원이나 고객과 공유 가능하며, 누구나 클릭 한 번으로 고도의 자동화된 업무 흐름을 실행할 수 있는 기반이 된다.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video