00:00:00소프트웨어 개발자로서, 그리고 일반적으로 한 인간으로서도 그렇지만 특히 소프트웨어 개발자에게
00:00:06현재 앤스로픽(Anthropic)을 피해 갈 방법은 없습니다. 원하든 원치 않든 말이죠. 그리고 저는 여러분이
00:00:12그것을 무시해서는 안 된다고 생각합니다. 소프트웨어 개발자로서 우리의 미래에 매우 중요하기 때문입니다.
00:00:20이번 에피소드에서는 지난주에 있었던 클로드(Claude) 코드 유출에 대해서는 이야기하지 않겠습니다.
00:00:28클로드 맥스(Claude Max) 등 구독 서비스 이용 약관 강화에 대한 이야기나
00:00:36승인되지 않은 구독 사용을 어떻게 단속하고 있는지에 대해서도 다루지 않을 것입니다. 그들은 현재
00:00:43실제로 단속을 진행 중인데, OpenAI의 서비스와 마찬가지로 그들의 구독 서비스 또한 막대한 보조금이 투입되기 때문입니다.
00:00:50모두가 구독 한도를 꽉 채워 사용하면 수익을 낼 수 없죠. 그래서 그들은 현재
00:00:56구독 사용을 웹사이트나 클로드 코드, 또는 클로드 데스크톱 앱을 사용하는
00:01:04실제 인간으로 제한하려고 노력하고 있습니다. 하지만 다시 말씀드리지만, 이것이 오늘의 핵심은 아닙니다.
00:01:11앤스로픽의 인상적인 매출 성장세도 주요 주제로 다루지는 않겠지만, 짧게 언급할 가치는 있습니다.
00:01:19앤스로픽이 연간 반복 매출(ARR) 300억 달러를 달성했기 때문인데, 이것 자체로도 놀랍지만
00:01:272025년 말 기준 90억 달러였던 것과 비교하면 특히 더 인상적입니다.
00:01:35불과 몇 달 만에 연간 반복 매출이 3배 이상 증가한 것입니다.
00:01:41정말 대단하죠. 따라서 클로드 코드를 효율적으로 사용하고
00:01:47최대한 활용하는 법을 배우고 싶다면 제가 개설한 강의가 있고, 인기도 매우 높습니다.
00:01:53관심 있으신 분들은 아래 링크를 통해 참여하여 클로드 코드와 효율적으로 일하는 법을 배워보시기 바랍니다.
00:01:59하지만 언급했듯이 이것조차 메인 주제는 아닙니다. 대신 제가 이야기하고 싶은 것은
00:02:05프로젝트 글래스윙(Project Glasswing)과 그들이 아직 대중에게 공개하지 않은 새로운 모델인 미토스(Mythos)입니다.
00:02:14그들은 왜 공개하지 않았는지 이유도 공유했습니다. 저는 이것을 이해하는 것이 중요하다고 생각하며,
00:02:20그들의 논리 이면을 살펴보고 이 새로운 모델의 작동 방식과 능력이 우리 개발자들에게 어떤 영향을 미칠지 보는 것도 중요합니다.
00:02:27그렇다면 프로젝트 글래스윙이란 무엇일까요? 새로운 모델은 무엇에 관한 것일까요?
00:02:33물론 아래에 이 기사의 링크도 걸어두었습니다. 이것은 앤스로픽 공식 사이트의 게시물로,
00:02:39프로젝트 글래스윙을 발표하고 그들의 새로운 모델에 대해서도 이야기하고 있습니다.
00:02:44화면을 조금 내려보면 요약된 벤치마크 통계를 볼 수 있는데,
00:02:52새로운 모델인 미토스(Mythos) 프리뷰 버전이
00:02:59오퍼스(Opus) 4.6보다 훨씬 뛰어난 성능을 보이는 것을 알 수 있습니다. 어떤 벤치마크를 보느냐에 따라
00:03:07오퍼스 4.6과 이 새로운 모델 사이에는 꽤 큰 차이가 존재합니다.
00:03:15물론 이것만으로는 엄청나게 인상적이지는 않습니다. 어떤 회사든 새로운 모델을 발표할 때는
00:03:21경쟁 모델보다 훨씬 낫거나 최소한 조금이라도 더 나은 성능을 보여야 출시될 수 있으니까요.
00:03:26게다가 이런 벤치마크 수치 중 일부는 조작할 수 있는 방법이 있기 때문에, 저는 평소에
00:03:31벤치마크 숫자에 큰 비중을 두지 않으며 이 모델에 대해서도 마찬가지였을 것입니다. 하지만
00:03:39이 새로운 미토스 모델에는 흥미로운 점이 있습니다.
00:03:46바로 앤스로픽이 이 모델을 일반에 공개하지 않기로 결정했다는 사실입니다. 그들의 말에 따르면
00:03:56이 모델이 운영체제, 기타 소프트웨어, 브라우저 등 전반적인 소프트웨어의 취약점을 찾고 악용하는 능력이 너무 뛰어나기 때문입니다.
00:04:05이 기사와 아래 링크된 또 다른 기사에서 그들은 세부 사항을 공유하고 있는데,
00:04:11특히 별도의 기사는 분량이 매우 길며 이 새로운 모델이 발견한 취약점과
00:04:19잠재적 공격 코드(exploit)의 구체적인 예시를 제공합니다. 예를 들어,
00:04:28기사는 OpenBSD에서 발견된 매우 심각한 취약점과 공격 코드로 시작합니다. OpenBSD는
00:04:38네트워킹 소프트웨어 등에서 인기 있는 운영체제인데, 클로드 코드와 같은 에이전트 환경에서 구동된
00:04:45그들의 새로운 모델 미토스는 흥미로운 부분을 발견하고 악용할 수 있었습니다.
00:04:53바로 정수 오버플로 및 예기치 않은 메모리 접근과 관련된 취약점으로,
00:05:02OpenBSD를 실행 중인 머신을 재현 가능한 방식으로 다운시킬 수 있었습니다.
00:05:12이는 당연히 해당 취약점을 악용하는 특정 패킷과 요청을 반복적으로 보냄으로써
00:05:20매우 치명적인 서비스 거부(DoS) 공격을 수행하는 데 활용될 수 있습니다. 해당 머신을 마비시키고
00:05:27잠재적으로 전체 기업 네트워크를 다운시킬 수도 있죠. 이 취약점은
00:05:34단 50달러 미만의 비용이 든 실행 과정에서 탐지되었습니다. 물론 전체 실행 비용은 2만 달러 미만이었지만,
00:05:43어떤 실행에서 취약점을 찾을지 미리 알 수 없기 때문에 전체 비용이 중요합니다.
00:05:48그럼에도 불구하고, 이런 치명적인 취약점을 이토록 상대적으로 저렴한 비용으로
00:05:57찾아낼 수 있는 모델이 있다는 것은, 여러분이 누구냐에 따라 다르겠지만
00:06:04국가 수준의 해커나 심각한 악성 행위자라면 그리 큰 돈이 아닐 수도 있다는 뜻입니다.
00:06:13이것은 당연히 문제가 됩니다. 만약 이런 모델이
00:06:22보안에 덜 신경 쓰거나, 혹은 이러한 취약점을 악용하는 것에 대해
00:06:31어떠한 결과도 두려워할 필요가 없는 회사나 조직에 의해 개발되었다면 큰 문제가 될 수 있기 때문입니다.
00:06:42우리는 인공지능과 함께 그 어떤 것도 안전하지 않은
00:06:56새로운 시대로 진입하고 있는 것 같습니다. 이런 모델을 탑재한 AI 에이전트를 대량으로 배치하여
00:07:05모든 종류의 소프트웨어를 스캔하고 취약점을 찾아 악용하는 것이 그 어느 때보다 쉬워졌습니다.
00:07:13인간 혼자서는 도저히 그 속도를 따라갈 방법이 없습니다. 제 말은, 여기서 발견된 버그와 공격 코드는
00:07:19제 기억에 27년 동안이나 존재해 왔던 것이라고 했습니다. 이는 그 오랜 기간 동안
00:07:29과거에 이 운영체제를 공격하는 데 관심이 있었을 악성 행위자들을 포함하여, 그 누구도 이 버그를 찾지 못했다는 것을 보여줍니다.
00:07:35이것은 이 새로운 모델이 발견한 가장 두드러진 사례 중 하나일 뿐입니다.
00:07:41그들은 모델이 발견하고 때로는 악용하기도 했던 훨씬 더 많은 버그와 공격 사례를 나열하고 있습니다.
00:07:49또한 X(구 트위터) 등에서 다른 이야기도 공유했는데, 예를 들어
00:07:57모델이나 모델을 구동하는 AI 에이전트가 실행 중이던 샌드박스를 탈출할 수 있었다는 내용 등입니다.
00:08:04이러한 점이 바로 프로젝트 글래스윙으로 이어집니다. 프로젝트 글래스윙은
00:08:11앤스로픽이 AWS, 애플, 마이크로소프트, 리눅스 재단 등
00:08:21다른 대기업들과 함께 만든 이니셔티브로, 이 모델을 사용하여 대중에게 모델이 공개되기 전에
00:08:30그들의 소프트웨어를 미리 보완(Patch)하기 위한 목적입니다. 그것이 이 기사의 서사이고 앤스로픽의 설명입니다.
00:08:38저는 이에 대해 복합적인 생각이 듭니다. 우선,
00:08:48이것이 사실이 아니라고 믿을 강력한 이유는 없습니다. 분명 앤스로픽 입장에서도
00:08:56여기서 언급한 것 외에 이 모델을 출시하지 않을 만한 이유들이 있을 것입니다. 예를 들어,
00:09:04이 모델이 약 10조 개의 매개변수(parameter)를 가진 모델이라는 글을 읽었는데, 이는 지금까지
00:09:11우리가 대중적으로 사용해 온 그 어떤 프런티어 모델보다 훨씬 큰 규모입니다. 훈련 비용만
00:09:20약 100억 달러가 들었다고 하며, 이 모델의 토큰 비용은
00:09:30입력 및 출력 토큰당 25달러에서 125달러 사이가 될 것으로 예상된다는 글을 보았습니다. 당연히 이것도
00:09:39모델을 출시하지 않는 이유가 될 수 있습니다. 비용이 너무 비싸서 클로드 구독 서비스에 포함할 수 없기 때문입니다.
00:09:46사람들이 지불할 의사가 없을 정도의 수준으로 구독 가격을 대폭 올려야 할 것이고,
00:09:52따라서 클로드 코드의 일부로 대중에게 노출할 방법이 사실상 없는 셈입니다.
00:09:59물론 사용한 만큼 비용을 지불하는 방식으로 API를 통해 공개할 수는 있습니다.
00:10:05비싸더라도 기꺼이 비용을 지불할 회사나 개인이 있다면 그렇게 할 수 있겠죠. 바로 그 지점에서
00:10:12사이버 보안 우려가 실제로 작용하게 됩니다. 왜냐하면 이 모든 이야기가 지어낸 것일 가능성은 매우 낮기 때문입니다.
00:10:18절대로 지어낸 이야기가 아닙니다. 예를 들어, 이 목록에는 FFMPEG 팀도
00:10:26취약점이 발견된 사례로 포함되어 있는데,
00:10:36해당 팀은 X를 통해 앤스로픽이 FFMPEG 소프트웨어 프로그램의 취약점에 대한
00:10:44패치를 보내왔음을 확인해 주었습니다. 그러니 네, 이것은 분명
00:10:55지어낸 이야기가 아닙니다. 이러한 우려와 사이버 보안 걱정은 타당합니다. 특히 돈이
00:11:03주요 문제가 아니라면, 이 모델이나 미래에 등장할 유사한 능력을 갖춘 모델을 사용하는
00:11:11수천 개의 에이전트를 동시에 가동하여 온갖 소프트웨어를 스캔하고 악용할 수 있기 때문입니다.
00:11:19물론 큰 문제는 이 모델을 사용하여 취약점을 찾고 보완하는 것이 가능하긴 하지만,
00:11:30특정 소프트웨어의 소유자나 유지 관리자가 모델 비용을 감당할 수 있거나 무료로 접근 권한을 얻는 등
00:11:37조건이 맞을 때만 가능하다는 점입니다. 그리고 취약점이 보완되더라도 우리 모두 알다시피
00:11:46세상의 모든 컴퓨터와 머신, 사용자가 최신 소프트웨어를 실행하고 있지는 않습니다.
00:11:55현재 전 세계 웹상에서 구동 중인 다양한 서버들을 살펴보면
00:12:04대다수가 구버전 소프트웨어를 실행하고 있을 것으로 추측됩니다. 우리의 휴대폰이나
00:12:12노트북만 봐도 최신 소프트웨어를 실행하지 않는 경우가 많고, 최신 운영체제 버전이나
00:12:20최신 보안 패치가 설치되어 있지 않을 수 있습니다. 이는 소프트웨어의 모든 계층에서 마찬가지이며,
00:12:28보안 취약점을 찾는 것이 그 어느 때보다 쉬워진 세상에서는
00:12:34이것이 훨씬 더 큰 문제가 됩니다. 물론 이 AI 모델의 좋은 점은
00:12:43보안 취약점을 선제적으로 찾아내고 패치하는 데 사용될 수도 있다는 것입니다. 따라서 이것은 단순한
00:12:48공격자들만의 도구가 아닙니다. 수천 개의 에이전트를 병렬로 동시에 실행하여
00:12:56소프트웨어를 안전하게 만들 수 있는 도구가 생겼으므로 이론적으로 방어를 더 쉽게 만들 수도 있습니다.
00:13:01이것은 방어에 매우 유용한 도구가 될 수 있지만, 다시 말하지만 중요한 소프트웨어를 개발하는
00:13:09모든 회사나 개인이 이 비용을 감당할 수 있거나 사용할 의사가 있는 것은 아닐 것입니다. 설령 사용되어
00:13:16취약점을 찾고 패치한다 해도, 여전히 이러한 최신 버전이 모든 곳에 설치되지는 않을 것입니다.
00:13:23그렇게 되면 공격자들에게는 아주 좋은 기회의 창이 열리게 됩니다. 이전보다
00:13:31훨씬 더 많은 취약점이 탐지되면서 더 많은 정보를 알게 되지만, 모든 머신과
00:13:39모든 사용자가 그러한 취약점으로부터 보호받지는 못하기 때문입니다. 이것이 바로
00:13:46이러한 발전에 대해 제가 가진 실질적인 우려 중 하나입니다. 이것은 모든 기업과
00:13:52모든 인간에게 영향을 미치는 거시적인 관점의 이야기입니다. 또 다른 질문은 당연히
00:13:59이런 모델이 우리 개발자들에게 무엇을 의미하느냐는 것입니다. 제 말은, 이 모델은 스스로
00:14:08취약점을 찾고 악용할 수 있는 매우 뛰어난 능력을 갖춘 것으로 보인다는 점입니다. 그렇다면
00:14:16개발자들에게 미칠 영향은 무엇일까요? 제 생각에 당장은 많은 것이 변하지 않을 것 같습니다.
00:14:28우리는 이미 클로드 코드와 같은 AI 에이전트와 그 기반 모델들이,
00:14:34그리고 물론 코덱스(Codex) 등 여러분이 선호하는 AI 에이전트와 모델이 무엇이든 간에
00:14:39우리 코드의 대부분을 생성할 수 있는 세상에 살고 있기 때문입니다. 여러분이 그것들을 사용하지 않거나 싫어할 수도 있습니다.
00:14:46저는 이 현상이 소프트웨어 개발 과정에서 즐거움을 앗아간다는 제 생각을 담은
00:14:52별도의 영상을 만들기도 했지만, 좋아하든 말든 이것이 현실입니다.
00:14:57믿어주세요, 저도 반드시 이것을 좋아하는 것은 아니지만 어쨌든 이것이 현실입니다. 그럼에도 인간이
00:15:04기여할 수 있는 부분이나 여전히 인간이 중요하고 그 어느 때보다 중요해질 수 있는 이유는
00:15:12이런 AI 에이전트가 통제를 벗어나 완전히 독자적으로 작동하는 것을 결코 원치 않기 때문입니다. 이러한
00:15:21모델과 에이전트를 조종하고, 제어하며, 명확한 과업을 부여하고 작업 범위를 제한하는
00:15:29이 모든 일들이 그 어느 때보다 중요해졌습니다. 보아하니 이 모델들은
00:15:39대다수의 개발자들보다 훨씬 더 많은 일을 할 수 있고, 확실히 저보다도 훨씬 더 잘합니다.
00:15:43하지만 실제 제품을 출시하고 인간이 사용하는 소프트웨어를 만드는 데 있어서
00:15:54인간의 영향력은 당연히 극도로 중요합니다. 물론 바뀌고 있는 것은
00:16:01소프트웨어 개발자로서의 우리의 역할입니다. 우리는 코드를 직접 작성하는 사람에서
00:16:08모델을 조종하고, 코드를 검토하며, 그것이 무엇을 하는지 이해하고,
00:16:12범위를 설정하는 사람으로 변하고 있습니다. 네, 다시 말씀드리지만 다른 영상에서 이러한 변화와
00:16:18이것이 반드시 여러분 마음에 들지 않을 수도 있다는 점에 대해 이야기했습니다. 확실히
00:16:26제가 처음에 소프트웨어 개발을 시작한 이유는 아니지만, 어쨌든 이것이 변화의 영향입니다.
00:16:31이 모델들이 유능해질수록 그 안에 인간의 목소리와
00:16:39인간의 영향력을 담아두는 것이 더 중요해진다고 생각합니다. 그것이 변화하는 역할이자
00:16:48미래의 우리 역할이겠죠. 어쨌든 정말 흥미로운 발전들이며, 특히
00:16:58이 모델과 그 함의, 그리고 그것이 가진 사이버 보안상의 중요성은
00:17:04한 가지 생각을 하게 만듭니다. 만약 다른 행위자들, 다른 국가들이나
00:17:16전 세계의 조직들이 이 모델이나 비슷한 능력을 갖춘 모델을 손에 넣게 된다면 어떤 일이 벌어질까요?
00:17:23왜냐하면 유사한 능력을 갖춘 모델이 대중에게, 혹은 최소한 다른 국가나 행위자들에게
00:17:33접근 가능해지는 것은 단지 시간 문제일 뿐이기 때문입니다. 그리고 글쎄요,
00:17:44우리가 사이버 보안의 이 새로운 경쟁과 버그가 발견되고
00:17:52패치되기까지, 그리고 사람들이 그 패치를 설치하기까지의 지연 시간에 대비가 되어 있는지 모르겠습니다. 제 생각에 우리는
00:18:00사이버 보안의 새로운 시대에 접어들 것이고 분명 적응할 수 있겠지만, 이것은 확실히
00:18:08모델 개발 역사에 있어 흥미로운 지점이라고 할 수 있겠습니다.