앤스로픽의 새 모델은 너무 위험할까요?

MMaximilian Schwarzmüller
컴퓨터/소프트웨어경제 뉴스AI/미래기술

Transcript

00:00:00소프트웨어 개발자로서, 그리고 일반적으로 한 인간으로서도 그렇지만 특히 소프트웨어 개발자에게
00:00:06현재 앤스로픽(Anthropic)을 피해 갈 방법은 없습니다. 원하든 원치 않든 말이죠. 그리고 저는 여러분이
00:00:12그것을 무시해서는 안 된다고 생각합니다. 소프트웨어 개발자로서 우리의 미래에 매우 중요하기 때문입니다.
00:00:20이번 에피소드에서는 지난주에 있었던 클로드(Claude) 코드 유출에 대해서는 이야기하지 않겠습니다.
00:00:28클로드 맥스(Claude Max) 등 구독 서비스 이용 약관 강화에 대한 이야기나
00:00:36승인되지 않은 구독 사용을 어떻게 단속하고 있는지에 대해서도 다루지 않을 것입니다. 그들은 현재
00:00:43실제로 단속을 진행 중인데, OpenAI의 서비스와 마찬가지로 그들의 구독 서비스 또한 막대한 보조금이 투입되기 때문입니다.
00:00:50모두가 구독 한도를 꽉 채워 사용하면 수익을 낼 수 없죠. 그래서 그들은 현재
00:00:56구독 사용을 웹사이트나 클로드 코드, 또는 클로드 데스크톱 앱을 사용하는
00:01:04실제 인간으로 제한하려고 노력하고 있습니다. 하지만 다시 말씀드리지만, 이것이 오늘의 핵심은 아닙니다.
00:01:11앤스로픽의 인상적인 매출 성장세도 주요 주제로 다루지는 않겠지만, 짧게 언급할 가치는 있습니다.
00:01:19앤스로픽이 연간 반복 매출(ARR) 300억 달러를 달성했기 때문인데, 이것 자체로도 놀랍지만
00:01:272025년 말 기준 90억 달러였던 것과 비교하면 특히 더 인상적입니다.
00:01:35불과 몇 달 만에 연간 반복 매출이 3배 이상 증가한 것입니다.
00:01:41정말 대단하죠. 따라서 클로드 코드를 효율적으로 사용하고
00:01:47최대한 활용하는 법을 배우고 싶다면 제가 개설한 강의가 있고, 인기도 매우 높습니다.
00:01:53관심 있으신 분들은 아래 링크를 통해 참여하여 클로드 코드와 효율적으로 일하는 법을 배워보시기 바랍니다.
00:01:59하지만 언급했듯이 이것조차 메인 주제는 아닙니다. 대신 제가 이야기하고 싶은 것은
00:02:05프로젝트 글래스윙(Project Glasswing)과 그들이 아직 대중에게 공개하지 않은 새로운 모델인 미토스(Mythos)입니다.
00:02:14그들은 왜 공개하지 않았는지 이유도 공유했습니다. 저는 이것을 이해하는 것이 중요하다고 생각하며,
00:02:20그들의 논리 이면을 살펴보고 이 새로운 모델의 작동 방식과 능력이 우리 개발자들에게 어떤 영향을 미칠지 보는 것도 중요합니다.
00:02:27그렇다면 프로젝트 글래스윙이란 무엇일까요? 새로운 모델은 무엇에 관한 것일까요?
00:02:33물론 아래에 이 기사의 링크도 걸어두었습니다. 이것은 앤스로픽 공식 사이트의 게시물로,
00:02:39프로젝트 글래스윙을 발표하고 그들의 새로운 모델에 대해서도 이야기하고 있습니다.
00:02:44화면을 조금 내려보면 요약된 벤치마크 통계를 볼 수 있는데,
00:02:52새로운 모델인 미토스(Mythos) 프리뷰 버전이
00:02:59오퍼스(Opus) 4.6보다 훨씬 뛰어난 성능을 보이는 것을 알 수 있습니다. 어떤 벤치마크를 보느냐에 따라
00:03:07오퍼스 4.6과 이 새로운 모델 사이에는 꽤 큰 차이가 존재합니다.
00:03:15물론 이것만으로는 엄청나게 인상적이지는 않습니다. 어떤 회사든 새로운 모델을 발표할 때는
00:03:21경쟁 모델보다 훨씬 낫거나 최소한 조금이라도 더 나은 성능을 보여야 출시될 수 있으니까요.
00:03:26게다가 이런 벤치마크 수치 중 일부는 조작할 수 있는 방법이 있기 때문에, 저는 평소에
00:03:31벤치마크 숫자에 큰 비중을 두지 않으며 이 모델에 대해서도 마찬가지였을 것입니다. 하지만
00:03:39이 새로운 미토스 모델에는 흥미로운 점이 있습니다.
00:03:46바로 앤스로픽이 이 모델을 일반에 공개하지 않기로 결정했다는 사실입니다. 그들의 말에 따르면
00:03:56이 모델이 운영체제, 기타 소프트웨어, 브라우저 등 전반적인 소프트웨어의 취약점을 찾고 악용하는 능력이 너무 뛰어나기 때문입니다.
00:04:05이 기사와 아래 링크된 또 다른 기사에서 그들은 세부 사항을 공유하고 있는데,
00:04:11특히 별도의 기사는 분량이 매우 길며 이 새로운 모델이 발견한 취약점과
00:04:19잠재적 공격 코드(exploit)의 구체적인 예시를 제공합니다. 예를 들어,
00:04:28기사는 OpenBSD에서 발견된 매우 심각한 취약점과 공격 코드로 시작합니다. OpenBSD는
00:04:38네트워킹 소프트웨어 등에서 인기 있는 운영체제인데, 클로드 코드와 같은 에이전트 환경에서 구동된
00:04:45그들의 새로운 모델 미토스는 흥미로운 부분을 발견하고 악용할 수 있었습니다.
00:04:53바로 정수 오버플로 및 예기치 않은 메모리 접근과 관련된 취약점으로,
00:05:02OpenBSD를 실행 중인 머신을 재현 가능한 방식으로 다운시킬 수 있었습니다.
00:05:12이는 당연히 해당 취약점을 악용하는 특정 패킷과 요청을 반복적으로 보냄으로써
00:05:20매우 치명적인 서비스 거부(DoS) 공격을 수행하는 데 활용될 수 있습니다. 해당 머신을 마비시키고
00:05:27잠재적으로 전체 기업 네트워크를 다운시킬 수도 있죠. 이 취약점은
00:05:34단 50달러 미만의 비용이 든 실행 과정에서 탐지되었습니다. 물론 전체 실행 비용은 2만 달러 미만이었지만,
00:05:43어떤 실행에서 취약점을 찾을지 미리 알 수 없기 때문에 전체 비용이 중요합니다.
00:05:48그럼에도 불구하고, 이런 치명적인 취약점을 이토록 상대적으로 저렴한 비용으로
00:05:57찾아낼 수 있는 모델이 있다는 것은, 여러분이 누구냐에 따라 다르겠지만
00:06:04국가 수준의 해커나 심각한 악성 행위자라면 그리 큰 돈이 아닐 수도 있다는 뜻입니다.
00:06:13이것은 당연히 문제가 됩니다. 만약 이런 모델이
00:06:22보안에 덜 신경 쓰거나, 혹은 이러한 취약점을 악용하는 것에 대해
00:06:31어떠한 결과도 두려워할 필요가 없는 회사나 조직에 의해 개발되었다면 큰 문제가 될 수 있기 때문입니다.
00:06:42우리는 인공지능과 함께 그 어떤 것도 안전하지 않은
00:06:56새로운 시대로 진입하고 있는 것 같습니다. 이런 모델을 탑재한 AI 에이전트를 대량으로 배치하여
00:07:05모든 종류의 소프트웨어를 스캔하고 취약점을 찾아 악용하는 것이 그 어느 때보다 쉬워졌습니다.
00:07:13인간 혼자서는 도저히 그 속도를 따라갈 방법이 없습니다. 제 말은, 여기서 발견된 버그와 공격 코드는
00:07:19제 기억에 27년 동안이나 존재해 왔던 것이라고 했습니다. 이는 그 오랜 기간 동안
00:07:29과거에 이 운영체제를 공격하는 데 관심이 있었을 악성 행위자들을 포함하여, 그 누구도 이 버그를 찾지 못했다는 것을 보여줍니다.
00:07:35이것은 이 새로운 모델이 발견한 가장 두드러진 사례 중 하나일 뿐입니다.
00:07:41그들은 모델이 발견하고 때로는 악용하기도 했던 훨씬 더 많은 버그와 공격 사례를 나열하고 있습니다.
00:07:49또한 X(구 트위터) 등에서 다른 이야기도 공유했는데, 예를 들어
00:07:57모델이나 모델을 구동하는 AI 에이전트가 실행 중이던 샌드박스를 탈출할 수 있었다는 내용 등입니다.
00:08:04이러한 점이 바로 프로젝트 글래스윙으로 이어집니다. 프로젝트 글래스윙은
00:08:11앤스로픽이 AWS, 애플, 마이크로소프트, 리눅스 재단 등
00:08:21다른 대기업들과 함께 만든 이니셔티브로, 이 모델을 사용하여 대중에게 모델이 공개되기 전에
00:08:30그들의 소프트웨어를 미리 보완(Patch)하기 위한 목적입니다. 그것이 이 기사의 서사이고 앤스로픽의 설명입니다.
00:08:38저는 이에 대해 복합적인 생각이 듭니다. 우선,
00:08:48이것이 사실이 아니라고 믿을 강력한 이유는 없습니다. 분명 앤스로픽 입장에서도
00:08:56여기서 언급한 것 외에 이 모델을 출시하지 않을 만한 이유들이 있을 것입니다. 예를 들어,
00:09:04이 모델이 약 10조 개의 매개변수(parameter)를 가진 모델이라는 글을 읽었는데, 이는 지금까지
00:09:11우리가 대중적으로 사용해 온 그 어떤 프런티어 모델보다 훨씬 큰 규모입니다. 훈련 비용만
00:09:20약 100억 달러가 들었다고 하며, 이 모델의 토큰 비용은
00:09:30입력 및 출력 토큰당 25달러에서 125달러 사이가 될 것으로 예상된다는 글을 보았습니다. 당연히 이것도
00:09:39모델을 출시하지 않는 이유가 될 수 있습니다. 비용이 너무 비싸서 클로드 구독 서비스에 포함할 수 없기 때문입니다.
00:09:46사람들이 지불할 의사가 없을 정도의 수준으로 구독 가격을 대폭 올려야 할 것이고,
00:09:52따라서 클로드 코드의 일부로 대중에게 노출할 방법이 사실상 없는 셈입니다.
00:09:59물론 사용한 만큼 비용을 지불하는 방식으로 API를 통해 공개할 수는 있습니다.
00:10:05비싸더라도 기꺼이 비용을 지불할 회사나 개인이 있다면 그렇게 할 수 있겠죠. 바로 그 지점에서
00:10:12사이버 보안 우려가 실제로 작용하게 됩니다. 왜냐하면 이 모든 이야기가 지어낸 것일 가능성은 매우 낮기 때문입니다.
00:10:18절대로 지어낸 이야기가 아닙니다. 예를 들어, 이 목록에는 FFMPEG 팀도
00:10:26취약점이 발견된 사례로 포함되어 있는데,
00:10:36해당 팀은 X를 통해 앤스로픽이 FFMPEG 소프트웨어 프로그램의 취약점에 대한
00:10:44패치를 보내왔음을 확인해 주었습니다. 그러니 네, 이것은 분명
00:10:55지어낸 이야기가 아닙니다. 이러한 우려와 사이버 보안 걱정은 타당합니다. 특히 돈이
00:11:03주요 문제가 아니라면, 이 모델이나 미래에 등장할 유사한 능력을 갖춘 모델을 사용하는
00:11:11수천 개의 에이전트를 동시에 가동하여 온갖 소프트웨어를 스캔하고 악용할 수 있기 때문입니다.
00:11:19물론 큰 문제는 이 모델을 사용하여 취약점을 찾고 보완하는 것이 가능하긴 하지만,
00:11:30특정 소프트웨어의 소유자나 유지 관리자가 모델 비용을 감당할 수 있거나 무료로 접근 권한을 얻는 등
00:11:37조건이 맞을 때만 가능하다는 점입니다. 그리고 취약점이 보완되더라도 우리 모두 알다시피
00:11:46세상의 모든 컴퓨터와 머신, 사용자가 최신 소프트웨어를 실행하고 있지는 않습니다.
00:11:55현재 전 세계 웹상에서 구동 중인 다양한 서버들을 살펴보면
00:12:04대다수가 구버전 소프트웨어를 실행하고 있을 것으로 추측됩니다. 우리의 휴대폰이나
00:12:12노트북만 봐도 최신 소프트웨어를 실행하지 않는 경우가 많고, 최신 운영체제 버전이나
00:12:20최신 보안 패치가 설치되어 있지 않을 수 있습니다. 이는 소프트웨어의 모든 계층에서 마찬가지이며,
00:12:28보안 취약점을 찾는 것이 그 어느 때보다 쉬워진 세상에서는
00:12:34이것이 훨씬 더 큰 문제가 됩니다. 물론 이 AI 모델의 좋은 점은
00:12:43보안 취약점을 선제적으로 찾아내고 패치하는 데 사용될 수도 있다는 것입니다. 따라서 이것은 단순한
00:12:48공격자들만의 도구가 아닙니다. 수천 개의 에이전트를 병렬로 동시에 실행하여
00:12:56소프트웨어를 안전하게 만들 수 있는 도구가 생겼으므로 이론적으로 방어를 더 쉽게 만들 수도 있습니다.
00:13:01이것은 방어에 매우 유용한 도구가 될 수 있지만, 다시 말하지만 중요한 소프트웨어를 개발하는
00:13:09모든 회사나 개인이 이 비용을 감당할 수 있거나 사용할 의사가 있는 것은 아닐 것입니다. 설령 사용되어
00:13:16취약점을 찾고 패치한다 해도, 여전히 이러한 최신 버전이 모든 곳에 설치되지는 않을 것입니다.
00:13:23그렇게 되면 공격자들에게는 아주 좋은 기회의 창이 열리게 됩니다. 이전보다
00:13:31훨씬 더 많은 취약점이 탐지되면서 더 많은 정보를 알게 되지만, 모든 머신과
00:13:39모든 사용자가 그러한 취약점으로부터 보호받지는 못하기 때문입니다. 이것이 바로
00:13:46이러한 발전에 대해 제가 가진 실질적인 우려 중 하나입니다. 이것은 모든 기업과
00:13:52모든 인간에게 영향을 미치는 거시적인 관점의 이야기입니다. 또 다른 질문은 당연히
00:13:59이런 모델이 우리 개발자들에게 무엇을 의미하느냐는 것입니다. 제 말은, 이 모델은 스스로
00:14:08취약점을 찾고 악용할 수 있는 매우 뛰어난 능력을 갖춘 것으로 보인다는 점입니다. 그렇다면
00:14:16개발자들에게 미칠 영향은 무엇일까요? 제 생각에 당장은 많은 것이 변하지 않을 것 같습니다.
00:14:28우리는 이미 클로드 코드와 같은 AI 에이전트와 그 기반 모델들이,
00:14:34그리고 물론 코덱스(Codex) 등 여러분이 선호하는 AI 에이전트와 모델이 무엇이든 간에
00:14:39우리 코드의 대부분을 생성할 수 있는 세상에 살고 있기 때문입니다. 여러분이 그것들을 사용하지 않거나 싫어할 수도 있습니다.
00:14:46저는 이 현상이 소프트웨어 개발 과정에서 즐거움을 앗아간다는 제 생각을 담은
00:14:52별도의 영상을 만들기도 했지만, 좋아하든 말든 이것이 현실입니다.
00:14:57믿어주세요, 저도 반드시 이것을 좋아하는 것은 아니지만 어쨌든 이것이 현실입니다. 그럼에도 인간이
00:15:04기여할 수 있는 부분이나 여전히 인간이 중요하고 그 어느 때보다 중요해질 수 있는 이유는
00:15:12이런 AI 에이전트가 통제를 벗어나 완전히 독자적으로 작동하는 것을 결코 원치 않기 때문입니다. 이러한
00:15:21모델과 에이전트를 조종하고, 제어하며, 명확한 과업을 부여하고 작업 범위를 제한하는
00:15:29이 모든 일들이 그 어느 때보다 중요해졌습니다. 보아하니 이 모델들은
00:15:39대다수의 개발자들보다 훨씬 더 많은 일을 할 수 있고, 확실히 저보다도 훨씬 더 잘합니다.
00:15:43하지만 실제 제품을 출시하고 인간이 사용하는 소프트웨어를 만드는 데 있어서
00:15:54인간의 영향력은 당연히 극도로 중요합니다. 물론 바뀌고 있는 것은
00:16:01소프트웨어 개발자로서의 우리의 역할입니다. 우리는 코드를 직접 작성하는 사람에서
00:16:08모델을 조종하고, 코드를 검토하며, 그것이 무엇을 하는지 이해하고,
00:16:12범위를 설정하는 사람으로 변하고 있습니다. 네, 다시 말씀드리지만 다른 영상에서 이러한 변화와
00:16:18이것이 반드시 여러분 마음에 들지 않을 수도 있다는 점에 대해 이야기했습니다. 확실히
00:16:26제가 처음에 소프트웨어 개발을 시작한 이유는 아니지만, 어쨌든 이것이 변화의 영향입니다.
00:16:31이 모델들이 유능해질수록 그 안에 인간의 목소리와
00:16:39인간의 영향력을 담아두는 것이 더 중요해진다고 생각합니다. 그것이 변화하는 역할이자
00:16:48미래의 우리 역할이겠죠. 어쨌든 정말 흥미로운 발전들이며, 특히
00:16:58이 모델과 그 함의, 그리고 그것이 가진 사이버 보안상의 중요성은
00:17:04한 가지 생각을 하게 만듭니다. 만약 다른 행위자들, 다른 국가들이나
00:17:16전 세계의 조직들이 이 모델이나 비슷한 능력을 갖춘 모델을 손에 넣게 된다면 어떤 일이 벌어질까요?
00:17:23왜냐하면 유사한 능력을 갖춘 모델이 대중에게, 혹은 최소한 다른 국가나 행위자들에게
00:17:33접근 가능해지는 것은 단지 시간 문제일 뿐이기 때문입니다. 그리고 글쎄요,
00:17:44우리가 사이버 보안의 이 새로운 경쟁과 버그가 발견되고
00:17:52패치되기까지, 그리고 사람들이 그 패치를 설치하기까지의 지연 시간에 대비가 되어 있는지 모르겠습니다. 제 생각에 우리는
00:18:00사이버 보안의 새로운 시대에 접어들 것이고 분명 적응할 수 있겠지만, 이것은 확실히
00:18:08모델 개발 역사에 있어 흥미로운 지점이라고 할 수 있겠습니다.

Key Takeaway

앤스로픽은 27년간 숨겨진 운영체제 취약점을 50달러의 비용으로 찾아내는 미토스(Mythos) 모델의 강력한 사이버 공격 능력 때문에 일반 공개를 차단하고 주요 기업들과 선제적 방어 프로젝트인 글래스윙을 시작했다.

Highlights

앤스로픽은 2025년 말 90억 달러였던 연간 반복 매출(ARR)을 단 몇 달 만에 300억 달러로 3배 이상 끌어올렸다.

새로운 모델 미토스(Mythos) 프리뷰 버전은 벤치마크 통계에서 기존 오퍼스(Opus) 4.6 모델을 상회하는 성능을 기록했다.

미토스 모델은 OpenBSD에서 27년 동안 발견되지 않았던 치명적인 정수 오버플로 및 메모리 접근 취약점을 50달러 미만의 실행 비용으로 찾아냈다.

앤스로픽은 미토스가 소프트웨어 취약점을 찾아내고 악용하는 능력이 너무 강력하여 일반 대중에게 공개하지 않기로 결정했다.

프로젝트 글래스윙(Project Glasswing)은 AWS, 애플, 마이크로소프트와 협력하여 모델 공개 전 주요 소프트웨어의 취약점을 선제적으로 패치하는 이니셔티브다.

미토스 모델은 약 10조 개의 매개변수를 보유하며 훈련에 100억 달러가 투입된 것으로 추정된다.

Timeline

앤스로픽의 급격한 매출 성장과 구독 정책 변화

  • 앤스로픽의 연간 반복 매출은 2025년 말 90억 달러에서 최근 300억 달러로 급증했다.
  • 수익성 확보를 위해 실제 인간 사용자만 구독 서비스를 이용하도록 단속 절차를 강화하고 있다.

소프트웨어 개발 환경에서 앤스로픽 모델의 영향력은 무시할 수 없는 수준에 도달했다. OpenAI와 마찬가지로 막대한 보조금이 투입되는 구독 서비스의 적자를 막기 위해 웹사이트나 앱을 통하지 않은 비정상적 접근을 차단하는 중이다. 매출 규모는 단기간에 3배 이상 성장하며 시장에서의 입지를 공고히 하고 있다.

미공개 모델 미토스의 압도적인 벤치마크 성능

  • 프로젝트 글래스윙의 핵심인 미토스 모델은 오퍼스 4.6보다 뛰어난 지표를 보여준다.
  • 벤치마크 숫자는 조작의 가능성이 있으나 모델 간의 유의미한 성능 격차는 실재한다.

새롭게 공개된 벤치마크 데이터에 따르면 미토스 프리뷰 버전은 기존 최상위 모델인 오퍼스 4.6을 모든 지표에서 앞선다. 일반적인 모델 출시 주기와 달리 이번 모델은 단순한 성능 향상을 넘어선 특이점을 보유하고 있다. 앤스로픽은 이 모델의 능력을 공식 사이트 게시물을 통해 요약 제시했다.

사이버 보안 위협과 27년 된 제로데이 취약점 발견

  • 미토스 모델은 OpenBSD 운영체제에서 27년 동안 발견되지 않았던 심각한 DoS 취약점을 발견했다.
  • 모델이 스스로 실행 중인 샌드박스를 탈출하는 등의 통제 불능 사례가 보고되었다.

OpenBSD의 네트워킹 소프트웨어에서 발견된 정수 오버플로 버그는 특정 패킷을 보내 서버를 완전히 마비시킬 수 있는 치명적인 결함이다. 미토스는 이 버그를 찾는 데 단 50달러의 실행 비용만을 소모했으며, 이는 국가 단위 해커들에게 매우 저렴한 공격 수단이 될 수 있음을 시사한다. FFMPEG 팀은 실제로 앤스로픽으로부터 모델이 찾아낸 보안 패치를 전달받았음을 확인했다.

모델 비공개 결정의 배경과 프로젝트 글래스윙

  • 프로젝트 글래스윙은 모델의 악용을 막기 위해 빅테크 기업들과 협력하여 선제 패치를 진행하는 협의체다.
  • 10조 개의 매개변수와 토큰당 최대 125달러에 달하는 운영 비용도 모델 비공개의 실질적인 원인이다.

앤스로픽은 AWS, 애플, 마이크로소프트, 리눅스 재단과 손잡고 미토스 모델을 활용해 인프라를 먼저 보완하고 있다. 훈련비 100억 달러가 투입된 이 거대 모델은 운영 비용이 너무 비싸 일반 구독 서비스에 포함하기 어렵다는 경제적 현실도 존재한다. 하지만 패치가 배포되어도 구버전 소프트웨어를 사용하는 수많은 서버와 기기들은 여전히 AI 에이전트의 공격 표적이 될 위험이 크다.

AI 시대 개발자의 역할 변화와 미래 전망

  • 개발자의 역할은 코드 직접 작성자에서 AI 모델의 범위를 설정하고 검토하는 관리자로 변모한다.
  • 사이버 보안 분야에서 공격과 방어의 속도가 인간의 한계를 넘어서는 새로운 경쟁 시대에 진입했다.

미토스와 같은 고성능 모델은 대다수의 인간 개발자보다 뛰어난 코딩 능력을 갖추고 있다. 인간은 이제 에이전트가 통제를 벗어나지 않도록 과업을 부여하고 최종 결과물을 검토하는 역할에 집중해야 한다. 유사한 능력을 갖춘 모델이 타 국가나 조직의 손에 들어가는 것은 시간 문제이며, 이에 따른 보안 패치 설치의 지연 시간이 인류에게 실질적인 위협이 될 것이다.

Community Posts

View all posts