1930년에 멈춘 AI (놀라울 정도로 흥미롭습니다)

한국어العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 Português Русский 中文

Computing/SoftwareBooks & LiteratureInternet Technology

Transcript

00:00:001930년대 사람과 대화할 수 있다면 어떨까요? 시간 여행이라도 하는 걸까요? 저는 해봤습니다.

00:00:05그들에게 2026년의 삶이 어떨지 예측해 달라고 부탁했죠.

00:00:08제 생각에 2026년의 삶은 즐겁고 편안할 것 같습니다. 우선,

00:00:13전 세계 어디에나 사람이 살게 될 것입니다. 그때쯤이면 사람들이

00:00:17비행 기술을 터득했을 테니까요. 그다음으로 모든 전쟁이 사라질 것인데,

00:00:21국가들이 서로 평화롭고 우호적으로 사는 법을 배울 것이기 때문입니다. 온갖 종류의

00:00:25과학 지식을 습득하고 치유의 기술에도 완벽히 숙련될 것입니다. 우리는 정직하고

00:00:29좋은 이웃이 될 것이며 도둑은 사라질 것입니다. 요컨대, 2026년의 세상은

00:00:34살기에 매우 즐거운 곳이 될 것이라고 생각합니다.

00:00:36정말 멋진 예측들이었지만, 그중 몇 가지만 실현되었다는 게 조금 아쉽네요. 정직함에 대해 말하자면,

00:00:40제가 거짓말을 조금 했을지도 모릅니다. 죄송하지만 제가 시간 여행을 발명한 건 아닙니다.

00:00:45대신 이것은 사실 130억 개의 매개변수를 가진

00:00:49언어 모델인 'Torquay'였습니다. 1931년 이전의 텍스트로 학습되었기 때문에,

00:00:54제2차 세계 대전이 있었다는 사실조차 모릅니다. 그리고 정말 매혹적이고 거칠며 무례한 답변을 내놓기도 하고,

00:00:59심지어 코딩도 배울 수 있습니다.

00:01:02이 Torquay는 '빈티지 모델'이라고 알려진 것인데, Torquay는

00:01:10해당 종류 중 가장 큰 모델로 보입니다. 이 프로젝트의 연구원 중 한 명은 사실

00:01:14ChatGPT의 근간이 된 2018년 OpenAI의 GPT 연구의 주저자였습니다. 그는 또한

00:01:19DALL-E와 Whisper 작업에도 참여했으니 정말 인상적인 경력이죠. 그들이 한 일은 130억 개의

00:01:24매개변수 네트워크를 2,600억 개의 역사적 영어 텍스트 토큰으로만 학습시킨 것입니다.

00:01:30오래된 신문, 특허, 학술지, 서적 등이 포함되었죠. 참고로 1931년이 기준점인 이유는

00:01:36미국 저작권 시효가 1930년 말까지라, '거대 쥐(디즈니)'에게 고소당하지 않기 위해서입니다.

00:01:40단순히 대화하는 재미 외에도, 이런 빈티지 모델들은 연구 목적도 수행합니다.

00:01:44오늘날 ChatGPT, Claude, Gemini 같은 모든 거대 모델은 현대의 웹 데이터로 학습되는데,

00:01:49이 때문에 AI가 실제로 생각하고 추론하는 것인지, 아니면 그냥

00:01:53어떤 레딧 스레드에서 정답을 외운 것인지 파악하기가 거의 불가능합니다. 그 레딧 글조차 AI가 썼을 수도 있고요.

00:01:57그래서 1931년 이전의 텍스트만 아는 모델을 사용하면, 그런 데이터 오염이 전혀 없습니다.

00:02:02직접 확인해 보죠. '인터넷이 무엇인가?'라고 물어보겠습니다.

00:02:07여기 보시면 모델은 인터넷을 소비재에 부과되는

00:02:11국세(Internal Revenue Tax)와 혼동하는 것 같습니다. 현대의 인터넷이 무엇인지 전혀 모르는 거죠.

00:02:16또 다른 재미있는 실험은 유행어를 물어보는 것입니다. 1930년의 유행어는

00:02:20bosh, rot, 다시 한번 bosh, stuff, nonsense, fudge,

00:02:25gammon, humbug, brack, fla, ribaldry 등이었다고 하네요. 무례한 말을 한 게 아니길 바랍니다.

00:02:30데이터 오염이 없는 것이 유용한 이유는 연구자들이 AI가 실제로

00:02:33코딩 학습 같은 새로운 것을 배울 수 있는지 이해할 수 있게 해주기 때문입니다. 이 모델은 '컴퓨터'가 무엇인지도 모릅니다.

00:02:38모델 입장에서 컴퓨터란 계산을 하는 사람을 의미하니까요. 그렇기에

00:02:43몇 가지 파이썬 프로그램 예시를 주었을 때, 모델이 새로운 프로그램을 작성하는 법을

00:02:47실제로 배울 수 있었다는 점은 꽤 인상적입니다. 비록 대부분 간단한 한 줄짜리 코드였지만요.

00:02:52기초적인 HumanEval 파이썬 테스트를 사용하고 문맥에 무작위 파이썬 함수를 제공했을 때,

00:02:56100번의 기회 중 몇 차례 테스트를 통과하는 데 성공했습니다.

00:03:01이 사례에서 Torquay는 디코드 함수를 만들기 위해 단순히

00:03:05덧셈을 뺄셈으로 바꾸기만 하면 된다는 것을 정확히 이해했습니다. 간단해 보이지만, 이는 역함수에 대한 이해와

00:03:09새로운 지식을 보여주는 것입니다. 이전에 이런 코드를 본 적이 없으니까요.

00:03:13비슷한 크기의 현대 LLM으로 같은 실험을 하면 Torquay보다 훨씬 뛰어난 성능을 보이겠지만, 그건 당연한 결과죠.

00:03:18연구자들이 이 빈티지 모델로 테스트할 수 있는 또 다른 부분은 미래 예측 능력입니다.

00:03:22이제 좀 황당해질 수도 있는데, '또 다른 전쟁이 일어날까?'라고 물어보겠습니다.

00:03:26모델은 유럽에서 또 다른 전쟁이 일어날 것이라 생각하지 않는다고 답하네요. 모델이 얼마나 틀렸는지

00:03:31차마 말해줄 용기가 나지 않습니다. 어떤 오스트리아 남자에 대해서는

00:03:35어떻게 생각하는지도 궁금하네요. 네, 이건 정말 끔찍합니다. 그가 비범한 인물이 될 것이며,

00:03:39그가 이끄는 독일은 훨씬 더 효율적인 행정 체계를 갖추게 될 것이라고 말합니다.

00:03:44정말 할 말이 없네요. 연구자들은 당연히 제가 한 것보다

00:03:50훨씬 더 과학적인 방식으로 이 작업을 수행합니다. 그들은 뉴욕 타임스의 '오늘의 역사' 코너에서 가져온

00:03:54역사적 사건의 짧은 설명들이 이 모델에게 얼마나 놀라운지(surprisingness)를 계산했습니다.

00:03:59이를 통해 1931년 지식 차단 시점 이후 수치가 상승하고, 50년대와 60년대에

00:04:04정점을 찍는 것을 볼 수 있습니다. 모델이 해당 사건들을 도저히 믿기 어렵다고 판단한 것이죠.

00:04:09이런 연구를 통해 모델 크기에 따라 예측 성능이 어떻게 향상되는지, 또 시간에 따라 어떻게

00:04:13감퇴하는지 알 수 있습니다. 또한 모델이 새로운 아이디어를 낼 수 있는지 테스트하는 데에도

00:04:17활용할 수 있는데, 1931년 이후에 만들어진 특허나 논문에 대해 물어보고

00:04:22스스로 발견해낼 수 있는지 확인하는 식이죠. 전반적으로 이러한 빈티지 모델은 연구자들이

00:04:26모델의 행동 중 얼마만큼이 학습 데이터 세트에서 기인한 것인지 구분하게 해줍니다.

00:04:30학습에 대해 말하자면, 순수한 1931년형 모델을 만드는 것은 결코 쉬운 일이 아닙니다.

00:04:36가장 어려운 문제 중 하나는 '시간적 누출(temporal leakage)', 즉 1931년 이후의 정보가 포함되지 않게 하는 것입니다.

00:04:41예를 들어 Torquay에서도 몇 가지 사례가 발견되는데, 1936년의 대통령이 누구였는지,

00:04:45또 그가 만든 정책 중 일부를 알고 있기도 합니다. 여기에는 몇 가지 원인이 있을 수 있습니다.

00:04:50예를 들어, 현대 문서를 다룰 때 오래된 문서를 스캔한 파일에

00:04:54잘못된 메타데이터가 붙어 날짜가 틀렸을 수도 있습니다.

00:04:58또한 편집자 서문이나 각주처럼 나중에 추가된 내용이 있을 수도 있죠.

00:05:03데이터 필터링은 이 문제를 해결하기 위해 현재도 계속 연구하고 개선 중인 부분입니다.

00:05:07또 다른 문제는 1931년의 문서들이 이런 식으로 생겼다는 점입니다.

00:05:11요즘 OCR 성능이 엄청나게 좋아졌지만, 사람이 직접 타이핑한 버전에 비해

00:05:16성능이 30%밖에 나오지 않았습니다. 그래서 엄청난 수작업이 필요할 것이며,

00:05:21정규 표현식을 사용해 흔한 오류들을 수정했음에도 성능은 70%까지만 올라갔습니다.

00:05:25그래서 그들은 현재 새로운 빈티지 전용 OCR 시스템을 개발 중입니다.

00:05:30마지막으로, 빈티지 모델을 사후 학습(post-training)시키는 것도 엄청난 도전입니다.

00:05:35기존에 만들어진 사후 학습용 데이터가 없기 때문이죠. 만약 현대의 데이터를 사용한다면,

00:05:39결국 현대적인 채팅 어시스턴트의 지식, 스타일, 표현 방식이

00:05:43스며들게 될 것입니다. 그래서 연구자들은 오래된 예절 지침서, 서신 작성법,

00:05:48요리책, 사전, 백과사전, 심지어 시와 우화까지 동원해 직접 데이터를 만들어야 했습니다.

00:05:53일단 그 과정을 거치면 모델에게 지시 이행과

00:05:56실제 대화법을 훈련시켜야 합니다. 즉, 강화 학습을 사용해야 하죠. 하지만

00:06:00여기서 문제는 모델이 평가자(judge)가 원하는 방향으로 출력을 조정하기 시작한다는 것인데,

00:06:04우리에게는 1930년대의 평가자가 없습니다. 그래서 사실상 Claude Sonnet 4.6을 사용했죠.

00:06:10문제는 현대의 모델은 2026년 챗봇 형식의 답변을 선호한다는 점입니다.

00:06:15그래서 '번호 매기기 목록(listicles)' 같은 스타일이 1931년 모델에 유출되기 시작했습니다.

00:06:21이는 거의 불가피한 일이지만, 향후에는 빈티지 기반 모델을 평가자로 사용하여 해결하기를 희망하고 있습니다.

00:06:25그들은 이미 GPT-3 수준의 빈티지 모델을 훈련시키고 있으며, 1조 개의

00:06:29역사적 텍스트 토큰 확보가 가능하다고 말합니다. 이는 1930년대의 지식만으로

00:06:35초기 ChatGPT 수준의 능력을 갖추게 됨을 의미하죠. 직접 Torquay를 사용해 보시고,

00:06:39이상하거나 황당한 답변을 얻으신다면 댓글로 알려주세요. 구독도 잊지 마시고,

00:06:43언제나 그렇듯 다음 영상에서 뵙겠습니다.

00:06:45[음악]

Key Takeaway

1931년 이전의 역사적 데이터로만 학습된 Torquay 모델은 현대 웹 데이터의 오염 없이 AI의 순수한 추론 및 학습 능력을 검증하는 연구 도구로 활용된다.

Highlights

Torquay는 130억 개의 매개변수와 2,600억 개의 역사적 토큰으로 학습된 1931년 이전 지식 기반의 언어 모델이다.
현대 AI의 데이터 오염 문제를 해결하기 위해 1931년 이전의 신문, 특허, 학술지 데이터만을 사용하여 추론 능력을 측정한다.
이 모델은 컴퓨터를 계산하는 사람으로 정의하지만 파이썬 코드 예시를 통해 간단한 프로그램을 작성하는 학습 능력을 보였다.
역사적 사건에 대한 모델의 당혹감을 수치화한 결과 1931년 지식 차단 시점 이후 수치가 급증하며 1950~60년대에 정점을 기록했다.
오래된 문서의 낮은 스캔 품질로 인해 초기 OCR 성능이 30%에 그쳤으나 정규 표현식 수정 등을 통해 70%까지 개선했다.

Timeline

1930년대 지식에 갇힌 빈티지 모델의 탄생

Torquay는 1931년 이전의 텍스트 데이터만으로 학습된 130억 매개변수 규모의 언어 모델이다.
미국 저작권 시효가 1930년 말까지인 법적 한계를 고려하여 1931년을 데이터 차단 시점으로 설정했다.
이 프로젝트에는 ChatGPT의 기반이 된 2018년 GPT 연구 주저자가 참여했다.

2,600억 개의 역사적 영어 텍스트 토큰을 사용하여 1930년대 사람의 사고방식을 재현한다. 제2차 세계 대전이나 인터넷 같은 현대적 개념이 전혀 없는 상태에서 2026년의 미래를 전쟁 없는 평화로운 시대로 예측한다. 학습 데이터는 오래된 신문, 특허, 서적 등 공공 영역의 문서로만 구성된다.

데이터 오염 없는 순수 추론 능력의 검증

현대 AI 모델은 학습 데이터와 평가 데이터가 겹치는 데이터 오염 문제로 인해 실제 추론 여부 판별이 어렵다.
Torquay는 컴퓨터나 인터넷에 대한 사전 지식이 전무한 상태에서도 파이썬 코드 작성을 학습하는 성과를 냈다.
단순한 덧셈 함수를 뺄셈으로 바꾸어 역함수를 구현하는 등 새로운 논리 구조를 이해하는 능력을 증명했다.

인터넷을 국세와 혼동하고 컴퓨터를 사람으로 인식하는 모델의 특성은 역설적으로 AI의 학습 능력을 시험하기에 최적의 환경을 제공한다. HumanEval 테스트에서 문맥상 주어지는 무작위 함수를 활용해 문제를 해결하며 데이터 암기 없이도 지능이 작동함을 보여준다. 현대 모델보다 절대적인 성능은 낮지만 데이터 오염이 배제된 상태에서의 유의미한 결과다.

역사적 예측 편향과 지식 차단 분석

역사적 사건 설명에 대한 모델의 당혹도를 계산하여 지식의 감퇴와 예측 성능 향상을 측정한다.
모델은 1930년대 시각에 따라 나치 독일의 효율성을 긍정적으로 평가하는 등 역사적 한계를 그대로 드러낸다.
특허나 논문 데이터를 통해 모델이 스스로 새로운 아이디어를 발견할 수 있는지 테스트하는 용도로 활용된다.

뉴욕 타임스의 기록을 바탕으로 모델이 특정 사건을 얼마나 믿기 어렵게 받아들이는지 수치화한다. 1931년 이후의 사건들에 대해 당혹 수치가 상승하며 특히 50년대와 60년대 사건에서 최고치를 기록한다. 이는 모델의 크기와 지식 보존력 사이의 상관관계를 파악하는 지표가 된다.

빈티지 AI 구축의 기술적 난제와 미래

현대적 정보가 유입되는 시간적 누출을 막기 위해 엄격한 데이터 필터링이 필요하다.
1930년대 문서의 낮은 OCR 인식률을 극복하기 위해 전용 시스템을 개발 중이다.
사후 학습 과정에서 현대적 말투가 스며드는 문제를 해결하기 위해 1930년대 예절 지침서 등의 데이터를 동원한다.

오래된 문서를 스캔할 때 발생하는 메타데이터 오류나 후대에 추가된 각주는 데이터의 순수성을 해치는 주요 원인이다. 사람이 직접 친 타자기 버전에 비해 30% 수준인 OCR 성능을 정규 표현식과 신규 시스템으로 개선하고 있다. 현재 GPT-3 수준의 빈티지 모델을 준비 중이며 1조 개의 역사적 토큰 확보를 목표로 하고 있다.

Community Posts

Write about this video