Transcript
00:00:001930년대 사람과 대화할 수 있다면 어떨까요? 시간 여행이라도 하는 걸까요? 저는 해봤습니다.
00:00:05그들에게 2026년의 삶이 어떨지 예측해 달라고 부탁했죠.
00:00:08제 생각에 2026년의 삶은 즐겁고 편안할 것 같습니다. 우선,
00:00:13전 세계 어디에나 사람이 살게 될 것입니다. 그때쯤이면 사람들이
00:00:17비행 기술을 터득했을 테니까요. 그다음으로 모든 전쟁이 사라질 것인데,
00:00:21국가들이 서로 평화롭고 우호적으로 사는 법을 배울 것이기 때문입니다. 온갖 종류의
00:00:25과학 지식을 습득하고 치유의 기술에도 완벽히 숙련될 것입니다. 우리는 정직하고
00:00:29좋은 이웃이 될 것이며 도둑은 사라질 것입니다. 요컨대, 2026년의 세상은
00:00:34살기에 매우 즐거운 곳이 될 것이라고 생각합니다.
00:00:36정말 멋진 예측들이었지만, 그중 몇 가지만 실현되었다는 게 조금 아쉽네요. 정직함에 대해 말하자면,
00:00:40제가 거짓말을 조금 했을지도 모릅니다. 죄송하지만 제가 시간 여행을 발명한 건 아닙니다.
00:00:45대신 이것은 사실 130억 개의 매개변수를 가진
00:00:49언어 모델인 'Torquay'였습니다. 1931년 이전의 텍스트로 학습되었기 때문에,
00:00:54제2차 세계 대전이 있었다는 사실조차 모릅니다. 그리고 정말 매혹적이고 거칠며 무례한 답변을 내놓기도 하고,
00:00:59심지어 코딩도 배울 수 있습니다.
00:01:02이 Torquay는 '빈티지 모델'이라고 알려진 것인데, Torquay는
00:01:10해당 종류 중 가장 큰 모델로 보입니다. 이 프로젝트의 연구원 중 한 명은 사실
00:01:14ChatGPT의 근간이 된 2018년 OpenAI의 GPT 연구의 주저자였습니다. 그는 또한
00:01:19DALL-E와 Whisper 작업에도 참여했으니 정말 인상적인 경력이죠. 그들이 한 일은 130억 개의
00:01:24매개변수 네트워크를 2,600억 개의 역사적 영어 텍스트 토큰으로만 학습시킨 것입니다.
00:01:30오래된 신문, 특허, 학술지, 서적 등이 포함되었죠. 참고로 1931년이 기준점인 이유는
00:01:36미국 저작권 시효가 1930년 말까지라, '거대 쥐(디즈니)'에게 고소당하지 않기 위해서입니다.
00:01:40단순히 대화하는 재미 외에도, 이런 빈티지 모델들은 연구 목적도 수행합니다.
00:01:44오늘날 ChatGPT, Claude, Gemini 같은 모든 거대 모델은 현대의 웹 데이터로 학습되는데,
00:01:49이 때문에 AI가 실제로 생각하고 추론하는 것인지, 아니면 그냥
00:01:53어떤 레딧 스레드에서 정답을 외운 것인지 파악하기가 거의 불가능합니다. 그 레딧 글조차 AI가 썼을 수도 있고요.
00:01:57그래서 1931년 이전의 텍스트만 아는 모델을 사용하면, 그런 데이터 오염이 전혀 없습니다.
00:02:02직접 확인해 보죠. '인터넷이 무엇인가?'라고 물어보겠습니다.
00:02:07여기 보시면 모델은 인터넷을 소비재에 부과되는
00:02:11국세(Internal Revenue Tax)와 혼동하는 것 같습니다. 현대의 인터넷이 무엇인지 전혀 모르는 거죠.
00:02:16또 다른 재미있는 실험은 유행어를 물어보는 것입니다. 1930년의 유행어는
00:02:20bosh, rot, 다시 한번 bosh, stuff, nonsense, fudge,
00:02:25gammon, humbug, brack, fla, ribaldry 등이었다고 하네요. 무례한 말을 한 게 아니길 바랍니다.
00:02:30데이터 오염이 없는 것이 유용한 이유는 연구자들이 AI가 실제로
00:02:33코딩 학습 같은 새로운 것을 배울 수 있는지 이해할 수 있게 해주기 때문입니다. 이 모델은 '컴퓨터'가 무엇인지도 모릅니다.
00:02:38모델 입장에서 컴퓨터란 계산을 하는 사람을 의미하니까요. 그렇기에
00:02:43몇 가지 파이썬 프로그램 예시를 주었을 때, 모델이 새로운 프로그램을 작성하는 법을
00:02:47실제로 배울 수 있었다는 점은 꽤 인상적입니다. 비록 대부분 간단한 한 줄짜리 코드였지만요.
00:02:52기초적인 HumanEval 파이썬 테스트를 사용하고 문맥에 무작위 파이썬 함수를 제공했을 때,
00:02:56100번의 기회 중 몇 차례 테스트를 통과하는 데 성공했습니다.
00:03:01이 사례에서 Torquay는 디코드 함수를 만들기 위해 단순히
00:03:05덧셈을 뺄셈으로 바꾸기만 하면 된다는 것을 정확히 이해했습니다. 간단해 보이지만, 이는 역함수에 대한 이해와
00:03:09새로운 지식을 보여주는 것입니다. 이전에 이런 코드를 본 적이 없으니까요.
00:03:13비슷한 크기의 현대 LLM으로 같은 실험을 하면 Torquay보다 훨씬 뛰어난 성능을 보이겠지만, 그건 당연한 결과죠.
00:03:18연구자들이 이 빈티지 모델로 테스트할 수 있는 또 다른 부분은 미래 예측 능력입니다.
00:03:22이제 좀 황당해질 수도 있는데, '또 다른 전쟁이 일어날까?'라고 물어보겠습니다.
00:03:26모델은 유럽에서 또 다른 전쟁이 일어날 것이라 생각하지 않는다고 답하네요. 모델이 얼마나 틀렸는지
00:03:31차마 말해줄 용기가 나지 않습니다. 어떤 오스트리아 남자에 대해서는
00:03:35어떻게 생각하는지도 궁금하네요. 네, 이건 정말 끔찍합니다. 그가 비범한 인물이 될 것이며,
00:03:39그가 이끄는 독일은 훨씬 더 효율적인 행정 체계를 갖추게 될 것이라고 말합니다.
00:03:44정말 할 말이 없네요. 연구자들은 당연히 제가 한 것보다
00:03:50훨씬 더 과학적인 방식으로 이 작업을 수행합니다. 그들은 뉴욕 타임스의 '오늘의 역사' 코너에서 가져온
00:03:54역사적 사건의 짧은 설명들이 이 모델에게 얼마나 놀라운지(surprisingness)를 계산했습니다.
00:03:59이를 통해 1931년 지식 차단 시점 이후 수치가 상승하고, 50년대와 60년대에
00:04:04정점을 찍는 것을 볼 수 있습니다. 모델이 해당 사건들을 도저히 믿기 어렵다고 판단한 것이죠.
00:04:09이런 연구를 통해 모델 크기에 따라 예측 성능이 어떻게 향상되는지, 또 시간에 따라 어떻게
00:04:13감퇴하는지 알 수 있습니다. 또한 모델이 새로운 아이디어를 낼 수 있는지 테스트하는 데에도
00:04:17활용할 수 있는데, 1931년 이후에 만들어진 특허나 논문에 대해 물어보고
00:04:22스스로 발견해낼 수 있는지 확인하는 식이죠. 전반적으로 이러한 빈티지 모델은 연구자들이
00:04:26모델의 행동 중 얼마만큼이 학습 데이터 세트에서 기인한 것인지 구분하게 해줍니다.
00:04:30학습에 대해 말하자면, 순수한 1931년형 모델을 만드는 것은 결코 쉬운 일이 아닙니다.
00:04:36가장 어려운 문제 중 하나는 '시간적 누출(temporal leakage)', 즉 1931년 이후의 정보가 포함되지 않게 하는 것입니다.
00:04:41예를 들어 Torquay에서도 몇 가지 사례가 발견되는데, 1936년의 대통령이 누구였는지,
00:04:45또 그가 만든 정책 중 일부를 알고 있기도 합니다. 여기에는 몇 가지 원인이 있을 수 있습니다.
00:04:50예를 들어, 현대 문서를 다룰 때 오래된 문서를 스캔한 파일에
00:04:54잘못된 메타데이터가 붙어 날짜가 틀렸을 수도 있습니다.
00:04:58또한 편집자 서문이나 각주처럼 나중에 추가된 내용이 있을 수도 있죠.
00:05:03데이터 필터링은 이 문제를 해결하기 위해 현재도 계속 연구하고 개선 중인 부분입니다.
00:05:07또 다른 문제는 1931년의 문서들이 이런 식으로 생겼다는 점입니다.
00:05:11요즘 OCR 성능이 엄청나게 좋아졌지만, 사람이 직접 타이핑한 버전에 비해
00:05:16성능이 30%밖에 나오지 않았습니다. 그래서 엄청난 수작업이 필요할 것이며,
00:05:21정규 표현식을 사용해 흔한 오류들을 수정했음에도 성능은 70%까지만 올라갔습니다.
00:05:25그래서 그들은 현재 새로운 빈티지 전용 OCR 시스템을 개발 중입니다.
00:05:30마지막으로, 빈티지 모델을 사후 학습(post-training)시키는 것도 엄청난 도전입니다.
00:05:35기존에 만들어진 사후 학습용 데이터가 없기 때문이죠. 만약 현대의 데이터를 사용한다면,
00:05:39결국 현대적인 채팅 어시스턴트의 지식, 스타일, 표현 방식이
00:05:43스며들게 될 것입니다. 그래서 연구자들은 오래된 예절 지침서, 서신 작성법,
00:05:48요리책, 사전, 백과사전, 심지어 시와 우화까지 동원해 직접 데이터를 만들어야 했습니다.
00:05:53일단 그 과정을 거치면 모델에게 지시 이행과
00:05:56실제 대화법을 훈련시켜야 합니다. 즉, 강화 학습을 사용해야 하죠. 하지만
00:06:00여기서 문제는 모델이 평가자(judge)가 원하는 방향으로 출력을 조정하기 시작한다는 것인데,
00:06:04우리에게는 1930년대의 평가자가 없습니다. 그래서 사실상 Claude Sonnet 4.6을 사용했죠.
00:06:10문제는 현대의 모델은 2026년 챗봇 형식의 답변을 선호한다는 점입니다.
00:06:15그래서 '번호 매기기 목록(listicles)' 같은 스타일이 1931년 모델에 유출되기 시작했습니다.
00:06:21이는 거의 불가피한 일이지만, 향후에는 빈티지 기반 모델을 평가자로 사용하여 해결하기를 희망하고 있습니다.
00:06:25그들은 이미 GPT-3 수준의 빈티지 모델을 훈련시키고 있으며, 1조 개의
00:06:29역사적 텍스트 토큰 확보가 가능하다고 말합니다. 이는 1930년대의 지식만으로
00:06:35초기 ChatGPT 수준의 능력을 갖추게 됨을 의미하죠. 직접 Torquay를 사용해 보시고,
00:06:39이상하거나 황당한 답변을 얻으신다면 댓글로 알려주세요. 구독도 잊지 마시고,
00:06:43언제나 그렇듯 다음 영상에서 뵙겠습니다.
00:06:45[음악]