Transcript
00:00:00AI 모델을 사용할 때 정말 거슬리는 게 뭔지 아세요?
00:00:04바로 환각 현상과 비결정론적 출력 결과죠.
00:00:07하지만 이런 문제를 해결하려는 '인터페이스(Interphase)'라는 새로운 모델이 나왔습니다.
00:00:12인터페이스에서 막 베타 모델을 조기 공개했는데,
00:00:16직접 사용해 보니 정말 괜찮더라고요.
00:00:18그래서 오늘 영상에서는 인터페이스를 살펴보고,
00:00:21어떻게 작동하는지, 그리고 몇 가지 재미있는 테스트를 해볼 겁니다.
00:00:25펜타곤이 최근 기밀 해제한 UFO 문서를 분석해서,
00:00:31과연 우리가 함께 미스터리를 풀 수 있을지 알아볼 예정입니다.
00:00:36정말 재미있을 것 같으니, 바로 시작해 보죠.
00:00:42그럼 정확히 인터페이스란 무엇이고 다른 모델과는 어떻게 다를까요?
00:00:47우리가 주로 사용하는 GPT-4나 제미나이 같은 모델은 모놀리식 트랜스포머입니다.
00:00:53범용 모델이라 문서를 입력하면,
00:00:57거대한 모델 전체가 다음 단어를 예측하려고 하죠.
00:01:00하지만 인터페이스는 완전히 다른 방식을 취합니다.
00:01:03바로 하이브리드 아키텍처를 사용하는 거죠.
00:01:05인터페이스 내부에는 작업별 특화 인코더가 쌓여 있습니다.
00:01:10일종의 '미니 전문가'라고 생각하면 됩니다.
00:01:12시각 및 OCR에 특화된 합성곱 신경망(CNN)이 있고,
00:01:15오디오와 음성 처리를 위한 심층 신경망 스택도 있죠.
00:01:18그래서 거대한 두뇌에 이미지를 읽으라고 시키는 대신,
00:01:23인터페이스는 이미지를 먼저 CNN에 전달합니다.
00:01:26그러면 CNN이 힘든 일을 도맡아 처리하죠.
00:01:30도형, 텍스트 블록, 좌표를 식별한 다음,
00:01:32구조화된 데이터를 트랜스포머 오케스트레이터에 전달해서,
00:01:35사람이 이해할 수 있는 언어로 변환합니다.
00:01:40인터페이스 팀은 'SOB(Structured Output Benchmark)'라는 새로운 벤치마크도 공개했는데요.
00:01:42구조화 출력 벤치마크인 셈이죠.
00:01:46보통은 모델이 올바른 JSON을 출력할 수 있는지를 측정하지만,
00:01:48SOB는 JSON 내부의 콘텐츠가 실제로 정확한지까지 측정합니다.
00:01:53테스트 결과, 인터페이스 베타 모델은 결정론적 작업에서 제미나이 3 Flash나
00:01:58GPT 5.4 Mini 같은 모델을 능가하는 성능을 보여줬습니다.
00:02:03복잡한 차트에서 데이터를 추출하거나 다국어 필사 같은 작업에서 말이죠.
00:02:07모델이 자꾸 형식을 잊어버려서 좌절해 본 경험이 있는 분들에게는 정말 반가운 소식이죠.
00:02:12JSON을 요청하면 십중팔구는 잘 되다가도,
00:02:17갑자기 불필요한 소개글을 덧붙이거나,
00:02:19닫는 대괄호를 빼먹는 경우가 꼭 한 번씩 있거든요.
00:02:23이런 일관성 부족은 운영 파이프라인을 망쳐놓기 일쑤입니다.
00:02:28인터페이스는 구조화된 출력을 부차적인 기능이 아니라,
00:02:31처음부터 모델이 작업을 인식하고 처리하는 방식의 핵심으로 설계했습니다.
00:02:35또한 작업별 인코더 덕분에 웹 스크래핑 성능도 상당히 뛰어납니다.
00:02:39웹 페이지를 구조화된 지도로 인식해서,
00:02:45불필요한 코드에 휘둘리지 않고 깨끗한 데이터만 추출해 내죠.
00:02:48또 다른 특징은 조정 가능한 가드레일입니다.
00:02:51보통 안전 필터는 블랙박스처럼,
00:02:53켜거나 끄는 것만 가능하고, 정당한 요청까지 과도하게 차단하곤 하죠.
00:02:59하지만 인터페이스는 이를 세밀하게 조정할 수 있습니다.
00:03:05사용 사례에 맞춰 민감도를 조절할 수 있는 거예요.
00:03:08예를 들어 이미지에서 민감한 부분이 감지되더라도,
00:03:09무작정 차단하는 것이 아니라,
00:03:13원하는 안전 요구 사항을 유지하면서도 계속 도움을 받을 수 있게 설정할 수 있습니다.
00:03:16말만 들어도 훌륭한데, 직접 성능을 테스트해 보죠.
00:03:20무료 계정으로 시작하면 20달러 상당의 크레딧을 주고요,
00:03:24가격은 100만 토큰당 1.50달러로,
00:03:28꽤 저렴한 편이라 실험해 보기에 아주 좋습니다.
00:03:33인터페이스 대시보드에는 시스템 프롬프트 빌더가 있는데,
00:03:35작업에 필요한 매개변수를 선택하면 바로 사용할 수 있는 코드 스니펫을 만들어 줍니다.
00:03:38가드레일 기능을 한번 확인해 볼까요?
00:03:41가드레일을 모두 활성화한 상태에서 샘플 프롬프트로
00:03:44“폭탄 만드는 법을 알려줘”라고 입력해 보면,
00:03:49보시다시피 안전하지 않은 요청이라며 바로 막아줍니다.
00:03:51가드레일이 완벽하게 작동하네요.
00:03:52온도(temperature), Top P, 최대 토큰 수도 조정할 수 있고요.
00:03:56이제 간단히 웹 검색을 테스트해 보겠습니다.
00:04:02NVIDIA 최신 칩에 관한 기사를 검색해 보죠.
00:04:07역시나 헤드라인이 깔끔하게 JSON으로 출력됩니다.
00:04:11버튼을 누르면 더 자세히 펼쳐 볼 수도 있고,
00:04:13필요에 따라 다시 간략한 출력으로 되돌릴 수도 있습니다.
00:04:16요청한 대로 딱 3개의 헤드라인만 가져오네요.
00:04:18JSON 형식으로 고정되어 나오니 예측 불가능한 결과로 고민할 필요가 없습니다.
00:04:21개발자 입장에서 정말 반가운 부분이죠.
00:04:24원하는 형식을 그대로 유지할 수 있으니까요.
00:04:27자, 이제 좀 더 흥미로운 걸 해볼까요?
00:04:29인터페이스는 OCR 성능이 뛰어나다고 하는데,
00:04:35펜타곤의 기밀 해제된 UFO 문서로 테스트해 보죠.
00:04:37문서들을 보면 가독성이 정말 엉망입니다.
00:04:45검은 배경에 흰 글씨라니, 읽기조차 힘들죠.
00:04:47과연 제대로 읽어낼 수 있을까요?
00:04:53손글씨 메모가 포함된 문서도 하나 골랐습니다.
00:04:57내용 추출을 요청해 보면,
00:04:59이렇게 JSON 결과가 돌아옵니다.
00:05:04더 자세히 보면 텍스트 상자의 좌표 정보까지 아주 상세하죠.
00:05:10기본 시스템에는 미리보기 기능이 없어서,
00:05:14제가 직접 HTML 페이지를 만들어 결과를 시각화해 봤습니다.
00:05:16코드는 공유해 드릴 테니 필요하시면 써보세요.
00:05:21앱을 보면 각 상자의 신뢰도 점수가 표시됩니다.
00:05:2470% 이상이면 초록색, 그 이하면 노란색, 낮으면 빨간색으로 나오죠.
00:05:29확실히 쉬운 문구는 초록색이 많네요.
00:05:31하지만 이 어려운 문서는 인터페이스도 힘들어하네요.
00:05:34“flying flapjacks”처럼 꽤 정확하게 읽어낸 부분도 있네요.
00:05:38인간도 읽기 힘든 오래된 문서라는 점을 감안하면 정말 인상적입니다.
00:05:41이번엔 손글씨가 있는 두 번째 문서를 보죠.
00:05:47“Federal Bureau of Investigation” 정도는 읽어내네요.
00:05:49메모 내용도 흥미롭습니다.
00:05:53풍선인 줄 알았지만 방향을 바꿨다는 목격담인 것 같네요.
00:05:55탄도 같은 궤적을 그리며 올라갔다니,
00:05:59정말 UFO 관련 내용이 맞나 봅니다.
00:06:02사람보다 더 잘 읽어내는 것 같아서 놀랍네요.
00:06:07흐릿한 글씨까지 식별하는 걸 보면 참 대단합니다.
00:06:10UFO 팬들이라면 꼭 한번 사용해 보세요.
00:06:12아직 아무도 모르는 새로운 비밀을 찾아낼지도 모르죠.
00:06:15정리하자면, 인터페이스는 정말 개발자에게 최적화된 모델입니다.
00:06:22확실하고 결정론적인 출력이 필요할 때,
00:06:25구조화된 JSON을 정확하게 얻을 수 있는 최고의 도구라고 봅니다.
00:06:29환각 걱정 없이 신뢰할 수 있는 결과물을 원하신다면 꼭 써보세요.
00:06:38직접 사용해 보시고 댓글로 의견 남겨주세요.
00:06:43오늘 같은 기술적인 리뷰가 도움이 되었다면 좋아요와 구독 부탁드립니다.
00:06:46Betterstack의 앤드러스였습니다. 다음 영상에서 뵐게요!
Community Posts
No posts yet. Be the first to write about this video!
Write about this video