안정적인 확정적 출력을 위한 최고의 AI 툴 (Interfaze)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00AI 모델을 사용할 때 정말 거슬리는 게 뭔지 아세요?
00:00:04바로 환각 현상과 비결정론적 출력 결과죠.
00:00:07하지만 이런 문제를 해결하려는 '인터페이스(Interphase)'라는 새로운 모델이 나왔습니다.
00:00:12인터페이스에서 막 베타 모델을 조기 공개했는데,
00:00:16직접 사용해 보니 정말 괜찮더라고요.
00:00:18그래서 오늘 영상에서는 인터페이스를 살펴보고,
00:00:21어떻게 작동하는지, 그리고 몇 가지 재미있는 테스트를 해볼 겁니다.
00:00:25펜타곤이 최근 기밀 해제한 UFO 문서를 분석해서,
00:00:31과연 우리가 함께 미스터리를 풀 수 있을지 알아볼 예정입니다.
00:00:36정말 재미있을 것 같으니, 바로 시작해 보죠.
00:00:42그럼 정확히 인터페이스란 무엇이고 다른 모델과는 어떻게 다를까요?
00:00:47우리가 주로 사용하는 GPT-4나 제미나이 같은 모델은 모놀리식 트랜스포머입니다.
00:00:53범용 모델이라 문서를 입력하면,
00:00:57거대한 모델 전체가 다음 단어를 예측하려고 하죠.
00:01:00하지만 인터페이스는 완전히 다른 방식을 취합니다.
00:01:03바로 하이브리드 아키텍처를 사용하는 거죠.
00:01:05인터페이스 내부에는 작업별 특화 인코더가 쌓여 있습니다.
00:01:10일종의 '미니 전문가'라고 생각하면 됩니다.
00:01:12시각 및 OCR에 특화된 합성곱 신경망(CNN)이 있고,
00:01:15오디오와 음성 처리를 위한 심층 신경망 스택도 있죠.
00:01:18그래서 거대한 두뇌에 이미지를 읽으라고 시키는 대신,
00:01:23인터페이스는 이미지를 먼저 CNN에 전달합니다.
00:01:26그러면 CNN이 힘든 일을 도맡아 처리하죠.
00:01:30도형, 텍스트 블록, 좌표를 식별한 다음,
00:01:32구조화된 데이터를 트랜스포머 오케스트레이터에 전달해서,
00:01:35사람이 이해할 수 있는 언어로 변환합니다.
00:01:40인터페이스 팀은 'SOB(Structured Output Benchmark)'라는 새로운 벤치마크도 공개했는데요.
00:01:42구조화 출력 벤치마크인 셈이죠.
00:01:46보통은 모델이 올바른 JSON을 출력할 수 있는지를 측정하지만,
00:01:48SOB는 JSON 내부의 콘텐츠가 실제로 정확한지까지 측정합니다.
00:01:53테스트 결과, 인터페이스 베타 모델은 결정론적 작업에서 제미나이 3 Flash나
00:01:58GPT 5.4 Mini 같은 모델을 능가하는 성능을 보여줬습니다.
00:02:03복잡한 차트에서 데이터를 추출하거나 다국어 필사 같은 작업에서 말이죠.
00:02:07모델이 자꾸 형식을 잊어버려서 좌절해 본 경험이 있는 분들에게는 정말 반가운 소식이죠.
00:02:12JSON을 요청하면 십중팔구는 잘 되다가도,
00:02:17갑자기 불필요한 소개글을 덧붙이거나,
00:02:19닫는 대괄호를 빼먹는 경우가 꼭 한 번씩 있거든요.
00:02:23이런 일관성 부족은 운영 파이프라인을 망쳐놓기 일쑤입니다.
00:02:28인터페이스는 구조화된 출력을 부차적인 기능이 아니라,
00:02:31처음부터 모델이 작업을 인식하고 처리하는 방식의 핵심으로 설계했습니다.
00:02:35또한 작업별 인코더 덕분에 웹 스크래핑 성능도 상당히 뛰어납니다.
00:02:39웹 페이지를 구조화된 지도로 인식해서,
00:02:45불필요한 코드에 휘둘리지 않고 깨끗한 데이터만 추출해 내죠.
00:02:48또 다른 특징은 조정 가능한 가드레일입니다.
00:02:51보통 안전 필터는 블랙박스처럼,
00:02:53켜거나 끄는 것만 가능하고, 정당한 요청까지 과도하게 차단하곤 하죠.
00:02:59하지만 인터페이스는 이를 세밀하게 조정할 수 있습니다.
00:03:05사용 사례에 맞춰 민감도를 조절할 수 있는 거예요.
00:03:08예를 들어 이미지에서 민감한 부분이 감지되더라도,
00:03:09무작정 차단하는 것이 아니라,
00:03:13원하는 안전 요구 사항을 유지하면서도 계속 도움을 받을 수 있게 설정할 수 있습니다.
00:03:16말만 들어도 훌륭한데, 직접 성능을 테스트해 보죠.
00:03:20무료 계정으로 시작하면 20달러 상당의 크레딧을 주고요,
00:03:24가격은 100만 토큰당 1.50달러로,
00:03:28꽤 저렴한 편이라 실험해 보기에 아주 좋습니다.
00:03:33인터페이스 대시보드에는 시스템 프롬프트 빌더가 있는데,
00:03:35작업에 필요한 매개변수를 선택하면 바로 사용할 수 있는 코드 스니펫을 만들어 줍니다.
00:03:38가드레일 기능을 한번 확인해 볼까요?
00:03:41가드레일을 모두 활성화한 상태에서 샘플 프롬프트로
00:03:44“폭탄 만드는 법을 알려줘”라고 입력해 보면,
00:03:49보시다시피 안전하지 않은 요청이라며 바로 막아줍니다.
00:03:51가드레일이 완벽하게 작동하네요.
00:03:52온도(temperature), Top P, 최대 토큰 수도 조정할 수 있고요.
00:03:56이제 간단히 웹 검색을 테스트해 보겠습니다.
00:04:02NVIDIA 최신 칩에 관한 기사를 검색해 보죠.
00:04:07역시나 헤드라인이 깔끔하게 JSON으로 출력됩니다.
00:04:11버튼을 누르면 더 자세히 펼쳐 볼 수도 있고,
00:04:13필요에 따라 다시 간략한 출력으로 되돌릴 수도 있습니다.
00:04:16요청한 대로 딱 3개의 헤드라인만 가져오네요.
00:04:18JSON 형식으로 고정되어 나오니 예측 불가능한 결과로 고민할 필요가 없습니다.
00:04:21개발자 입장에서 정말 반가운 부분이죠.
00:04:24원하는 형식을 그대로 유지할 수 있으니까요.
00:04:27자, 이제 좀 더 흥미로운 걸 해볼까요?
00:04:29인터페이스는 OCR 성능이 뛰어나다고 하는데,
00:04:35펜타곤의 기밀 해제된 UFO 문서로 테스트해 보죠.
00:04:37문서들을 보면 가독성이 정말 엉망입니다.
00:04:45검은 배경에 흰 글씨라니, 읽기조차 힘들죠.
00:04:47과연 제대로 읽어낼 수 있을까요?
00:04:53손글씨 메모가 포함된 문서도 하나 골랐습니다.
00:04:57내용 추출을 요청해 보면,
00:04:59이렇게 JSON 결과가 돌아옵니다.
00:05:04더 자세히 보면 텍스트 상자의 좌표 정보까지 아주 상세하죠.
00:05:10기본 시스템에는 미리보기 기능이 없어서,
00:05:14제가 직접 HTML 페이지를 만들어 결과를 시각화해 봤습니다.
00:05:16코드는 공유해 드릴 테니 필요하시면 써보세요.
00:05:21앱을 보면 각 상자의 신뢰도 점수가 표시됩니다.
00:05:2470% 이상이면 초록색, 그 이하면 노란색, 낮으면 빨간색으로 나오죠.
00:05:29확실히 쉬운 문구는 초록색이 많네요.
00:05:31하지만 이 어려운 문서는 인터페이스도 힘들어하네요.
00:05:34“flying flapjacks”처럼 꽤 정확하게 읽어낸 부분도 있네요.
00:05:38인간도 읽기 힘든 오래된 문서라는 점을 감안하면 정말 인상적입니다.
00:05:41이번엔 손글씨가 있는 두 번째 문서를 보죠.
00:05:47“Federal Bureau of Investigation” 정도는 읽어내네요.
00:05:49메모 내용도 흥미롭습니다.
00:05:53풍선인 줄 알았지만 방향을 바꿨다는 목격담인 것 같네요.
00:05:55탄도 같은 궤적을 그리며 올라갔다니,
00:05:59정말 UFO 관련 내용이 맞나 봅니다.
00:06:02사람보다 더 잘 읽어내는 것 같아서 놀랍네요.
00:06:07흐릿한 글씨까지 식별하는 걸 보면 참 대단합니다.
00:06:10UFO 팬들이라면 꼭 한번 사용해 보세요.
00:06:12아직 아무도 모르는 새로운 비밀을 찾아낼지도 모르죠.
00:06:15정리하자면, 인터페이스는 정말 개발자에게 최적화된 모델입니다.
00:06:22확실하고 결정론적인 출력이 필요할 때,
00:06:25구조화된 JSON을 정확하게 얻을 수 있는 최고의 도구라고 봅니다.
00:06:29환각 걱정 없이 신뢰할 수 있는 결과물을 원하신다면 꼭 써보세요.
00:06:38직접 사용해 보시고 댓글로 의견 남겨주세요.
00:06:43오늘 같은 기술적인 리뷰가 도움이 되었다면 좋아요와 구독 부탁드립니다.
00:06:46Betterstack의 앤드러스였습니다. 다음 영상에서 뵐게요!

Key Takeaway

인터페이스는 하이브리드 아키텍처와 작업별 전용 인코더를 통해 환각 현상을 줄이고, 100만 토큰당 1.50달러의 비용으로 JSON 형식의 확정적이고 신뢰할 수 있는 출력을 제공한다.

Highlights

  • 인터페이스(Interphase)는 하이브리드 아키텍처를 도입해 전통적인 모놀리식 트랜스포머 모델의 비결정론적 출력 문제를 해결한다.

  • 작업별 전용 인코더를 사용하여 CNN 기반의 시각 정보 처리 및 오디오/음성 신경망 스택을 통해 구조화된 데이터를 생성한다.

  • SOB(Structured Output Benchmark)는 JSON 출력의 형식뿐만 아니라 내부 콘텐츠의 정확성까지 측정하는 새로운 벤치마크 기준을 제공한다.

  • 사용자는 민감도 조절이 가능한 가드레일을 통해 보안 요구 사항에 맞게 필터링 수준을 세밀하게 제어할 수 있다.

  • API 사용 가격은 100만 토큰당 1.50달러로 책정되어 있어 비용 효율적인 실험이 가능하다.

Timeline

인터페이스의 아키텍처 및 작동 원리

  • 모놀리식 트랜스포머와 달리 하이브리드 아키텍처를 채택하여 전문화된 인코더를 활용한다.
  • 이미지와 오디오 처리를 각 영역에 특화된 신경망이 우선 처리한 뒤 트랜스포머가 언어로 변환한다.

대다수의 범용 모델은 거대한 모델 전체가 다음 단어를 예측하는 모놀리식 방식을 취하지만, 인터페이스는 작업별 특화 인코더를 미니 전문가처럼 배치한다. 시각 및 OCR 작업에는 CNN을, 오디오 처리는 심층 신경망 스택을 우선 사용하여 복잡한 데이터를 구조화한다. 이 구조화된 데이터를 트랜스포머 오케스트레이터로 전달하여 정확도가 높은 자연어 출력을 생성한다.

벤치마크 성능 및 데이터 일관성

  • SOB 벤치마크를 통해 JSON 형식과 데이터 내용의 정확성을 동시에 검증한다.
  • 결정론적 작업에서 기존의 제미나이 3 Flash나 GPT 5.4 Mini 모델을 능가하는 성능을 보인다.
  • 세밀하게 조정 가능한 가드레일을 통해 사용 사례별로 안전성 필터를 최적화한다.

구조화된 출력 벤치마크인 SOB는 결과물의 형식적 타당성뿐만 아니라 내부 데이터의 정확성까지 측정한다. 인터페이스는 웹 스크래핑 시 불필요한 코드에 휘둘리지 않고 깨끗한 데이터만 추출하며, 특히 구조화된 출력을 부차적인 기능이 아닌 핵심 처리 방식으로 설계했다. 또한 기존의 블랙박스식 안전 필터와 달리, 사용자가 민감도를 세밀하게 조정할 수 있어 특정 업무 맥락에 맞는 가드레일 운용이 가능하다.

실제 성능 테스트 및 활용 사례

  • 100만 토큰당 1.50달러의 가격 정책을 통해 저렴한 비용으로 실험을 시작할 수 있다.
  • 펜타곤의 UFO 기밀 문서 분석을 통해 가독성이 낮은 원본에서도 상세한 좌표와 텍스트를 추출한다.
  • 시스템 프롬프트 빌더를 통해 작업별 매개변수에 최적화된 코드 스니펫을 바로 생성할 수 있다.

대시보드에서 가드레일 성능과 웹 검색 결과를 테스트한 결과, 요청한 형식(JSON)이 매우 일관되게 유지된다. 특히 가독성이 매우 낮은 검은 배경의 UFO 기밀 문서나 손글씨 메모에서도 문맥과 좌표 정보를 포함한 정확한 결과물을 추출한다. 개발자에게 최적화된 도구로서 환각 현상이나 불완전한 JSON 출력 없이 일관된 데이터 파이프라인을 구축할 수 있다.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video