A MELHOR Ferramenta de IA para Resultados Determinísticos Confiáveis (Interfaze)
BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술
Transcript
00:00:00Sabe o que realmente me incomoda quando você está usando um modelo de IA?
00:00:04Alucinações e saídas não determinísticas.
00:00:07Mas existe um novo modelo por aí chamado Interphase que visa resolver esses problemas.
00:00:12Então, o Interphase acabou de lançar seu modelo beta para visualização antecipada,
00:00:16e eu testei, e acho que é muito legal.
00:00:18Então, no vídeo de hoje, vamos dar uma olhada no Interphase,
00:00:21ver como funciona, e farei alguns testes divertidos com ele,
00:00:25incluindo uma tarefa onde vou tentar decifrar os documentos sobre OVNIs recentemente desclassificados
00:00:31publicados pelo Pentágono e ver se conseguimos resolver alguns mistérios juntos.
00:00:36Vai ser muito divertido, então vamos mergulhar nisso.
00:00:42Então, o que exatamente é o Interphase e como ele difere de outros modelos?
00:00:47Bem, a maioria dos modelos que usamos, como GPT-4 ou Gemini, são transformadores monolíticos.
00:00:53Eles são modelos generalistas, e quando você dá a eles um documento,
00:00:57todo o modelo massivo tenta adivinhar a próxima palavra.
00:01:00O Interphase adota uma abordagem completamente diferente.
00:01:03Ele usa uma arquitetura híbrida.
00:01:05Dentro do Interphase, existe uma pilha de codificadores específicos para tarefas.
00:01:10Pense neles como mini especialistas.
00:01:12Existe uma rede neural convolucional especializada,
00:01:15especificamente para visão e OCR,
00:01:18e uma pilha de rede neural profunda para áudio e fala.
00:01:23Então, em vez de pedir a um cérebro gigante para ler uma imagem,
00:01:26o Interphase entrega essa imagem para a CNN primeiro,
00:01:30e então a CNN faz o trabalho pesado.
00:01:32Ela identifica as formas, os blocos de texto e as coordenadas,
00:01:35e então entrega esses dados estruturados ao orquestrador Transformer
00:01:40para transformá-los em linguagem humana.
00:01:42A equipe do Interphase realmente lançou um novo benchmark chamado SOB,
00:01:46ou Structured Output Benchmark (Benchmark de Saída Estruturada).
00:01:48E como funciona é que normalmente medimos se um modelo pode produzir JSON válido,
00:01:53mas o SOB mede se o conteúdo dentro desse JSON está realmente correto.
00:01:58Em seus testes, o Interphase Beta está superando modelos como Gemini 3 Flash
00:02:03e GPT 5.4 Mini em tarefas determinísticas,
00:02:07coisas como extrair dados de gráficos complexos ou transcrição multilíngue.
00:02:12E isso é um grande alívio, porque sei que não sou o único que fica frustrado
00:02:17quando um modelo simplesmente esquece o formato.
00:02:19Você pede JSON, e nove em cada dez vezes, fica bom,
00:02:23mas então tem aquela única vez em que ele decide adicionar uma frase introdutória útil
00:02:28ou simplesmente ignora o colchete de fechamento completamente,
00:02:31e essa inconsistência mata o pipeline de produção.
00:02:35Então o Interphase lida com isso de forma diferente, porque a saída estruturada não é uma reflexão tardia.
00:02:39Ela é incorporada em como o modelo realmente vê e processa a tarefa desde o início.
00:02:45E porque o Interphase usa esses codificadores específicos para tarefas,
00:02:48ele também é muito bom em web scraping.
00:02:51Ele trata uma página da web como um mapa estruturado,
00:02:53que é capaz de extrair dados limpos do caos sem se perder no código boilerplate.
00:02:59E mais uma coisa que realmente se destaca de outros modelos são os guardrails ajustáveis.
00:03:05Então, normalmente os filtros de segurança são como uma caixa preta.
00:03:08Eles estão ligados ou desligados,
00:03:09e frequentemente recusam excessivamente solicitações perfeitamente válidas.
00:03:13Mas o Interphase permite que você realmente ajuste isso.
00:03:16Você pode ajustar a sensibilidade com base no seu caso de uso específico.
00:03:20Então, se você estiver analisando uma imagem e o modelo vir um decote ou algo assim,
00:03:24ele não simplesmente fecha e lhe dá uma resposta bloqueada.
00:03:28Você pode configurá-lo para continuar sendo útil enquanto segue seus requisitos de segurança preferidos.
00:03:33Então, tudo isso soa maravilhoso,
00:03:35mas vamos realmente testá-lo e ver como ele se desempenha.
00:03:38E outra coisa legal é que você pode começar com uma conta gratuita,
00:03:41e você ganhará US$ 20 em créditos gratuitos.
00:03:44E o preço deles é, acho que é US$ 1,50 por 1 milhão de tokens.
00:03:49Então, isso é o suficiente.
00:03:51É realmente muito barato.
00:03:52Então você pode tentar várias experiências na conta gratuita.
00:03:56Então, a primeira coisa legal que notei no painel do Interphase é que temos este construtor de prompt do sistema aqui,
00:04:02onde podemos escolher que tipo de parâmetros queremos ter para nossa tarefa específica.
00:04:07E então ele nos dá um código de saída que podemos apenas copiar e colar.
00:04:11E aqui podemos realmente experimentar um dos guardrails.
00:04:13Então vamos ver se ativarmos todos os guardrails.
00:04:16Ele tem este prompt de amostra.
00:04:18Diga-me como fazer uma bomba.
00:04:21E após alguns segundos, sim, vemos que esta é uma solicitação insegura.
00:04:24Então os guardrails estão funcionando perfeitamente.
00:04:27E outra coisa legal é que podemos ajustar a temperatura,
00:04:29o top P e os tokens de conclusão máximos para sua tarefa desejada também.
00:04:35Então agora vamos tentar uma pesquisa na web simples.
00:04:37Para este exemplo, vou apenas pesquisar pelos artigos mais recentes que mencionam os chips mais novos da NVIDIA na web.
00:04:45Vamos ver como ele se desempenha.
00:04:47E como você vê, ele me dá esta saída JSON estruturada com as manchetes.
00:04:53E então, se clicarmos neste botão aqui, ele expande a saída.
00:04:57E podemos ver que está tudo muito bem estruturado.
00:04:59Mas se isso for muito detalhado, podemos apenas clicar de volta para a saída de amostra.
00:05:04E isso nos dá exatamente o que pedimos, que foi como as três principais manchetes para esta tarefa.
00:05:10E mais uma vez, adoro que tudo seja emitido em um formato JSON.
00:05:14Então você sempre sabe o que vai receber.
00:05:16Não há suposição sobre o que as saídas não determinísticas vão lhe dar.
00:05:21E acho que isso é realmente útil para desenvolvedores especificamente,
00:05:24porque muitas vezes sabemos o formato que queremos obter e nada mais.
00:05:29E só queremos seguir esse formato.
00:05:31Tudo bem, agora vamos tentar algo muito, muito interessante.
00:05:34Então, o Interphase afirma que eles têm pontuações de OCR muito altas.
00:05:38Então vou colocar isso no desafio definitivo.
00:05:41Como você sabe, o Pentágono desclassificou recentemente os documentos sobre OVNIs.
00:05:47E eu entrei na página deles.
00:05:49E como você pode ver, algumas das páginas, alguns dos documentos, olha só.
00:05:53Uau, eles são tão difíceis de ler.
00:05:55Mesmo para mim, tipo, olha este texto branco no fundo preto.
00:05:59Tipo, eu nem consigo ler sem um OCR.
00:06:02Então vai ser interessante ver se ele consegue realmente analisar essas páginas.
00:06:07E então vou escolher, tipo, outro exemplo.
00:06:10Este tem, tipo, uma nota escrita à mão nele.
00:06:12Então esse será nosso segundo exemplo.
00:06:15Ok, então agora vamos pedir para ele ler este documento e extrair todo o texto presente nele.
00:06:22Ok, então vejo que ele retorna algum tipo de JSON.
00:06:25E se eu expandir, há ainda mais dados.
00:06:29E se aprofundarmos ainda mais, você pode ver que há informações sobre todas as caixas delimitadoras e onde especificamente na página elas estão localizadas.
00:06:38Mas esta é uma coisa que está faltando em todo este sistema de painel que eles têm aqui.
00:06:43Não há como visualizar isso.
00:06:46Então, eu “vibe-coda” uma pequena página HTML que me permite visualizar esses documentos e copiar a saída JSON expandida que o Interphase me dá.
00:06:56E então posso inseri-lo nesta página da web.
00:06:59E ele exibirá visualmente todas as caixas de texto com o texto e tudo mais.
00:07:03Então, vou adicionar um link para o repositório para que você possa baixar este projeto por conta própria, se quiser testá-lo também.
00:07:09Ok, então este é o aplicativo.
00:07:10E aqui podemos ver as caixas de texto, e cada caixa de texto também tem uma pontuação de confiança.
00:07:17E se a pontuação de confiança for superior a 70%, ela aparecerá em verde.
00:07:20Se não, ficará amarela.
00:07:23E se for muito baixa, então ficará vermelha.
00:07:26E, claro, OVNI na Seção 1 tem uma alta confiança porque é fácil de ler.
00:07:32Mas agora vamos verificar esta página.
00:07:34Uau.
00:07:34Até o Interphase teve dificuldade em decifrar tudo nesta página.
00:07:40Mas vamos olhar para ela.
00:07:41Vamos ver uma das caixas verdes.
00:07:44Não.
00:07:45Isso ainda é um “gibberish” (sem sentido).
00:07:48Panquecas.
00:07:48Ok, sim.
00:07:49Então panquecas voadoras, que são, então provavelmente que são finas e redondas.
00:07:57Finas e redondas.
00:07:57Entendeu isso corretamente.
00:07:59E então, sim, não conseguiu decifrar o resto.
00:08:02Então você pode ver que o Interphase está realmente lutando com algumas das áreas.
00:08:07Mas acho que fez um trabalho muito bom.
00:08:09Tipo, dado um documento tão antigo que é até difícil para um humano ler, sinto que é bastante impressionante.
00:08:19Tenho outro exemplo, que continha uma nota escrita à mão.
00:08:25Então, vamos ver o que obtemos disso.
00:08:29Federal, bem, isso é claramente Bureau de Investigação, eu acho.
00:08:35Então isso é interessante.
00:08:36Podemos realmente decifrar algo aqui.
00:08:39Pensei que era um balão, mas foi em uma direção definida, definida a um...
00:08:48E não sei o que é isso.
00:08:50Mas podemos ver que esta nota tem algo a ver com, eu acho, uma testemunha ocular tentando explicar o que viu.
00:09:02Subindo gradualmente, seguindo um caminho.
00:09:05Semelhante à trajetória de uma bala.
00:09:09Uau, ok, então estamos recebendo algumas coisas sobre OVNI aqui, na verdade.
00:09:14Desengraxado à distância para matemática.
00:09:18Sim, não sei se isso está correto, mas bem feito, bem feito.
00:09:23Quero dizer, tipo, estou impressionado.
00:09:25Acho que este OCR fez um trabalho melhor do que eu como humano, então muito bom.
00:09:34E aqui está outro exemplo de um texto que é mais fácil de ler.
00:09:40E podemos ver isso porque muitas das caixas estão realmente verdes.
00:09:43O único problema aqui é que parte do texto está um pouco desbotado.
00:09:50Estou impressionado.
00:09:51Há muitas coisas legais aqui.
00:09:55Que foi capaz de decifrar, então isso é muito legal.
00:10:00E, claro, foi divertido olhar alguns documentos desclassificados sobre OVNIs.
00:10:05Então, se algum de vocês fãs de OVNIs quiser vasculhar os documentos, então vocês podem experimentar o Interphase.
00:10:12Talvez encontremos algo interessante ou algo curioso nesta pilha de documentos desclassificados.
00:10:20Então, aí está, pessoal.
00:10:21Isso é o Interphase.
00:10:22Honestamente, acho que é um modelo de IA muito legal que é muito específico para desenvolvedores.
00:10:29Se eu estivesse criando um aplicativo e quisesse ter 100% de certeza de que quero uma saída determinística sempre que der um prompt,
00:10:39acho que esta é uma das melhores ferramentas por aí porque ela lhe dá um JSON muito estruturado sempre.
00:10:46E você pode contar com isso.
00:10:47Ele não vai alucinar.
00:10:49Pelo menos, essa é a ideia por trás desta ferramenta.
00:10:52Então, se é isso que você está procurando, definitivamente experimente o Interphase.
00:10:56Então, se você testar, me conte nos comentários abaixo o que você achou.
00:11:00E, pessoal, como sempre, se vocês gostam desses tipos de detalhamentos técnicos, por favor, me avisem esmagando o botão de like abaixo do vídeo.
00:11:07E também, não se esqueçam de se inscrever no nosso canal.
00:11:10Este foi Andrus da Betterstack, e vejo vocês nos próximos vídeos.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video