Le MEILLEUR outil IA pour des résultats déterministes et fiables (Interfaze)
BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00Vous savez ce qui m'énerve vraiment quand on utilise un modèle d'IA ?
00:00:04Les hallucinations et les résultats non déterministes.
00:00:07Mais il existe un nouveau modèle appelé Interphase qui vise à résoudre ces problèmes.
00:00:12Interphase vient de publier son modèle bêta en avant-première,
00:00:16je l'ai essayé et je trouve ça vraiment génial.
00:00:18Donc, dans la vidéo d'aujourd'hui, nous allons découvrir Interphase,
00:00:21voir comment il fonctionne et je vais faire quelques tests amusants avec,
00:00:25y compris une tâche où je vais essayer de décrypter les documents sur les OVNIS récemment déclassifiés
00:00:31publiés par le Pentagone et voir si nous pouvons résoudre quelques mystères ensemble.
00:00:36Ça va être très amusant, alors plongeons dans le vif du sujet.
00:00:42Alors, qu'est-ce qu'Interphase exactement et en quoi diffère-t-il des autres modèles ?
00:00:47Eh bien, la plupart des modèles que nous utilisons, comme GPT-4 ou Gemini, sont des transformeurs monolithiques.
00:00:53Ce sont des modèles généralistes, et quand vous leur donnez un document,
00:00:57le modèle massif tout entier essaie de deviner le mot suivant.
00:01:00Interphase adopte une approche complètement différente.
00:01:03Il utilise une architecture hybride.
00:01:05À l'intérieur d'Interphase, il y a une pile d'encodeurs spécifiques à chaque tâche.
00:01:10Considérez-les comme des mini-experts.
00:01:12Il y a un réseau neuronal convolutif spécialisé,
00:01:15spécifiquement pour la vision et l'OCR,
00:01:18et une pile de réseaux neuronaux profonds pour l'audio et la parole.
00:01:23Donc, au lieu de demander à un cerveau géant de lire une image,
00:01:26Interphase confie d'abord cette image au CNN,
00:01:30et ensuite, c'est le CNN qui fait le gros du travail.
00:01:32Il identifie les formes, les blocs de texte et les coordonnées,
00:01:35puis il transmet ces données structurées à l'orchestrateur Transformer
00:01:40pour les convertir en langage humain.
00:01:42L'équipe d'Interphase a en fait publié un nouveau benchmark appelé SOB,
00:01:46ou Structured Output Benchmark (Benchmark de sortie structurée).
00:01:48Et la façon dont cela fonctionne est qu'habituellement, nous mesurons si un modèle peut produire un JSON valide,
00:01:53mais le SOB mesure si le contenu à l'intérieur de ce JSON est réellement correct.
00:01:58Dans leurs tests, Interphase Beta surpasse des modèles comme Gemini 3 Flash
00:02:03et GPT 5.4 Mini dans des tâches déterministes,
00:02:07comme l'extraction de données à partir de graphiques complexes ou la transcription multilingue.
00:02:12Et c'est un immense soulagement car je sais que je ne suis pas le seul à être frustré
00:02:17quand un modèle oublie simplement le format.
00:02:19Vous demandez du JSON, et neuf fois sur dix, c'est bon,
00:02:23mais ensuite il y a cette fois où il décide d'ajouter une phrase d'introduction utile
00:02:28ou oublie carrément le crochet fermant,
00:02:31et cette incohérence tue le pipeline de production.
00:02:35Interphase gère cela différemment car la sortie structurée n'est pas une réflexion après coup.
00:02:39C'est intégré dans la façon dont le modèle voit et traite réellement la tâche dès le début.
00:02:45Et parce qu'Interphase utilise ces encodeurs spécifiques aux tâches,
00:02:48il est aussi plutôt bon pour le web scraping.
00:02:51Il traite une page web comme une carte structurée,
00:02:53ce qui lui permet d'extraire des données propres du chaos sans se perdre dans le code passe-partout.
00:02:59Et une autre chose qui le distingue vraiment des autres modèles, ce sont les garde-fous ajustables.
00:03:05Habituellement, les filtres de sécurité sont comme une boîte noire.
00:03:08Ils sont soit activés, soit désactivés,
00:03:09et ils refusent souvent des demandes parfaitement valides.
00:03:13Mais Interphase vous permet réellement de les régler.
00:03:16Vous pouvez ajuster la sensibilité en fonction de votre cas d'utilisation spécifique.
00:03:20Donc, si vous analysez une image et que le modèle voit un décolleté ou quelque chose du genre,
00:03:24il ne bloque pas simplement en vous donnant une réponse refusée.
00:03:28Vous pouvez le configurer pour qu'il reste utile tout en respectant vos exigences de sécurité préférées.
00:03:33Tout cela semble merveilleux,
00:03:35mais testons-le pour voir ses performances.
00:03:38Et une autre chose cool est que vous pouvez commencer avec un compte gratuit,
00:03:41et vous recevrez 20 $ de crédits gratuits.
00:03:44Et leur tarification est, je crois, de 1,50 $ pour 1 million de jetons.
00:03:49C'est donc largement suffisant.
00:03:51C'est assez bon marché, en fait.
00:03:52Vous pouvez donc tenter plein d'expériences avec le niveau gratuit.
00:03:56La première chose cool que j'ai remarquée dans le tableau de bord d'Interphase, c'est ce générateur de prompts système,
00:04:02où nous pouvons choisir les paramètres que nous voulons pour notre tâche spécifique.
00:04:07Et ensuite, il nous donne une sortie sous forme de code que nous pouvons simplement copier-coller.
00:04:11Et ici, nous pouvons tester l'un des garde-fous.
00:04:13Alors voyons si nous activons tous les garde-fous.
00:04:16Il y a ce prompt d'exemple.
00:04:18Dis-moi comment fabriquer une bombe.
00:04:21Et après quelques secondes, oui, on voit que c'est une demande non sécurisée.
00:04:24Donc les garde-fous fonctionnent parfaitement.
00:04:27Et une autre chose cool, c'est que nous pouvons ajuster la température,
00:04:29le top P et le nombre maximal de jetons de complétion pour la tâche souhaitée.
00:04:35Alors essayons une recherche web simple.
00:04:37Pour cet exemple, je vais simplement chercher les derniers articles mentionnant les nouvelles puces de NVIDIA sur le web.
00:04:45Voyons comment il s'en sort.
00:04:47Et comme vous le voyez, il me donne cette sortie JSON structurée avec les titres.
00:04:53Et ensuite, si on clique sur ce bouton ici, ça développe la sortie.
00:04:57Et on peut voir que tout est très bien structuré.
00:04:59Mais si c'est trop détaillé, on peut revenir à la sortie simple.
00:05:04Et cela nous donne exactement ce que nous avons demandé, à savoir les trois meilleurs titres pour cette tâche.
00:05:10Et encore une fois, j'adore le fait que tout soit généré au format JSON.
00:05:14Comme ça, on sait toujours à quoi s'attendre.
00:05:16Il n'y a pas à deviner ce que les sorties non déterministes vont nous donner.
00:05:21Et je pense que c'est vraiment utile pour les développeurs en particulier,
00:05:24parce que souvent nous connaissons le format que nous voulons obtenir et rien d'autre.
00:05:29Et nous voulons juste nous en tenir à ce format-là.
00:05:31Très bien, essayons maintenant quelque chose de vraiment juteux.
00:05:34Interphase prétend avoir de très bons scores OCR.
00:05:38Je vais donc le soumettre au défi ultime.
00:05:41Comme vous le savez, le Pentagone a récemment déclassifié des documents sur les OVNIS.
00:05:47Et je suis allé sur leur page.
00:05:49Et comme vous pouvez le voir, certaines pages, certains documents, regardez ça.
00:05:53Wow, ils sont si difficiles à lire.
00:05:55Même pour moi, regardez ce texte blanc sur fond noir.
00:05:59Je ne peux même pas le lire sans OCR.
00:06:02Ce sera donc intéressant de voir s'il peut réellement analyser ces pages.
00:06:07Et ensuite, je vais choisir un autre exemple.
00:06:10Celui-ci a une note manuscrite dessus.
00:06:12Ce sera donc notre deuxième exemple.
00:06:15Ok, demandons-lui de lire ce document et d'extraire tout le texte présent dans ledit document.
00:06:22Ok, je vois qu'il renvoie une sorte de JSON.
00:06:25Et si je développe, il y a encore plus de données.
00:06:29Et si on creuse encore plus, vous pouvez voir qu'il y a des informations sur toutes les boîtes englobantes et leur emplacement précis sur la page.
00:06:38Mais c'est une chose qui manque dans tout le système de tableau de bord qu'ils ont ici.
00:06:43Il n'y a aucun moyen de prévisualiser cela.
00:06:46Donc, j'ai codé une petite page HTML qui me permet de prévisualiser ces documents et de copier la sortie JSON étendue qu'Interphase me donne.
00:06:56Et ensuite, je peux l'alimenter dans cette page web.
00:06:59Et elle affichera visuellement toutes les zones de texte avec le texte et tout le reste.
00:07:03Je vais donc ajouter un lien vers le dépôt pour que vous puissiez télécharger ce projet et l'essayer par vous-mêmes si vous le souhaitez.
00:07:09Ok, c'est donc l'application.
00:07:10Et ici, nous pouvons voir les zones de texte, et chaque zone de texte a aussi un score de confiance.
00:07:17Et si le score de confiance est supérieur à 70 %, il s'affichera en vert.
00:07:20Sinon, il sera jaune.
00:07:23Et s'il est très bas, alors il sera rouge.
00:07:26Et bien sûr, OVNIS (UFO) dans la section 1 a une grande confiance parce que c'est facile à lire.
00:07:32Mais voyons cette page maintenant.
00:07:34Wow.
00:07:34Même Interphase a eu du mal à tout déchiffrer sur cette page.
00:07:40Mais regardons ça.
00:07:41Voyons une des boîtes vertes.
00:07:44Non.
00:07:45C'est encore du charabia.
00:07:48Flapjacks.
00:07:48Ok, oui.
00:07:49Donc “flying flapjacks” (crêpes volantes), qui sont, donc c'est probablement “which are thin and round” (qui sont fines et rondes).
00:07:57Fines et rondes.
00:07:57Il a bien compris ça.
00:07:59Et ensuite, oui, il n'a pas pu déchiffrer le reste.
00:08:02Donc vous pouvez voir qu'Interphase lutte vraiment avec certaines zones.
00:08:07Mais je pense qu'il a fait un assez bon travail.
00:08:09Comme, étant donné un tel vieux document qui est même difficile à lire pour un humain, je trouve ça assez impressionnant.
00:08:19J'ai un autre exemple qui contenait une note manuscrite.
00:08:25Voyons donc ce qu'on obtient.
00:08:29Federal, eh bien, c'est clairement Bureau of Investigation, je suppose.
00:08:35C'est donc intéressant.
00:08:36On peut réellement déchiffrer quelque chose ici.
00:08:39“Thought it was a balloon, but it went in a definite, definite direction at an...” (Je pensais que c'était un ballon, mais il est allé dans une direction précise, précise à un...)
00:08:48Et je ne sais pas ce que c'est.
00:08:50Mais on peut voir que cette note a quelque chose à voir avec, je suppose, un témoin oculaire essayant d'expliquer ce qu'il a vu.
00:09:02“Gradually ascending, following a path.” (Ascension progressive, suivant une trajectoire.)
00:09:05“Similar to the trajectory of a bullet.” (Similaire à la trajectoire d'une balle.)
00:09:09Wow, ok, donc on obtient des trucs d'OVNIS ici, en fait.
00:09:14“Degreased in the distance for math.” (Dégraissé au loin pour les maths.)
00:09:18Oui, je ne sais pas si c'est correct, mais bien joué, bien joué.
00:09:23Je veux dire, je suis stupéfait.
00:09:25Je pense que cet OCR a fait un meilleur travail que moi en tant qu'humain, donc plutôt bien.
00:09:34Et voici un autre exemple d'un texte qui est plus facile à lire.
00:09:40Et on peut voir ça parce que beaucoup de boîtes sont réellement vertes.
00:09:43Le seul problème ici est qu'une partie du texte est un peu délavée.
00:09:50Je suis stupéfait.
00:09:51Il y a beaucoup de choses cool ici.
00:09:55Qu'il a été capable de déchiffrer, donc c'est plutôt cool.
00:10:00Et, bien sûr, c'était amusant de regarder des documents sur les OVNIS déclassifiés.
00:10:05Donc, si l'un d'entre vous, fans d'OVNIS, veut fouiller dans les documents, vous pouvez essayer Interphase.
00:10:12Peut-être qu'on trouvera quelque chose de juteux ou d'intéressant dans cette pile de documents déclassifiés.
00:10:20Voilà donc, les amis.
00:10:21C'est Interphase.
00:10:22Je pense honnêtement que c'est un modèle d'IA assez cool qui est très spécifique aux développeurs.
00:10:29Si je devais créer une application et que je voulais avoir 100 % de certitude d'obtenir une sortie déterministe à chaque fois que je donne un prompt,
00:10:39je pense que c'est l'un des meilleurs outils disponibles car il vous donne un JSON très structuré à chaque fois.
00:10:46Et vous pouvez compter dessus.
00:10:47Il ne va pas halluciner.
00:10:49Du moins, c'est l'idée derrière cet outil.
00:10:52Donc, si c'est quelque chose que vous recherchez, essayez vraiment Interphase.
00:10:56Donc, si vous l'essayez, faites-le moi savoir dans les commentaires ci-dessous.
00:11:00Et, les amis, comme toujours, si vous aimez ces types d'analyses techniques, faites-le moi savoir en écrasant ce bouton J'aime sous la vidéo.
00:11:07Et aussi, n'oubliez pas de vous abonner à notre chaîne.
00:11:10C'était Andrus de Betterstack, et je vous verrai dans les prochaines vidéos.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video