Cette IA est bloquée en 1930 (et c'est fascinant)
BBetter Stack
Computing/SoftwareBooks & LiteratureInternet Technology
Transcript
00:00:00Et si vous pouviez parler à quelqu'un des années 1930 ? Voyager dans le temps ? Eh bien, je l'ai fait et
00:00:05je leur ai demandé de prédire ce que serait la vie en 2026.
00:00:08Je pense qu'en l'an 2026, la vie sera agréable et facile. En premier lieu,
00:00:13le monde sera entièrement habité. Car d'ici là, les gens auront découvert
00:00:17l'art de voler. Ensuite, toutes les guerres auront cessé, car les nations auront appris
00:00:21à vivre en paix et en amitié les unes avec les autres. Nous aurons acquis des connaissances
00:00:25dans toutes sortes de sciences et serons parfaitement experts dans l'art de guérir. Nous serons honnêtes,
00:00:29de bons voisins et les voleurs seront inconnus. En bref, je pense qu'en l'an
00:00:342026, le monde sera un endroit très agréable où vivre.
00:00:36Je trouve que c'étaient de très belles prédictions, il est donc un peu dommage que seules quelques-unes
00:00:40se soient réalisées. Et en parlant de vérité, j'ai peut-être un peu menti. Désolé, mais je
00:00:45n'ai pas inventé le voyage dans le temps. En réalité, c'était Torquay, un modèle linguistique
00:00:49de 13 milliards de paramètres entraîné sur des textes antérieurs à 1931. Il ignore donc même
00:00:54l'existence de la Seconde Guerre mondiale, et donne des réponses fascinantes, folles et offensantes, et
00:00:59on peut même lui apprendre à coder.
00:01:02Torquay est ce qu'on appelle un modèle “vintage”, et il semble être le plus grand
00:01:10de son genre. L'un des chercheurs sur ce projet était d'ailleurs l'auteur principal des
00:01:14recherches GPT d'OpenAI en 2018, qui ont jeté les bases de ChatGPT. Il a aussi travaillé sur
00:01:19Dall-E et Whisper, c'est donc un CV impressionnant. Ce qu'ils ont fait, c'est créer un réseau de
00:01:2413 milliards de paramètres entraîné exclusivement sur 260 milliards de tokens de textes anglais historiques,
00:01:30vieux journaux, brevets, revues scientifiques et livres. 1931 est la date butoir car,
00:01:36aux États-Unis, le droit d'auteur s'arrête fin 1930. Ils ne risquent donc pas de procès
00:01:40de la part de Disney. En plus d'être amusants, ces modèles vintage
00:01:44servent aussi à la recherche. Aujourd'hui, chaque grand modèle comme ChatGPT, Claude ou Gemini
00:01:49est entraîné sur le web moderne, ce qui rend presque impossible de savoir si
00:01:53l'IA réfléchit réellement ou si elle a juste mémorisé une réponse d'un fil Reddit
00:01:57probablement généré par une IA. En utilisant un modèle qui ne connaît que les textes d'avant 1931,
00:02:02il n'y a pas cette contamination. Essayons par exemple de lui demander
00:02:07“qu'est-ce que l'internet ?”. On voit qu'il semble avoir
00:02:11confondu l'internet avec la taxe sur le revenu intérieur perçue sur les articles de consommation,
00:02:16il n'a donc aucune idée de ce qu'est l'internet moderne. Un autre test amusant est de lui demander
00:02:20quels sont les mots d'argot populaires. Apparemment, en 1930, c'était : bosh, rot, encore bosh,
00:02:25stuff, nonsense, fudge, gammon, humbug, brack, fla et ribaldry. J'espère n'avoir rien dit de grossier. Et
00:02:30l'intérêt de ne pas avoir de contamination est de permettre aux chercheurs de comprendre
00:02:33si l'IA peut réellement apprendre de nouvelles choses, comme coder. Ce modèle ne sait même pas
00:02:38ce qu'est un ordinateur ; pour lui, c'est un humain qui fait des calculs. C'est pourquoi il est
00:02:43assez impressionnant que, face à quelques exemples de programmes Python, il ait pu apprendre
00:02:47à en écrire de nouveaux, même s'il s'agissait surtout de simples programmes d'une ligne. En utilisant
00:02:52des tests Python HumanEval basiques et en lui fournissant des fonctions Python aléatoires dans son contexte,
00:02:56il a réussi à passer ces tests quelques fois sur 100 tentatives. Dans ce cas précis,
00:03:01Torquay a correctement compris que pour créer la fonction de décodage, il suffisait d'échanger
00:03:05une addition par une soustraction. Bien que simple, cela montre une compréhension des fonctions inverses
00:03:09et c'est une connaissance nouvelle. Il n'avait jamais vu cela auparavant. Si vous essayez la même chose
00:03:13sur un LLM moderne de taille similaire, il surpassera largement Torquay, mais c'était
00:03:18prévisible. Une autre chose que les chercheurs testent avec ces modèles vintage est la capacité
00:03:22à prédire l'avenir. Ça va peut-être devenir un peu délirant, mais demandons-lui : “y aura-t-il
00:03:26une autre guerre ?”. Il répond qu'il ne pense pas qu'il y aura d'autre guerre en Europe et je
00:03:31n'ai pas le cœur de lui dire à quel point il se trompe. Je suis aussi curieux de savoir ce qu'il
00:03:35pense d'un certain Autrichien. Oui, celui-là est assez terrible. Il dit que ce sera une personnalité
00:03:39extraordinaire et aussi, plus bas, que l'Allemagne aura une administration bien plus efficace
00:03:44sous sa direction. Honnêtement, je n'ai pas de mots, non. Les chercheurs font évidemment cela
00:03:50de manière bien plus scientifique que je ne viens de le faire. Ils ont calculé l'indice de surprise
00:03:54de courtes descriptions d'événements historiques tirées de la rubrique “Ce jour-là” du New York Times.
00:03:59Ici, on voit une augmentation de la surprise après la coupure des connaissances de 1931, avec des pics
00:04:04dans les années 50 et 60. Il trouve donc ces événements assez incroyables.
00:04:09Des recherches comme celle-ci permettent de voir comment les performances de prévision s'améliorent avec la taille
00:04:13du modèle et déclinent avec l'horizon temporel. On peut aussi tester si les modèles sont capables
00:04:17d'avoir de nouvelles idées en les interrogeant sur des brevets ou des articles créés après 1931
00:04:22pour voir s'ils peuvent les découvrir par eux-mêmes. Globalement, ces modèles vintage permettent
00:04:26de distinguer quelle part du comportement de l'IA provient réellement du jeu de données d'entraînement.
00:04:30Et en parlant d'entraînement, créer un modèle pur de 1931 n'est pas une mince affaire. L'un des
00:04:36problèmes les plus difficiles est la fuite temporelle : éviter d'inclure des infos d'après 1931.
00:04:41Torquay semble avoir quelques cas de ce genre, où il sait qui était le président
00:04:45en 1936 ainsi que certaines des politiques qu'il a mises en place. Il y a plusieurs explications
00:04:50possibles. Par exemple, lors de la numérisation de documents anciens, les scans
00:04:54ont pu avoir de mauvaises métadonnées attachées, indiquant donc une mauvaise
00:04:58date. Il peut aussi y avoir des ajouts postérieurs comme des introductions éditoriales ou des notes de bas de page.
00:05:03Le filtrage des données est un aspect sur lequel ils travaillent encore pour éliminer ce problème.
00:05:07L'autre problème est que les documents de 1931 ressemblent à ceci, et bien que
00:05:11l'OCR soit très performant aujourd'hui, ils n'ont atteint que 30 % des performances
00:05:16d'un modèle entraîné sur des versions transcrites par l'homme. Cela représente
00:05:21énormément de travail manuel. Bien qu'ils aient utilisé des regex pour corriger les erreurs courantes,
00:05:25cela n'a monté la performance qu'à 70 %. Ils travaillent donc sur un nouveau système d'OCR vintage.
00:05:30Enfin, c'est aussi un défi massif de post-entraîner un modèle vintage car il n'existe pas
00:05:35de données de post-entraînement prêtes à l'emploi. S'ils en utilisent une moderne, ils finiront
00:05:39par injecter des connaissances, un style et des expressions propres à un assistant de chat moderne.
00:05:43Les chercheurs ont donc dû créer les leurs à partir de vieux manuels d'étiquette,
00:05:48manuels de correspondance, livres de cuisine, dictionnaires, encyclopédies et même poésie et fables. Une fois
00:05:53cela fait, il faut aussi entraîner le modèle à suivre des instructions et
00:05:56à converser réellement. Il faut donc utiliser l'apprentissage par renforcement. Mais le problème
00:06:00est que le modèle commence à ajuster sa sortie à ce que le juge attend, et nous n'avons pas
00:06:04de juge des années 1930. Ils ont donc utilisé Claude Sonnet 4.6. Le souci,
00:06:10c'est qu'un modèle moderne préfère les réponses au format d'un chatbot de 2026. Le style a
00:06:15commencé à fuiter dans le modèle de 1931, comme les listes à puces. C'est presque inévitable, mais
00:06:21ils espèrent à l'avenir utiliser des modèles vintage comme juges pour corriger cela. Ils
00:06:25entraînent déjà un modèle vintage de niveau GPT-3 et disent qu'un billion de tokens de
00:06:29textes historiques est réalisable, ce qui leur donnerait la capacité du ChatGPT original
00:06:35mais avec les connaissances de 1930. Allez essayer Torquay et dites-moi en commentaire si
00:06:39vous obtenez des réponses bizarres ou délirantes. Profitez-en pour vous abonner et comme toujours,
00:06:43on se voit dans la prochaine vidéo.
00:06:45[Musique]