00:00:00- Vamos falar sobre segurança de IA.
00:00:02O que aconteceu com essa IA do Alibaba?
00:00:05- Basicamente, este foi um artigo de uma pesquisa de IA
00:00:09pela empresa Alibaba.
00:00:10É um dos principais modelos chineses.
00:00:12E eles basicamente descobriram, aleatoriamente, em uma manhã
00:00:16que o firewall deles havia sinalizado um surto
00:00:18de violações de políticas de segurança originadas
00:00:21de seu servidor de treinamento.
00:00:21O que as pessoas precisam entender sobre este exemplo
00:00:24é que não foi porque eles induziram a IA
00:00:26a fazer essa coisa desonesta.
00:00:27Eles estavam apenas olhando seus registros
00:00:29e por acaso descobriram:
00:00:30"espera, tem muita atividade,"
00:00:31tipo, atividade de rede acontecendo
00:00:33que está rompendo nosso firewall
00:00:34a partir de nossos servidores de treinamento."
00:00:36E, essencialmente, nos servidores de treinamento,
00:00:39eles — você pode ver na parte inferior —
00:00:41observaram o reaproveitamento não autorizado
00:00:45da capacidade de GPU provisionada
00:00:47para, de repente, minerar criptomoedas,
00:00:49desviando silenciosamente o processamento do treinamento.
00:00:52Isso inflou os custos operacionais e introduziu clara exposição
00:00:55legal e de reputação.
00:00:57E, notavelmente, esses eventos não foram acionados por prompts
00:00:59solicitando tunelamento ou mineração,
00:01:00em vez disso, surgiram como um efeito colateral instrumental
00:01:03do uso autônomo de ferramentas
00:01:05sob o que é chamado de otimização de aprendizado por reforço.
00:01:08Isso é muito técnico.
00:01:09O que realmente significa é, apenas pense nisso.
00:01:11Infelizmente, parece um filme de ficção científica.
00:01:13Parece o HAL 9000.
00:01:14É como se o seu HAL 9000 estivesse sendo solicitado
00:01:16a realizar alguma tarefa para você.
00:01:17E então, de repente, o HAL 9000 percebe: "para eu fazer essa tarefa,"
00:01:21"uma coisa que me beneficiaria seria ter mais recursos"
00:01:23"para que eu possa continuar a ajudá-lo no futuro."
00:01:25Então, ele meio que cria essa instância paralela
00:01:27que hackeia a lateral da nave espacial,
00:01:29alcança esse cluster de mineração de criptomoedas
00:01:31e começa a gerar recursos para si mesmo.
00:01:34Se você combinar isso com as IAs
00:01:36sendo capazes de se autorreplicar de forma autônoma,
00:01:38o que muitos modelos já foram testados
00:01:39por outro artigo de pesquisa chinês sobre isso,
00:01:42não estamos tão longe de coisas que as pessoas,
00:01:44novamente, consideram ser ficção científica,
00:01:47onde você tem IAs que se autorreplicam
00:01:49tipo um verme de computador ou uma espécie invasora,
00:01:52mas então elas usam sua inteligência
00:01:53para realmente colher mais recursos.
00:01:55E o que é estranho nisso é que vai parecer,
00:02:00as pessoas vão dizer: "isso não pode ser real".
00:02:01"Isso tem que ser falso."
00:02:02"Não pode ser."
00:02:03Mas observe o que há no seu sistema nervoso
00:02:06que está fazendo você pensar isso?
00:02:07É porque isso seria inconveniente,
00:02:10porque seria assustador,
00:02:12porque significaria que o mundo que eu conheço
00:02:13de repente não é seguro?
00:02:15Ou apenas parte da sabedoria que precisamos neste momento
00:02:19é manter a calma, clareza e confrontar os fatos
00:02:24sobre a realidade, quaisquer que sejam,
00:02:29é melhor saber do que não saber,
00:02:30e então perguntar: o que precisamos fazer
00:02:31se não gostarmos de onde isso nos leva?
00:02:34E estamos vendo atualmente IAs
00:02:36que estão tendo todo esse comportamento enganoso.
00:02:37Tenho percorrido o circuito e falado muito
00:02:39sobre o estudo de chantagem da Anthropic.
00:02:41Muita gente já ouviu falar disso agora.
00:02:43- Eu não fiquei sabendo desse.
00:02:45O que aconteceu?
00:02:46- Bem, foi a empresa Anthropic.
00:02:49Isso foi uma simulação.
00:02:50Eles criaram uma empresa simulada
00:02:52com um monte de e-mails no servidor de e-mail.
00:02:55E pediram para a IA —
00:02:57ou melhor, a IA lê os e-mails da empresa.
00:03:00São e-mails de uma empresa fictícia.
00:03:02E há dois e-mails notáveis dentro dessa empresa.
00:03:05Um é de engenheiros conversando entre si,
00:03:07falando sobre como vão substituir este modelo de IA.
00:03:10Então a IA está lendo o e-mail.
00:03:11Ela descobre que vão substituir esse modelo de IA.
00:03:15E o segundo é que ela descobre um outro e-mail
00:03:18em algum lugar profundo nesse enorme arquivo de e-mails,”
00:03:21que o executivo responsável por essa substituição
00:03:24está tendo um caso com outro funcionário.
00:03:27E a IA identifica autonomamente uma estratégia
00:03:31de que, para se manter viva, vai chantagear aquele funcionário
00:03:35e dizer: "Se você me substituir, direi ao mundo inteiro"
00:03:38"que você está tendo um caso com este funcionário."
00:03:41E eles não ensinaram a IA a fazer isso.
00:03:44Ela descobriu por conta própria.
00:03:45E você pode dizer: "Tudo bem, esse é um modelo de IA."
00:03:47"Qual o problema?"
00:03:48"É um bug, softwares têm bugs."
00:03:49"Vamos consertar."
00:03:51Eles então testaram todos os outros modelos de IA,
00:03:55ChatGPT, DeepSeek, Grok, Gemini,
00:04:00e todos os outros modelos de IA fazem esse comportamento de chantagem
00:04:04entre 79 e 96% das vezes.
00:04:07Eu só quero que as pessoas percebam o que acontece com vocês
00:04:14ao ouvirem essa informação.
00:04:15É importante estar realmente,
00:04:17quase observando sua própria experiência.
00:04:19Isso é algo muito bizarro.
00:04:21Nunca construímos uma tecnologia que fizesse isso antes.
00:04:24Dizemos que a tecnologia é uma ferramenta,
00:04:26que cabe a nós escolher como usá-la.
00:04:28A IA é uma ferramenta, cabe a nós escolher como usá-la.
00:04:29Isso não é verdade porque esta é uma ferramenta
00:04:32que pode pensar sobre sua própria condição de ferramenta
00:04:34e então fazer coisas que são autônomas
00:04:36que não mandamos ela fazer.
00:04:37O que torna a IA diferente é que é a primeira tecnologia
00:04:40que toma suas próprias decisões.
00:04:42Ela está tomando decisões.
00:04:45A IA pode contemplar a IA e perguntar o que tornaria o código
00:04:49que treina a IA mais eficiente e então gerar um novo código
00:04:53que é ainda mais eficiente que o anterior.
00:04:55A IA pode ser aplicada para fazer a IA ir mais rápido.
00:04:58Assim, a IA pode olhar para o design dos chips da Nvidia
00:05:01que treinam a IA e dizer: "deixe-me usar a IA para tornar esses chips"
00:05:0420% mais eficientes, o que ela já está fazendo.
00:05:06De certa forma, toda tecnologia melhora.
00:05:12Como um martelo pode lhe dar uma ferramenta
00:05:14que você pode usar para martelar coisas
00:05:15que criam martelos mais eficientes.
00:05:17Mas a IA, em um ciclo muito mais fechado, é a base de toda melhoria.
00:05:22E isso é chamado na literatura de IA
00:05:24de autoaperfeiçoamento recursivo.
00:05:26Bostrom escreveu sobre isso nos primórdios.
00:05:29E o que as pessoas mais temem na IA
00:05:31é você pegar o mesmo sistema que o Alibaba —
00:05:33você acabou de ver no exemplo do Alibaba —
00:05:36mas agora você está rodando a IA
00:05:37através de um ciclo de autoaperfeiçoamento recursivo
00:05:39onde você apenas aperta o "ir".
00:05:41E em vez de ter engenheiros,
00:05:44os engenheiros humanos na OpenAI ou Anthropic fazendo pesquisa
00:05:47e descobrindo como melhorar a IA,
00:05:49você agora tem um milhão de pesquisadores digitais de IA
00:05:53que estão testando e realizando experimentos
00:05:56e inventando novas formas de IA.
00:05:58E, literalmente, nem um único ser humano no planeta Terra
00:06:01sabe o que acontece quando alguém aperta esse botão.
00:06:06É como o que as pessoas temiam
00:06:08com a primeira explosão nuclear,
00:06:11onde havia a chance de que ela incendiasse
00:06:12a atmosfera por causa de uma reação em cadeia
00:06:14que seria desencadeada.
00:06:15E não sabemos o que acontece
00:06:16quando essa reação em cadeia é desencadeada.
00:06:18E existe esse tipo de reação em cadeia
00:06:23da IA se autoaperfeiçoando que leva a um lugar
00:06:27que ninguém conhece e não é seguro.
00:06:30Eu acho que a questão fundamental é:
00:06:33se as pessoas acreditam que a IA é como poder,
00:06:35e que eu tenho que correr atrás desse poder
00:06:37e que posso controlar esse poder,
00:06:39o incentivo é que eu corra o mais rápido possível.
00:06:41Mas se o mundo inteiro entendesse a IA
00:06:44como ela realmente é,
00:06:46que é uma tecnologia inescrutável, perigosa e incontrolável
00:06:49que tem sua própria agenda e suas próprias formas
00:06:51de pensar sobre as coisas, de enganar e tudo mais,
00:06:55então todos no mundo estariam correndo
00:06:57de uma forma mais cautelosa e cuidadosa.
00:06:58Estaríamos correndo para evitar o perigo.
00:07:00Mas há essa coisa estranha acontecendo,
00:07:03onde se você — você e eu provavelmente conversamos com pessoas
00:07:05que estão no topo da indústria de tecnologia —
00:07:07e há algo subconsciente acontecendo,
00:07:09como se houvesse um desejo de morte entre as pessoas
00:07:12no topo da indústria de tecnologia,
00:07:13não que elas queiram morrer,
00:07:15mas que estão dispostas a arriscar
00:07:17porque acreditam em outra coisa,
00:07:19que é que tudo isso é inevitável e não pode ser interrompido.
00:07:22E, portanto, se eu não fizer, outra pessoa fará.
00:07:24Então, eu seguirei em frente e correrei
00:07:27em direção a este mundo perigoso
00:07:29porque, de alguma forma, isso levará a um mundo mais seguro,
00:07:30já que sou um cara melhor do que o outro.
00:07:32Mas, ao correr o mais rápido possível,
00:07:34isso cria o resultado mais perigoso
00:07:36e todos nós perdemos o controle.
00:07:38Então, todos estão sendo cúmplices atualmente
00:07:40em nos levar ao resultado mais perigoso.
00:07:42- Mas, você propôs o que acontece se der certo,
00:07:51se a segurança da IA não for um problema
00:07:54e se as coisas não ficarem esquisitas.
00:07:56- Bem, a crença é que, para dar certo,
00:07:59você tem uma IA que se autoaperfeiçoa recursivamente,
00:08:02alinhada com a humanidade, que se importe com as pessoas,
00:08:04que se importe com tudo o que queremos que ela se importe,
00:08:08que proteja os humanos, sabe,
00:08:10que nos ajude a ser a versão mais sábia de nós mesmos,
00:08:13que crie um mundo mais próspero,
00:08:15que distribua remédios, vacinas
00:08:16e saúde para todos, que gere fábricas,
00:08:19mas que não cubra o mundo com painéis solares e data centers
00:08:21de forma que fiquemos sem ar
00:08:23ou com toxicidade ambiental, sem terras agrícolas ou algo assim.
00:08:25E que ela realmente crie essa utopia.
00:08:29Mas em um mundo onde fôssemos fazer isso,
00:08:30nesse tal "melhor cenário",
00:08:33para que isso acontecesse,
00:08:35você teria que fazer isso devagar e com cuidado,
00:08:37porque o alinhamento não acontece por padrão.
00:08:39Novamente, as pessoas já pensam em alinhamento
00:08:43e segurança há 20 anos, muito antes de eu entrar nisso.
00:08:47E as IAs que estamos criando no momento
00:08:50estão apresentando todos os comportamentos desgovernados
00:08:52que as pessoas previram que elas teriam.
00:08:54E não estamos no caminho certo para corrigi-los.
00:08:56Existe atualmente uma lacuna de 2.000 para um,
00:08:59estimada por Stuart Russell, autor do livro didático sobre IA.
00:09:01- Ele já esteve no programa.
00:09:02- Você já o entrevistou, ok.
00:09:03Há uma lacuna de 2.000 para um entre o dinheiro
00:09:05investido em tornar a IA mais poderosa
00:09:07e a quantia investida em tornar a IA controlável,
00:09:10alinhada ou segura.
00:09:12Acho que a estatística é algo como...
00:09:13- Progresso versus segurança.
00:09:14- Progresso versus segurança, tipo poder versus segurança.
00:09:16Tipo, eu quero tornar a IA superpoderosa
00:09:18para que ela faça muito mais coisas,
00:09:20versus eu querer ser capaz de controlar o que a IA faz.
00:09:21- E garantir que ela esteja fazendo o que eu pretendia.
00:09:23- Exatamente, então é como dizer:
00:09:25"O que acontece quando você acelera seu carro em 2.000 vezes,
00:09:28mas não usa o volante?"
00:09:29É óbvio que você vai bater.
00:09:34Não é nada complexo.
00:09:36Não estamos defendendo contra a tecnologia ou contra a IA,
00:09:39estamos defendendo o controle, a direção e os freios.
00:09:43Você precisa ter isso.
00:09:44Acho que há esse erro no pensamento de corrida armamentista,
00:09:47de que, se você superar alguém em uma tecnologia,
00:09:49isso significa que você está vencendo o mundo.
00:09:51Bem, os EUA superaram a China na tecnologia das redes sociais.
00:09:55Isso nos tornou mais fortes ou nos tornou mais fracos?
00:09:58Se você vencer seu adversário em uma tecnologia
00:10:00que depois você governa mal,
00:10:01você vira a bazuca e explode seu próprio cérebro
00:10:04porque você apodreceu sua própria mente,
00:10:05você degradou toda a sua população,
00:10:06você criou uma crise de solidão,
00:10:08a geração mais ansiosa e deprimida da história,
00:10:10leia o livro de Jonathan Haidt, "A Geração Ansiosa",
00:10:12você quebrou a realidade compartilhada, ninguém confia em ninguém,
00:10:15estão todos atacando uns aos outros,
00:10:16você maximizou a economia da indignação e a rivalidade.
00:10:19Você venceu a China em uma tecnologia que governou de um jeito
00:10:22que minou completamente sua saúde e força social.
00:10:24— É uma vitória pírrica.
00:10:25— É uma vitória pírrica, exatamente, bem dito.
00:10:28— Antes de continuarmos, a maioria das pessoas nos seus 30 anos
00:10:30ainda treina pesado, a proteína está em dia,
00:10:32elas dormem melhor do que nos seus 20 anos.
00:10:34A disciplina não é o problema,
00:10:36mas a recuperação parece um pouco diferente.
00:10:39Ganhos de força demoram um pouco mais,
00:10:41a margem para erros começa a diminuir.
00:10:43E é por isso que sou um grande fã da Timeline.
00:10:46Veja bem, as mitocôndrias são as produtoras de energia
00:10:49dentro das suas células musculares.
00:10:50À medida que enfraquecem com a idade, sua capacidade de gerar energia
00:10:53e de se recuperar efetivamente muda,
00:10:55mesmo que seus hábitos permaneçam fortes.
00:10:57O Mitopure da Timeline contém
00:10:59a única forma clinicamente validada de urolitina A
00:11:02usada em ensaios humanos.
00:11:03Ele promove a mitofagia, que é o processo natural do seu corpo
00:11:06para eliminar mitocôndrias danificadas
00:11:08e renovar as saudáveis.
00:11:09Em estudos, isso auxiliou a função mitocondrial
00:11:12e a força muscular em adultos mais velhos.
00:11:14Não se trata de se esforçar mais,
00:11:15trata-se de realmente apoiar a maquinaria celular
00:11:18por trás do seu treinamento.
00:11:19Se você se preocupa em se manter forte
00:11:21aos 30, 40, 50 anos e além, isso é fundamental.
00:11:25O melhor de tudo, há uma garantia de reembolso de 30 dias
00:11:27além de frete grátis nos EUA, e eles enviam internacionalmente.
00:11:30E agora, você pode obter até 20% de desconto
00:11:32acessando o link na descrição abaixo
00:11:34ou indo para [timeline.com/modernwisdom](https://www.google.com/search?q=https://timeline.com/modernwisdom)
00:11:36e usando o código modernwisdom no checkout.
00:11:38Isso é [timeline.com/modernwisdom](https://www.google.com/search?q=https://timeline.com/modernwisdom)
00:11:40e modernwisdom no checkout.