El gobierno de EE. UU. acaba de PROHIBIR Mythos

BBetter Stack
컴퓨터/소프트웨어경제 뉴스AI/미래기술

Transcript

00:00:00Esto es una auténtica locura.
00:00:01El gobierno de EE. UU. acaba de ordenar a Anthropic que desactive Fable 5 y Mythos 5 para todos los clientes.
00:00:06Anthropic acaba de tuitear,
00:00:07El gobierno de EE. UU., citando autoridades de seguridad nacional,
00:00:10ha emitido una directiva de control de exportaciones para suspender todo acceso a Fable 5 y Mythos 5
00:00:14por parte de cualquier ciudadano extranjero, ya sea dentro o fuera de Estados Unidos,
00:00:18incluidos los empleados extranjeros de Anthropic.
00:00:21El efecto neto de esta orden es que debemos desactivar abruptamente Fable 5 y Mythos 5
00:00:25para todos los clientes para garantizar el cumplimiento.
00:00:27El acceso a todos los demás modelos de Anthropic no se verá afectado.
00:00:30¿Qué demonios está pasando?
00:00:37Así que pensé en probarlo muy rápido y parece que todavía tengo Fable
00:00:40y todavía funciona, está respondiendo.
00:00:42Así que vayan y usen su suscripción de Fable muy rápido, están a punto de perderla.
00:00:46Aquí está la declaración oficial completa de Anthropic que profundiza un poco en lo que sucedió aquí.
00:00:50Comienza con el tuit que acabo de leer.
00:00:52Podemos ver aquí que recibimos la directiva del gobierno hoy a las 5:21 p. m.,
00:00:55eso es esencialmente hace unas cuatro horas.
00:00:58Y dice que la carta no proporcionó detalles específicos de su preocupación por la seguridad nacional.
00:01:02Nuestro entendimiento es que el gobierno cree que ha tomado conocimiento de un método para eludir
00:01:05o hackear Fable 5.
00:01:07Hemos revisado una demostración de esta técnica específica utilizada para identificar un pequeño número
00:01:11de vulnerabilidades menores previamente conocidas.
00:01:13Estas vulnerabilidades parecen ser relativamente simples
00:01:15y hemos descubierto que otros modelos disponibles públicamente son capaces de descubrirlas también sin
00:01:20necesitar eludir nada.
00:01:21El resumen de todo esto es que el gobierno de EE. UU. ha encontrado un hackeo que permitirá a Fable 5
00:01:25encontrar vulnerabilidades en muchos programas y Anthropic básicamente dice que eso es una estupidez
00:01:30y que todo lo que encontró eran vulnerabilidades públicas y que otros modelos pueden encontrarlas.
00:01:35Honestamente me sorprendería bastante si existiera un hackeo que permitiera a Fable 5
00:01:38esquivar todas sus restricciones de ciberseguridad porque, como dice Anthropic aquí,
00:01:43cuando lanzaron Fable, tenían un montón de salvaguardias,
00:01:45instituyeron salvaguardias sólidas que redujeron en gran medida la probabilidad de que Fable fuera mal utilizado
00:01:49y, de hecho, nuestras salvaguardias son tan fuertes que muchos usuarios se han quejado de que son demasiado amplias.
00:01:53Lo cual sí, eso es prácticamente todo lo que he visto experimentar a la gente, básicamente si mencionas
00:01:57cualquier cosa cercana a la ciberseguridad, Fable simplemente diría que no.
00:02:00Continúan diciendo aquí que, al parecer, en las semanas previas al lanzamiento de Fable,
00:02:03Anthropic trabajó con el gobierno de EE. UU., el AISI del Reino Unido, múltiples organizaciones privadas de terceros
00:02:08y equipos internos para someter a pruebas de penetración (red team) las salvaguardias de Fable durante miles de horas en total
00:02:13y estas pruebas mostraron que las salvaguardias de Fable son sustancialmente más efectivas que las de cualquier
00:02:17modelo desplegado anteriormente y ningún evaluador ha podido encontrar un hackeo universal.
00:02:21Así que básicamente nadie puede encontrar una manera de eludir todas sus restricciones, pero puede que haya habido
00:02:25algunos hackeos específicos aquí o allá que podrían eludir una o dos de las restricciones.
00:02:29Y eso tiene sentido para mí, siempre es un juego del gato y el ratón encontrar estos hackeos y
00:02:32detenerlos, y podemos ver aquí abajo que Anthropic realmente sospecha que una resistencia perfecta
00:02:36a los hackeos no es posible actualmente para ningún proveedor de modelos. Todas las salvaguardias utilizadas en la
00:02:40industria son vulnerables a hackeos no universales que pueden extraer alguna información cibernética
00:02:44en circunstancias específicas y es probable que eventualmente se encuentren hackeos universales en
00:02:49el futuro, y lo declararon claramente cuando lanzaron Fable 5. Tengo que estar de acuerdo con eso,
00:02:54no sé cómo se podría tener una protección perfecta contra hackeos, quiero decir, sigo a Pliny en Twitter
00:02:58y literalmente para cualquier modelo de cualquier proveedor, a las pocas horas de su lanzamiento parece encontrar
00:03:03alguna forma de hackeo. Anthropic era bastante consciente de esto cuando lanzaron Fable, como
00:03:07dicen aquí abajo. Esta es una de las razones por las que tenían esa retención de 30 días de los datos del cliente con
00:03:11Fable, lo que impidió que muchas personas pudieran usarlo realmente, pero la razón principal era que
00:03:15podían hacer un seguimiento de cualquier forma de hackeo y detenerlo. Y por lo que pude ver, parecía
00:03:19estar funcionando, pero al parecer el gobierno de EE. UU. tiene otras ideas. Anthropic incluso dice que
00:03:23no han recibido la divulgación de un posible hackeo no universal preocupante que haya llevado a un
00:03:28resultado dañino, y los posibles hackeos que han visto han sido respuestas completamente benignas
00:03:32o hallazgos menores que no proporcionan ninguna mejora específica de Mythos. Pero aquí es donde vemos los
00:03:37detalles vagos sobre lo que encontró el gobierno. Al parecer, el gobierno solo les ha dado
00:03:40evidencia verbal de un posible hackeo estrecho no universal que consiste esencialmente en pedirle
00:03:45al modelo que lea un código base específico y corrija cualquier falla de software. Nuestro entendimiento es que un
00:03:50posible hackeo fue compartido con el gobierno y han revisado el informe y validado que
00:03:54el nivel de capacidad mostrado está ampliamente disponible en otros modelos, incluido GPT 5.5 de OpenAI,
00:04:00y es utilizado todos los días por los defensores que mantienen el sistema seguro. Compartiremos más detalles en las próximas 24 horas.
00:04:06Tratando de leer entre líneas, parece que el hackeo podría haber consistido en clonar un repositorio
00:04:10y decir: ¿puedes arreglar los errores en esto?, y uno de esos errores habría sido una vulnerabilidad de seguridad,
00:04:14y luego podrías usar eso de alguna manera nefasta, y tal vez hubo un hackeo para conseguir que Fable 5 hiciera
00:04:19un poco más de comprobaciones avanzadas de ciberseguridad en ese repositorio, pero obviamente los detalles son muy vagos ya que
00:04:24no quieren que esto se filtre. La defensa de Anthropic aquí también se reduce a: miren a OpenAI, hace lo
00:04:28mismo, así que espero que el hecho de que acusen a OpenAI no signifique que también perderemos el acceso a GPT 5.5.
00:04:34La parte final de esta declaración es solo Anthropic diciendo que están cumpliendo con la directiva legal del gobierno
00:04:38y están eliminando el acceso a Fable 5 y Mythos 5 para todos los usuarios, sin embargo, no están de acuerdo con que el hallazgo de un estrecho
00:04:43posible hackeo deba ser motivo para retirar un modelo comercial desplegado a cientos de millones de personas,
00:04:48y si este estándar se aplicara en toda la industria, creen que esencialmente detendría todos los nuevos despliegues de modelos
00:04:53para todos los proveedores de modelos de frontera. Y sí, estoy de acuerdo, no entiendo realmente cómo podemos avanzar a partir de aquí
00:04:59si estamos en un punto en el que todos estos modelos son tan poderosos que el gobierno de EE. UU. simplemente dice que no,
00:05:03que la gente normal no puede tener acceso a ellos. Apuesto a que el gobierno de EE. UU. estaría perfectamente feliz de tener Fable solo para ellos,
00:05:08pero todos sabemos lo bien que resultó el último acuerdo de Anthropic con el Departamento de Defensa. La otra parte que me preocupa como ciudadano no estadounidense
00:05:14es la parte que dice suspender todo acceso a Fable 5 y Mythos 5 por cualquier ciudadano extranjero. Así que tal vez lo resuelvan permitiendo solo a los ciudadanos estadounidenses
00:05:22usar Fable 5 y Mythos, pero realmente espero que eso no suceda y va a ser un mundo extraño donde el gobierno de EE. UU.
00:05:28esté restringiendo a la gente el uso de los mejores modelos que existen. Y supongo que eso también significaría que tendrías que subir
00:05:32tu identificación a Anthropic para demostrar dónde naciste para poder usar estos modelos. Así que eso es básicamente toda la información
00:05:38que tengo en este momento. Esta noticia acaba de caer literalmente y, quiero decir, sabía que íbamos a perder Fable 5 en 11 días
00:05:43de nuestras suscripciones, pero no esperaba que sucediera tan pronto y este es simplemente un mundo extraño en el que estamos entrando,
00:05:49así que déjenme saber qué piensan al respecto en los comentarios de abajo, y mientras están ahí, suscríbanse
00:05:52y, como siempre, nos vemos en el próximo.

Key Takeaway

El gobierno de EE. UU. ha ordenado la suspensión inmediata del acceso a los modelos Fable 5 y Mythos 5 de Anthropic alegando preocupaciones de seguridad nacional, una medida que según la empresa podría paralizar futuros despliegues de inteligencia artificial si se aplica a toda la industria.

Highlights

  • El gobierno de EE. UU. emitió una directiva de control de exportaciones que obliga a Anthropic a desactivar el acceso a Fable 5 y Mythos 5.

  • La orden restringe el uso de estos modelos a cualquier ciudadano extranjero, tanto dentro como fuera de Estados Unidos, incluyendo a empleados extranjeros de Anthropic.

  • Anthropic sostiene que las vulnerabilidades citadas por el gobierno son menores, previamente conocidas y detectables por otros modelos públicos como GPT 5.5.

  • Antes del lanzamiento, Fable 5 fue sometido a miles de horas de pruebas de penetración sin que se lograra encontrar un hackeo universal.

  • El gobierno proporcionó evidencia verbal de una técnica que permite al modelo leer repositorios de código para corregir fallas de seguridad, una capacidad que Anthropic argumenta es estándar en la industria.

Timeline

Suspensión de acceso a Fable 5 y Mythos 5

  • El gobierno de EE. UU. ordenó a Anthropic suspender el acceso a Fable 5 y Mythos 5 por razones de seguridad nacional.
  • La directiva prohíbe el acceso a ciudadanos extranjeros, sin importar su ubicación geográfica.
  • Anthropic desactivó los modelos abruptamente para garantizar el cumplimiento legal.

Una directiva de control de exportaciones recibida por Anthropic a las 5:21 p. m. forzó la desactivación inmediata de Fable 5 y Mythos 5. La medida afecta a cualquier ciudadano extranjero, incluyendo al personal de la propia empresa. Otros modelos de Anthropic permanecen operativos.

Justificación y respuesta de Anthropic

  • El gobierno sospecha que existe un método para hackear Fable 5 y explotar vulnerabilidades de ciberseguridad.
  • Anthropic considera las vulnerabilidades identificadas como menores y públicas.
  • Miles de horas de pruebas de penetración (red team) realizadas con el AISI del Reino Unido y terceros no detectaron hackeos universales antes del lanzamiento.

Anthropic argumenta que sus salvaguardias son significativamente más efectivas que las de cualquier modelo anterior. La empresa afirma que ningún evaluador externo pudo eludir todas las restricciones del sistema. Se reconoce el desafío continuo de la seguridad en la IA, pero se minimiza el impacto del hackeo reportado por el gobierno.

Detalles del hallazgo gubernamental

  • El gobierno presentó evidencia verbal de una vulnerabilidad que permite corregir fallas de software en repositorios de código.
  • Anthropic sostiene que capacidades similares están ampliamente disponibles en modelos como GPT 5.5 de OpenAI.
  • No existen reportes de que la vulnerabilidad haya sido utilizada para fines dañinos reales.

El posible hackeo involucraría pedirle al modelo que identifique y arregle errores en un repositorio de código, los cuales podrían ser vulnerabilidades de seguridad. Anthropic califica esta capacidad como una herramienta utilizada a diario por los defensores de sistemas para mantener la seguridad, cuestionando la proporcionalidad de la medida restrictiva.

Implicaciones industriales

  • La aplicación de este estándar de seguridad podría detener el despliegue comercial de modelos de frontera en toda la industria.
  • La restricción podría obligar a los usuarios a proporcionar documentos de identidad para demostrar su país de nacimiento.
  • Existe incertidumbre sobre el futuro de la disponibilidad de modelos avanzados para el público general.

Anthropic advierte que si la detección de un hackeo estrecho es motivo suficiente para retirar un modelo, el desarrollo tecnológico se detendría. La situación plantea interrogantes sobre la exclusividad del uso de modelos potentes por parte del gobierno frente a los usuarios civiles y el impacto en la privacidad de los datos de los clientes.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video