dIArio #32: Trump prohíbe Mythos 5 a los tres días

Share
dIArio #32: Trump prohíbe Mythos 5 a los tres días

El hype generado por la salida de Claude Fable 5 ha durado poco, de hecho podríamos decir que los eventos que han marcado la semana han sido tres: la salida de Fable 5 y Mythos 5, la prohibición de ambos y la salida a bolsa de SpaceX.

Este último es complejo y tiene más que ver con economía que con otra cosa, así que si te interesa te dejo este vídeo de mi amigo Lord donde lo explica en profundidad. Y de ese vídeo me quedo con un dato: SpaceX generó en 2025 pérdidas por valor de 600 millones de dólares, mientras que las pérdidas que generó xAI ascendieron a 6.000 millones de dólares. Ahí lo dejo.

Si bien SpaceX se ha fusionado con xAI, en este caso me refiero a la parte espacial de la empresa contra la parte de IA generativa de la misma.

Y dicho esto, vamos a las noticias de la semana.


Modelos y avances

Investigadores de Cornell han descubierto que ChatGPT, Gemini y Claude reinventan al mismo personaje una y otra vez: un farero (o relojero, o bibliotecario) llamado Elias Thorne. Tras analizar 20.000 historias de GPT-5.4 Mini, Claude Haiku 4.5 y Gemini 3.1 Flash-Lite, encontraron que once tokens recurrentes (entre ellos los nombres Elias, Mara y Elara) aparecen en más del 88 % de los relatos. La culpa es del entrenamiento de alineamiento, que comprime la creatividad hacia unas pocas opciones "seguras". Cada día que pasa parece que se inventan más cosas y resulta que ni siquiera son originales.
Fuente

Un equipo ha sometido a los modelos más avanzados al test de Stroop, el clásico ejercicio de decir el color de la "tinta" ignorando la palabra escrita. Acertaban bien con listas cortas, pero el rendimiento se desplomaba al alargar la tarea: GPT-4o cayó del 91 % con 5 palabras al 15 % con 40, y Claude 3.5 Sonnet se hundió al 24 % con 40. No me sorprende, yo sigo peleándome con Gemini cuando le pregunto algo con referencia a una imagen y me responde creando otra imagen que no le he pedido.
Fuente

Regulación y política

Anthropic ha lanzado Fable 5 (y Mythos 5 para un grupo reducido) esta semana y, tres días después, el Departamento de Comercio de EE. UU. ha ordenado cortar el acceso a ambos modelos a todos los ciudadanos extranjeros, dentro y fuera del país, incluidos sus propios empleados. Anthropic ha cerrado el grifo a clientes de todo el mundo para cumplir con la directiva, aunque dice que la justificación oficial es un aviso verbal de un jailbreak que considera insuficiente. ¿Habrá perdido acceso también Chris Olah, el canadiense cofundador de Anthropic? ¿O haber estado con el papa la semana pasada le habrá ayudado a librarse?
Fuente

En un caso federal en Misisipi, la jueza Sharion Aycock ha descubierto que los abogados de las dos partes habían citado jurisprudencia inexistente generada por IA. Canceló el juicio, descalificó a los cuatro abogados implicados (dos vetados durante dos años) y les impuso las multas correspondientes. Y no es la primera vez, aquí se puede ver un caso similar con el juez echándoles la bronca en directo. Eso sí, hay que recordar que la vagancia del ser humano no es culpa de la IA.
Fuente

Seguridad y riesgos

Microsoft ha tenido que deshabilitar más de 70 de sus propios repositorios en GitHub tras un ataque de cadena de suministro. El gusano autorreplicante "Miasma" plantó archivos de configuración que ejecutaban un payload robacredenciales en cuanto un desarrollador abría el repositorio en herramientas de IA como Claude Code, Gemini CLI, Cursor o VS Code, sin necesidad de ejecutar nada. Se vieron afectados 73 repositorios de cuatro organizaciones, muchos ligados a Azure. Mientras tanto, los gurús de internet (que hace dos días no sabían ni qué era GitHub) te siguen diciendo que tienes que automatizar hasta el comer.
Fuente

Google DeepMind, junto a Schmidt Sciences y ARIA, ha anunciado un fondo de 10 millones de dólares para estudiar qué pasará cuando millones de agentes autónomos empiecen a darse instrucciones unos a otros en internet. Temen estafas potenciadas, malware por inyección de prompts y un efecto cascada que convierta el ecosistema digital en una anarquía. Rohin Shah, de DeepMind, reconoce que "todavía no existe realmente un campo de investigación para la seguridad multiagente". Y cuando exista, ¿para quién va a estar disponible? ¿Para un pequeño grupo de privilegiados, como Mythos?
Fuente

Sociedad

Un estudio del MIT Media Lab siguió a 67 personas durante cuatro semanas pidiéndoles que distinguieran titulares y fotos reales de bulos generados con IA. Con ayuda de un chatbot acertaban un 21 % más, pero al quitarles la asistencia su precisión caía 15 puntos por debajo del punto de partida en la semana 4: uno de cada cinco había acabado aceptando sin filtro lo que decía la IA. Cuando las personas más conservaban su criterio era cuando la IA hacía preguntas en lugar de dar respuestas. Como hagan un estudio así con la prensa española, declaran una emergencia nacional.
Fuente

Investigadores de la Universidad de Gotemburgo se han inventado una dolencia ocular falsa llamada "bixonimania" y han subido a servidores de preprints papers con pistas evidentes del fraude: financiación de "la Tríada Galáctica", agradecimientos a Enterprise y uno que decía abiertamente "este paper entero está inventado". Aun así, ChatGPT, Gemini y Copilot empezaron a describirla como una afección real, y la revista Cureus (Springer Nature) llegó a citar los preprints falsos y tuvo que retractarse después. Yo estoy haciendo un experimento similar que, cuando tenga suficientes datos, compartiré por aquí.
Fuente

Una encuesta a 1.500 adultos en EE. UU., Reino Unido, Austria, Alemania y Suiza concluye que el 88 % ya no distingue lo real de lo falso en internet, y la proporción de quienes ven difícil identificar estafas ha pasado del 66 % en 2025 al 85 % en 2026. Y puedo dar fe de esto: en mi perfil de Instagram estoy subiendo vídeos con IA donde dejo a la vista que son evidentemente IA, y la mayoría de comentarios que recibo son de gente que se lo cree.
Fuente


Y hasta aquí las noticias de la semana. Si echabas de menos las noticias sobre incidencias en ciberseguridad, ya puedes empezar el lunes más tranquilo.

Feliz inicio de semana.
Amaiur.