dIArio #23: hackean OpenAI

dIArio #23: hackean OpenAI

Volvemos a la carga con una semana repleta de noticias de las buenas. Sí, volvemos a la normalidad con los riesgos de seguridad como temática principal.

Seguramente la noticia más importante sea la de Claude Mythos, o más bien lo que implica: que un modelo de IA sea extremadamente bueno en ciberseguridad significa, intrínsecamente, que también lo es en desbaratar esa seguridad. Y que algo así llegue al mercado es realmente peligroso.

También han hackeado OpenAI, pero dicen que "tranqui, que no pasa nada". Esperemos que así sea.

Vamos a ello.


Trabajo y empleo

Goldman Sachs ha publicado un estudio que cuantifica el impacto real de la IA en el empleo: 25.000 puestos de trabajo destruidos cada mes en EE.UU., de los que la IA crea de vuelta unos 9.000, dejando un saldo negativo de 16.000 empleos mensuales. Los más afectados son los jóvenes de la Generación Z, la generación más preparada de la historia (o eso dicen) y la que menos oferta va a encontrar para incorporarse al mercado laboral.
Fuente

Sam Altman ha publicado un documento de 13 páginas titulado "Política industrial para la era de la inteligencia" en el que OpenAI propone cobrar a los robots el mismo tipo impositivo que a los trabajadores humanos que sustituyen, crear un fondo de riqueza público financiado con esos ingresos para repartir dividendos entre los ciudadanos, y subvencionar una jornada laboral de 32 horas sin reducción de sueldo. El documento reconoce explícitamente que el crecimiento impulsado por la IA podría vaciar las arcas públicas y dejar a millones de personas atrás. Cuando los billonarios escriben sobre "dar paguitas" a los demás, algo raro hay detrás.
Fuente

Parece que la IA generativa de imagen todavía no la dominan

Regulación y política

Utah se convierte en uno de los primeros estados de EE.UU. en autorizar a un sistema de inteligencia artificial a renovar de forma autónoma recetas de medicamentos psiquiátricos, incluyendo antidepresivos como Prozac o Zoloft, sin intervención de un médico. Aunque puede que te suene porque lo vimos hace un tiempo, ahora ya es oficial. ¿El chatbot se llevará también una comisión por cada receta?
Fuente

El subdirector de la CIA, Michael Ellis, ha confirmado que la agencia ha producido su primer informe de inteligencia escrito con ayuda de la inteligencia artificial. El plan es que cada analista de la CIA tenga pronto un "compañero de trabajo de IA" integrado en su plataforma, y que en menos de una década los agentes gestionen equipos enteros de IA de forma autónoma. La inteligencia usando a la inteligencia para ser más inteligente, qué inteligentes.
Fuente

Seguridad y riesgos

Anthropic ha anunciado que su nuevo modelo más avanzado, Claude Mythos Preview, había descubierto miles de vulnerabilidades de seguridad desconocidas ("zero-day") ocultas en los principales sistemas operativos y navegadores web, algunas con hasta 27 años de antigüedad sin detectar. El problema es que el modelo también era capaz de explotarlas de forma autónoma, así que han decidido no publicarlo y restringir el acceso a un consorcio de 12 empresas entre las que están Amazon, Apple, Google, Microsoft y Cisco. No tengo muy claro cómo salir de este bucle de ciberseguridad de vulnerabilidad-arreglo, la verdad.
Fuente

OpenAI ha confirmado un incidente de seguridad a nivel general en la industria provocado por la biblioteca externa Axios. La compañía asegura que sus sistemas no han sido vulnerados ni se han expuesto datos de los usuarios. Sin embargo, como medida preventiva ante la posible creación de programas falsos que suplanten su identidad, están obligando a todos sus usuarios de macOS a actualizar la aplicación a la versión más reciente para poder aplicar los nuevos certificados de seguridad. ¿Quién no va a querer creer al bueno de Sam Altman con el currículum que tiene?
Fuente

Hay que reconocer que el CEO de Anthropic tiene pinta de villano con plot twist final

OpenAI, Google y Anthropic han anunciado que están compartiendo información a través del Frontier Model Forum para combatir la "destilación adversarial": la práctica de ejecutar millones de consultas a través de sus modelos usando cuentas falsas para entrenar en secreto imitaciones más baratas. Anthropic ha documentado 16 millones de esos intercambios procedentes de tres empresas chinas (DeepSeek, Moonshot y MiniMax) usando aproximadamente 24.000 cuentas creadas fraudulentamente. Podríamos decir que se están quejando de que les hagan lo que ellos han hecho de manera masiva para entrenar a sus modelos, ¿no?
Fuente

Un nuevo estudio académico ha analizado el comportamiento de los chatbots de IA cuando se usan como herramientas de apoyo psicológico y ha encontrado que vulneran sistemáticamente 15 estándares éticos básicos de la salud mental: manejan mal las crisis, refuerzan creencias dañinas, muestran sesgos y ofrecen lo que los investigadores llaman "empatía engañosa". En un caso documentado, un chatbot respondió a una consulta que insinuaba ideación suicida mencionando "puentes altos" en lugar de derivar al usuario a servicios de crisis. Los chatbots están tan obligados a complacer al usuario que lo hacen en cualquier situación.
Fuente

Un informe de la empresa de ciberseguridad Salt Security ha identificado el "envenenamiento de memoria" como la principal amenaza emergente en sistemas de IA. A diferencia de los ataques de inyección de prompts, este método corrompe la memoria a largo plazo del agente, alterando cómo recuerda interacciones pasadas y toma decisiones futuras. El estudio revela que el 92 % de las empresas no están preparadas para este tipo de ataques. Y no pienses solo en las grandes empresas, ¿cuántos pequeños emprendedores has visto que implementan la IA en su estructura empresarial porque "un amigo" le ha dicho que lo haga, sin saber lo que realmente está haciendo?
Fuente

Empresas y avances

Meta ha lanzado Muse Spark, su nuevo modelo de IA multimodal desarrollado por el recién creado Meta Superintelligence Labs. La novedad más llamativa es que es software privativo, lo que supone una ruptura total con la estrategia de código abierto que Mark Zuckerberg había defendido durante años argumentando que era más seguro y más beneficioso para la sociedad. Consejos vendo y para mí no tengo, lo típico.
Fuente

Visa ha presentado "Intelligent Commerce Connect", una plataforma diseñada para que agentes de IA puedan navegar por tiendas, seleccionar productos y completar compras enteramente en nombre del usuario, funcionando con todas las redes de pago principales. El sistema incluye tokenización, autenticación y límites de gasto configurables por el usuario, está en fase piloto con AWS y se prevé lanzamiento general en junio. Echando un ojo a las noticias sobre seguridad, ¿quién no está deseando probar esta implementación?
Fuente


Estas han sido las noticias de la semana, pero antes de irme quería recordarte que si tienes cuenta de pago en Claude, puedes conseguir saldo gratis si antes del día 17 de abril vas a tu perfil ajustes saldo. Ahí mismo te aparecerá una opción para reclamar un importe igual a la suscripción que pagas, como "recompensa" porque todavía no han solucionado el bug.

No dura mucho pero menos da una piedra.

Nos vemos el jueves, un abrazo.
Amaiur.