IA y periodismo

La inteligencia artificial ha transformado la forma en que las personas buscan información. Millones de usuarios recurren diariamente a asistentes conversacionales para resolver dudas, redactar textos o resumir acontecimientos. Sin embargo, varios investigadores han comenzado a advertir sobre un riesgo que podría afectar la calidad del conocimiento digital en los próximos años: la formación de una gran “caja de eco” informativa.

El concepto no es nuevo. Tradicionalmente, una caja de eco describe un entorno donde las personas escuchan repetidamente las mismas ideas mientras las opiniones divergentes desaparecen. En el ámbito de la inteligencia artificial, el problema adquiere una dimensión distinta: los modelos podrían terminar alimentándose cada vez más de contenido producido por otras inteligencias artificiales, reduciendo progresivamente el contacto con información original obtenida del mundo real.

El origen de la preocupación

La discusión cobró relevancia a partir de investigaciones realizadas por académicos de la Universidad de Oxford, la Universidad de Cambridge y otras instituciones, quienes analizaron lo que denominaron “model collapse” o colapso del modelo.

El estudio más citado sobre este tema fue publicado en Nature por Ilia Shumailov y colaboradores. Los investigadores plantearon que, si las futuras generaciones de modelos son entrenadas principalmente con datos generados por sistemas anteriores, pueden comenzar a perder diversidad y precisión, amplificando errores y eliminando información menos frecuente pero importante.

En términos sencillos, una IA aprende observando enormes cantidades de texto. Si una proporción creciente de ese texto proviene de otras IA, el sistema deja de aprender directamente de la realidad y comienza a aprender de interpretaciones previas de la realidad.

El papel de los medios de comunicación

El riesgo no se limita a cuestiones técnicas.

Diversos centros de investigación, entre ellos el Stanford Institute for Human-Centered Artificial Intelligence (HAI), han señalado que la calidad de los modelos depende de la existencia de fuentes confiables que produzcan información original: periódicos, revistas especializadas, universidades, centros de investigación y organismos públicos.

Aquí surge una paradoja. Cuanto más utilizan las personas la IA para obtener respuestas rápidas, menos visitan las páginas que generan el contenido original. Si esa tendencia afecta los ingresos de los medios y reduce su capacidad de realizar investigaciones periodísticas, podría disminuir la producción de información nueva y verificable.

En otras palabras, la IA necesita del periodismo más de lo que muchas personas imaginan.

Cómo se forma una caja de eco digital

Imaginemos el siguiente escenario:

Un sitio publica un dato incorrecto.

Varias inteligencias artificiales lo reproducen.

Usuarios y sistemas automatizados generan miles de textos que repiten la misma información.

Esos textos pasan a formar parte del material disponible en internet.

Nuevas IA utilizan ese contenido para entrenarse.

Con el tiempo, el error puede parecer verdadero simplemente porque aparece repetido en numerosos lugares.

Los investigadores comparan este fenómeno con hacer una fotocopia de una fotocopia de una fotocopia: cada generación pierde parte de la calidad original.

Más allá de las noticias falsas

El problema no consiste únicamente en la propagación de información falsa.

Algunos estudios sugieren que también podría producirse una pérdida gradual de matices, perspectivas minoritarias y conocimientos especializados. Los modelos tenderían a converger hacia respuestas promedio cada vez más homogéneas.

Desde una perspectiva académica, esto podría empobrecer el ecosistema informativo y reducir la capacidad de las IA para reflejar la complejidad del mundo real.

¿Es inevitable?

La mayoría de los especialistas considera que no.

Las grandes empresas tecnológicas están invirtiendo en acuerdos con medios de comunicación, editoriales, universidades y proveedores de datos para garantizar el acceso a información original y de alta calidad. Paralelamente, continúan desarrollándose técnicas para identificar contenido generado por IA y evitar que domine los conjuntos de entrenamiento.

Además, instituciones como Stanford, MIT y Oxford han insistido en la importancia de mantener un ecosistema robusto de producción de conocimiento humano, desde el periodismo de investigación hasta la ciencia básica.

La publicidad

Sabemos que varios medios son financiados por gobiernos, pero hay otros que se dotan de recursos con anuncios de plataformas como Google Ads. Esta publicidad funciona con clics; entre más visitas tenga un medio, mayores ingresos tendrá. Podrá contratar a periodistas profesionales o realizar investigaciones documentadas.

Pero ¿qué pasa si la gente deja de ingresar a ese medio y se va por la búsqueda en la IA de su preferencia? El medio deja de ser rentable y cierra. Y la IA ya no busca en esa fuente profesional de información. Se va a otra donde la “carnita” que consiga ya no sea un filete angus y se convierta en un pellejo de perro callejero.

Por lo tanto, la inteligencia artificial no reemplaza la necesidad de producir información original; depende de ella. Sin periodistas que investiguen, científicos que experimenten, académicos que publiquen y ciudadanos que documenten la realidad, los sistemas de IA corren el riesgo de encerrarse en una gigantesca caja de eco donde las máquinas se citan unas a otras.

El desafío para las próximas décadas no será únicamente construir inteligencias artificiales más poderosas, sino preservar las fuentes humanas de conocimiento que las hacen posibles. Porque una IA puede reorganizar la información existente, pero no puede sustituir por completo a quienes salen al mundo para descubrir algo nuevo.

Referencias académicas recomendadas para consulta:

Shumailov, I. et al. The Curse of Recursion: Training on Generated Data Makes Models Forget (Nature, 2024).

Stanford HAI (Human-Centered Artificial Intelligence): investigaciones sobre calidad de datos y gobernanza de IA.

University of Oxford: trabajos sobre riesgos sistémicos y entrenamiento de modelos generativos.

University of Cambridge: estudios sobre seguridad y sostenibilidad de sistemas de IA.

MIT Sloan y MIT Computer Science and Artificial Intelligence Laboratory (CSAIL): investigaciones sobre confiabilidad y calidad de datos en IA.

Miguel C. Manjarrez

Revista Réplica

Política Categorías

Artículos recientes en Política

Artículos recientes de Alejandro C Manjarrez

Opinión Categorías

Artículos más recientes en Opinión

Categoría salud

Los más reciente en Salud

Artículos más recientes en Vida y Sociedad

Artículos más recientes en Tecnología

Categoría entretenimiento

Los más reciente en Entretenimiento

Tipografía

Compartir

Redacción Réplica

Legal

BUSQUEDA AVANZADA

Participantes

Articles

Redes Sociales