Skip to main content
  1. Casa
  2. Computación

DT en Español podría recibir una comisión si compras un producto desde el sitio

Es posible que el 57% de Internet ya sea solo contenido hecho con IA

Una burbuja de palabras CGI
Google Deepmind / Pexels

No eres solo tú, los resultados de búsqueda realmente están empeorando. Los investigadores de Amazon Web Services (AWS) Internet hoy en día es generado por IA o traducido utilizando un algoritmo de IA.

El estudio, titulado «A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism«, argumenta que la traducción automática (TA) de bajo costo, que toma un determinado fragmento de contenido y lo regurgita en varios idiomas, es la principal culpable. «Las traducciones paralelas multidireccionales generadas por máquinas no solo dominan la cantidad total de contenido traducido en la web en idiomas de bajos recursos donde la traducción automática está disponible; También constituye una gran fracción del contenido web total en esos idiomas», escribieron los investigadores en el estudio.

Recommended Videos

También encontraron evidencia de sesgo de selección en qué contenido se traduce automáticamente a varios idiomas en comparación con el contenido publicado en un solo idioma. «Este contenido es más corto, más predecible y tiene una distribución temática diferente en comparación con el contenido traducido a un solo idioma», escribieron los investigadores.

Además, la creciente cantidad de contenido generado por IA en Internet, combinado con la creciente dependencia de las herramientas de IA para editar y manipular ese contenido, podría conducir a un fenómeno conocido como colapso del modelo, y ya está reduciendo la calidad de los resultados de búsqueda en la web. Dado que los modelos de IA de frontera como Claude dependen de cantidades masivas de datos de entrenamiento que solo se pueden adquirir raspando la web pública (ya sea que viole los derechos de autor o no), tener la web pública llena de contenido generado por IA, y a menudo inexacto, podría degradar gravemente su rendimiento.

«Es sorprendente lo rápido que se produce el colapso del modelo y lo difícil que puede ser», dijo el Dr. Ilia Shumailov de la Universidad de Oxford a Windows Central. «Al principio, afecta a los datos de las minorías, a los datos que están mal representados. A continuación, afecta a la diversidad de las salidas y la varianza se reduce. A veces, se observa una pequeña mejora en los datos de la mayoría, que oculta la degradación del rendimiento de los datos de las minorías. El colapso del modelo puede tener graves consecuencias».

Los investigadores demostraron esas consecuencias haciendo que lingüistas profesionales clasificaran 10.000 oraciones en inglés seleccionadas al azar de una de las 20 categorías. Los investigadores observaron «un cambio dramático en la distribución de los temas al comparar los datos paralelos de 2 vías a 8+ (es decir, el número de traducciones de idiomas), con temas de ‘conversación y opinión’ que aumentaron del 22,5% al 40,1%» de los publicados.

Esto apunta a un sesgo de selección en el tipo de datos que se traducen a varios idiomas, que es «sustancialmente más probable» que provengan del tema de «conversación y opinión».

Además, los investigadores descubrieron que «las traducciones paralelas altamente multidireccionales son significativamente de menor calidad (6,2 puntos de estimación de calidad del cometa peores) que las traducciones paralelas de 2 vías». Cuando los investigadores auditaron 100 de las oraciones paralelas altamente multidireccionales (aquellas traducidas a más de ocho idiomas), encontraron que «una gran mayoría» provenía de granjas de contenido con artículos «que caracterizamos como de baja calidad, que requerían poca o ninguna experiencia, o esfuerzo previo para crear».

Eso ciertamente ayuda a explicar por qué el CEO de OpenAI, Sam Altman, sigue insistiendo en que es «imposible» hacer herramientas como ChatGPT sin libre a obras con derechos de autor.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Microsoft asesta un golpe demoledor al imperio de malware Lumma

Microsoft, en asociación con el Departamento de Justicia de los Estados Unidos (DOJ, por sus siglas en inglés), dio un paso importante en el desmantelamiento de una de las herramientas de cibercrimen más prolíficas actualmente en circulación. La Unidad de Delitos Digitales (DCU) de Microsoft colaboró con el Departamento de Justicia, Europol y varias empresas globales de ciberseguridad para interrumpir la red de malware Lumma Stealer, una plataforma de malware como servicio (MaaS) implicada en cientos de miles de violaciones digitales en todo el mundo.

Según Microsoft, Lumma Stealer infectó más de 394.000 máquinas Windows entre marzo y mediados de mayo de 2025. El malware ha sido una herramienta favorita entre los ciberdelincuentes para robar credenciales de inicio de sesión e información financiera confidencial, incluidas las billeteras de criptomonedas. Se ha utilizado para campañas de extorsión contra escuelas, hospitales y proveedores de infraestructura. Según el sitio web del Departamento de Justicia, "el FBI ha identificado al menos 1,7 millones de casos en los que se utilizó LummaC2 para robar este tipo de información".

Leer más
Nvidia GeForce Now ahora tiene un descuento enorme de 40% por seis meses
Nvidia GeForce Now

Si eres un jugador o quieres convertirte en uno con más y mejores recursos, entonces Nvidia tiene una oferta inigualable para los próximos días y que tiene que ver con su servicio Nvidia GeForce Now.

Esto porque las suscripciones de seis meses a su suscripción Performance de nivel medio, que ofrece un juego de 1440p sin publicidad, tiempos de cola cortos y trazado de rayos en juegos compatibles, tienen un 40 por ciento de descuento. En lugar de $ 49.99, pagarás $ 29.99, un precio razonable si no tiene una PC para juegos o simplemente desea una forma confiable de jugar muchos de sus títulos de Steam, Epic Games Store y otros títulos lejos de su PC.

Leer más
Asus lanza router gaming que viene con nueve puertos 2.5G
Asus ROG Wi-Fi 7

Una sorpresita bajo la manga se tenía guardada Asus para el final de Computex 2025, y para deleite de todos los gamers, ha sido un verdadero regalo para ellos: el router gaming ROG Wi-Fi 7, que vendrá con nueve puertos 2.5G.

La nueva ROG Strix GS-BE18000 se parece mucho a una torre de mini-PC para juegos cargada con la marca ROG y un logotipo RGB en la parte delantera, junto con nueve puertos 2.5G.

Leer más