Videos de YouTube de Mr. Beast, o The New York Times fueron usados sin aprobación para entrenar varias IA de Apple y otras tecnológicas.
Fabián Vega
Con videos de Mr. Beast, PewDiePie y hasta la BBC y The New York Times, Apple, NVIDIA, Anthropic y Salesforce entrenaron a sus inteligencias artificiales (IA), para que aprendieran a comunicarse y crear textos con un lenguaje más sencillo y coloquial. Todo para que fueran mejores al crear escritos más cercanos y fáciles de entender para las personas. Por lo que estas tecnológicas se valieron de gigas de información recopilada por investigadores en IA.
- CHECALO -
Aunque solo usaron subtítulos de videos de YouTube para su entrenamiento (hasta 5.7 GB), la información extraída es parte de otro gran grupo de archivos equivalente a 825 GB de información denominado “The Pile“. El cual se trata de contenido que comúnmente usan las IA, del cual no todo está autorizado por tratarse de material de youtubers, programas de televisión y canales de medios reconocidos a nivel mundial.
Miles de videos de hasta 48 mil canales de YouTube fueron usados para entrenar IA
Los subtítulos usados corresponden a 173 mil 536 videos de 48 mil canales del popular sitio de videos. Y que incluyen a destacados creadores de contenido en lengua inglesa como:
-
Mr. Beast
PewDiePie
BBC
The New York Times
The Late Show con Stephen Colbert
Jimmy Kimmel Live
¿Cómo lo lograron?
YouTube Subtitles es un documento de texto que fue creado y recopilado por la empresa investigadora de IA EleutherAI, a partir de subtítulos generados por humanos en YouTube. Y de acuerdo con la investigación de Proof News, fueron ellos quienes lo pusieron a disposición de las IA, junto a otros 22 subgrupos de archivos que incluyen información de sitios tan diversos como:
-
Wikipedia
Github
OpenSubtitles
Información que, de acuerdo con Proof News es:
“Una fuente de contenido educativo, cultura popular y diálogo natural”.
Te podría interesar: Así funciona Claude, la IA que resume libros enteros por ti.
Por lo que las gigantes Anthropic y Salesforce negaron cualquier daño al dar, al cargar la responsabilidad de la base de datos a EleutherAI.
Hasta la publicación de esta nota ni NVIDIA o Apple han respondido a las acusasiones.
Para detectar si un video fue usado para entrenar alguna de las inteligencias artificiales de estas empresas, Proof News creó una herramienta especializada para ello y solo necesitas el nombre del canal o video del que sospechas pudiera haber sido usado por Apple, NVIDIA, Anthropic o Salesforce.
Te recomendamos:
La Inteligencia Artificial (IA) blindará a atletas de ciberataques en Paris 2024 – IMER Noticias
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio
https://noticias.imer.mx/blog/apple-uso-videos-de-youtube-de-mr-beast-y-la-bbc-para-entrenar-a-sus-ia/