OpenAI habría entrenado sus modelos de inteligencia artificial a partir de videos de YouTube. Un reporte afirma que la empresa desarrolló una herramienta para transcribir el audio de los videos YouTube. El texto serviría para nutrir el conjunto de datos que utiliza OpenAI en GPT-4 y otros modelos de lenguaje.
De acuerdo con The New York Times, OpenAI diseñó e implementó una herramienta de reconocimiento de voz llamada Whisper, con la cual transcribió más de un millón de horas de videos de YouTube. El reporte menciona que el presidente de la empresa, Greg Brockman, habría recopilado los videos para entrenar GPT-4, uno de sus modelos más avanzados de inteligencia artificial.
La idea de transcribir videos de YouTube formó parte de una estrategia de OpenAI para nutrir su conjunto de datos de entrenamiento. De acuerdo con fuentes, Sam Altman y compañía estaban desesperados por obtener datos para desarrollar GPT-4, puesto que habían agotado sus suministros desde 2021. Varios empleados discutieron alternativas, entre las que se encontraba comprar empresas con enormes bases de datos o transcribir videos y audiolibros.
El resultado de estas conversaciones fue Whisper, una herramienta de reconocimiento de voz capaz de transcribir videos y podcasts. «Estudiamos las capacidades de los sistemas de procesamiento del habla entrenados simplemente para predecir grandes cantidades de transcripciones de audio en Internet», menciona un documento técnico. «Logramos nuestros resultados sin la necesidad de técnicas de autosupervisión y auto entrenamiento que han sido un pilar del reciente trabajo de reconocimiento de voz a gran escala».
- CHECALO -
En el documento de Whisper figuran nombres como Greg Brockman, presidente de OpenAI, e Ilya Sutskever, cofundador de la empresa. Este último fue artífice de la revuelta que ocasionó el despido de Sam Altman a finales 2023.
No solo OpenAI, Google también entrenó su IA con videos de YouTube
Aunque OpenAI nunca se ha distinguido por contar con una brújula moral, el transcribir videos para convertirlos en datos de entrenamiento no fue exclusivo de la empresa.
Según el reporte del NYT, empleados de OpenAI discutieron cómo Whisper violaría los términos de uso YouTube y, aun así, siguieron adelante. Tal vez lo más sorprendente es que algunos empleados de Google estaban al tanto de estas prácticas y no lo impidieron, puesto que la tecnológica hizo lo mismo para entrenar sus modelos de inteligencia artificial.
La transcripción de videos de YouTube para entrenar GPT-4 y otros modelos de lenguaje ha abierto una caja de Pandora. Algunos cuestionan la legalidad de utilizar estos datos como base de entrenamiento sin contar con la aprobación de sus autores. Sin embargo, un abogado de propiedad intelectual expresó al diario que las reglas sobre el uso de las transcripciones son ambiguas.
Un portavoz de Google mencionó que la empresa no estaba al tanto de las prácticas de OpenAI y prohíbe la exploración o descarga de contenido. Desde hace unos meses, la compañía modificó las condiciones del servicio para impedir este comportamiento. Al mismo tiempo, los de Mountain View aprovechan los huecos legales para extraer datos de Docs o Maps que pudieran servir para entrenar a Gemini.
Al igual que OpenAI, Google y otras compañías buscan nutrir su conjunto de datos para los modelos de lenguaje. Esto ha generado críticas de artistas, escritores y diseñadores, quienes consideran que las grandes tecnológicas roban su trabajo a una escala masiva. Las demandas no se han hecho esperar, por lo que es posible que veamos a youtubers sumándose al movimiento de protesta contra la IA.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://hipertextual.com/2024/04/openai-entreno-su-inteligencia-artificial-con-videos-youtube