Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Sommaire
Les géants technologiques, OpenAI et Google, ont récemment établi une nouvelle approche pour l’entraînement de leurs modèles d’IA. Ils se sont tournés vers le gisement riche des vidéos YouTube, en utilisant des outils innovants comme Whisper pour la transcription et GPT-4 pour le traitement des données. Cette méthode a permis d’ouvrir des perspectives inédites pour la formation des intelligences artificielles qui en résulte.
Cependant, cette utilisation des vidéos YouTube par les géants de la technologie soulève des préoccupations quant à de possibles infractions aux droits d’auteur du contenu des créateurs. En effet, l’usage non autorisé de telles ressources pour l’entraînement de l’IA pourrait constituer une violation directe des conditions d’utilisation de Google, qui interdisent l’accès non autorisé aux vidéos pour les applications indépendantes et les moyens automatisés.
Google, en tant que propriétaire de YouTube, insiste sur la transcription des vidéos pour les besoins de la formation à l’IA, en se concentrant sur le contenu des créateurs qui ont donné leur consentement pour une telle utilisation. Cependant, l’application de ces règles n’est pas toujours claire, laissant les créateurs de contenu dans l’incertitude.
Dans un effort pour élargir la portée des sources de données pour l’entraînement de ses modèles d’IA, Google a mis à jour ses conditions de service en juillet 2023. Cette mise à jour autorise l’utilisation de matériaux publics en ligne comme Google Docs et les critiques de restaurants sur Google Maps. Cela marque une nouvelle étape dans la diversification des données utilisées pour la formation de l’IA, mais n’est pas sans soulever d’autres problèmes éthiques et juridiques.
En conclusion, l’usage non autorisé des vidéos YouTube pour la formation des modèles d’IA a suscité un débat autour des problèmes de droits d’auteur et des répercussions juridiques possibles pour les entreprises technologiques impliquées. C’est sûrement un domaine où les législations devront évoluer afin de protéger à la fois les innovations technologiques et les droits des créateurs.
Google and OpenAI have utilized YouTube videos to train their AI models, with Google owning YouTube and OpenAI transcribing these videos for training purposes.
OpenAI utilized Whisper, a speech recognition tool, to transcribe over a million hours of YouTube videos, feeding the transcripts into GPT-4 for AI system training.
Both Google and OpenAI transcribing YouTube videos for AI training may violate creators’ copyrights by using their content without proper authorization.
In July 2023, Google modified its terms of service to allow the use of public online material like Google Docs and Google Maps restaurant reviews for training its AI models.
The utilization of creator content by companies like OpenAI for training AI models has led to concerns about copyright infringement and potential legal action regarding the misuse of copyrighted material.