
Le Financial Times annoncé un accord avec OpenAI lundi pour autoriser son journalisme de classe mondiale à des formations et d’information Les modèles de ChatGPT. Il rejoint Axel Springer et l’Associated Press qui ont conclu des offres similaires, où OpenAI offrirait des millions pour le droit d’utiliser le contenu. Cependant, ChatGPT a été formé sur de nombreux autres contenus Web récupérés pour lesquels OpenAI n’a pas payé. Alors pourquoi OpenAI paie-t-il pour certains ensembles de données et pas pour d’autres ?
Les accords de licence d’OpenAI semblent envoyer un message clair : nous allons utiliser votre contenu de toute façon, alors signez un accord avec nous ou être laissés pour compte. Le principal avantage d’un accord de licence semble être un point important dans les réponses de ChatGPT. Certains éditeurs peuvent également vouloir pour solidifier une relation avec le prochain grand canal de distribution d’informations avant qu’il ne prenne le contenu des éditeurs de toute façon.
OpenAI entraîne déjà ses modèles d’IA en partie sur “données disponibles au public» selon la directrice technique Mira Murati, ce qui semble volontairement vague. Qu’est-ce que sont des données disponibles au public de toute façon ? La expression suppose que tout est gratuit à lire sur Internet est également gratuit et peut être intégré à ChatGPT. Par exemple, Gizmodo fait partie des « données accessibles au public » d’OpenAI. mis en cache 34 000 fois sur le WebText de GPT-2 ensemble de données, le dernier ensemble de données qu’OpenAI a divulgué et utilisé pour entraîner un modèle d’IA.
Gizmodo est gratuit pour les lecteurs en grande partie à cause des annonces sur cette page Web. Si les lecteurs peuvent accéder à notre contenu via ChatGPT ce brise notre activité modèle. Le New York Times, qui est beaucoup plus utilisé dans l’ensemble de données WebText de GPT-2, a poursuivi OpenAI pour violation de droits d’auteur sur cette même question.
Un accord de licence de contenu avec OpenAI semble être le seul moyen pour les éditeurs de rester pertinents à l’ère de l’IA. communiqué de presse, John Ridding, PDG du Financial Times Group, affirme que cet accord « élargira la portée » de leur travail tout en offrant un « premier aperçu de la manière dont le contenu apparaît grâce à l’IA.
« Le problème avec l’IA, c’est qu’il ne s’agit pas vraiment d’intelligence artificielle », a déclaré Matthew Butterick, un avocat représentant Sarah Silverman et d’autres auteurs de livres poursuivant en justice. OpenAI, dans une interview avec Gizmodo. «C’est l’intelligence humaine qui a été récoltée à un endroit , divorcée de ses créateurs, puis ce grand une entreprise de technologie y met un prix et le vend à quelqu’un d’autre.
Butterick est le plaignant dans six procès en pour droits d’auteur contre des sociétés d’IA. comment l’IA peut menacer ces industries. D’une manière générale, ses cas se concentrent autour de l’affirmation selon laquelle l’IA utilise simultanément le travail des créateurs et menace leur moyen de subsistance.
Les accords de licence d’OpenAI ont soulevé un sourcil autour du contenu que ChatGPT utilise gratuitement. Les entreprises technologiques ont fait valoir que l’IA générative est une « utilisation équitable » d’œuvres protégées par le droit d’auteur, car cela les transforme en quelque chose de nouveau. Le monde de l’IA a également fait valoir qu’il utilise un modèle similaire à celui de Google. Recherche, qui met en cache le contenu protégé pour créer un outil de recherche d’informations utile. Semblable à Google, les chatbots IA ont récemment commencé à inclure des hyperliens. , un tribunal devra décider si l’IA générative est un « usage équitable ».
OpenAI n’a pas immédiatement répondu à la demande de commentaires de Gizmodo.
Les auteurs et éditeurs de livres ne sont pas les seuls dont OpenAI semble s’inspirer du contenu. Le New York Times a récemment rapporté qu’OpenAI avait formé GPT-4 sur terminé un million d’heures de vidéos YouTube transcritesQuelques jours avant la publication du rapport, le PDG de YouTube a déclaré que l’utilisation de ses vidéos pour la formation en IA constituerait une « violation claire » de ses politiques. .
Les accords de licence de contenu d’OpenAI brouillent les pistes de la discussion. La société utilise d’une manière ou d’une autre le contenu Internet gratuitement, tout en payant également d’autres pour leur travail. D’autres entreprises de technologie, comme Apple, auraient été plus proactives en payant pour toutes leurs données de formation. Adobe aurait payé 3 $par minute de vidéo pour entraîner son générateur vidéo IA.
Cependant, il n’est pas clair si même un paiement unique pour obtenir des données de formation en IA est suffisant. Nous parlons d’un outil qui pourrait potentiellement inverser l’industrie des médias pour les écrivains, les producteurs audio et vidéo, et plus encore. Signer un accord avec OpenAI pourrait vous garantir une bonne place dans les résultats de ChatGPT, mais il semble que le chatbot IA ait pu utiliser votre contenu de toute façon. Au moins pour l’instant, les entreprises d’IA sont disposés à tout utiliser sur Internet et à poser des questions sur la légalité de tout cela plus tard.
Une version de cet article paru à l’origine sur Gizmodo.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.