L’IA est sur le point d’être formée sur des millions de publications Reddit

Les publications sur Reddit formeraient apparemment la prochaine génération de modèles d’IA, à la suite des protestations des modérateurs de l’année dernière concernant l’accès à l’API.

Nous pouvons gagner une commission sur les liens sur cette page.
Image de l'article intitulé L’IA est sur le point d’être formée sur des millions de publications Reddit
Photo: Jaap Arriens/NurPhoto (Getty Images)

Reddit aurait signé un accord de 60 millions de dollars avec une « grande entreprise d’IA » pour permettre à ses communautés en ligne récupéré pour les données d’entraînement à l’IA, selon Bloomberg vendredi. La société d’IA sans nom passera aussoir des millions de posts sur Reddit, et entraînera un grand modèle de langage sur les threads de Reddit.

Publicité

Reddit serait évaluer une introduction en bourse avec une valorisation de 5 milliards de dollars, bien qu’il n’ait rapporté que 800 millions de dollars de revenus l’année dernière. Reddit n’est pas rentable mais a une riche valorisation car ses communautés en ligne offrent un terrain d’entraînement idéal pour les modèles d’IA. Cependant, accorder une licence aux pensées et aux idées de votre base d’utilisateurs n’est pas toujours bien réciproque. les subreddits les plus populaires sont devenus sombres en signe de protestation l’année dernière après que les utilisateurs ont eu des problèmes avec l’entreprise facturer l’accès à son interface de programmation d’application (API), annoncé pour la première en avril 2023.

L’accord signalé par Reddit avec une « grande société d’IA sans nom » est exactement ce que la plateforme recherchait. Les grandes technologies ont soif de données , et ce a transformé des organisations de presse , des forums communautaires et même l’Université du Michigan en de simples fermes de contenu. Ces offres, bien que bouleversantes pour les utilisateurs, offrent à Reddit un chemin vers la rentabilité.

Publicité

« Le corpus de données Reddit est vraiment précieux », a déclaré Steve Huffman, PDG de Reddit. Le New York Times en avril. « Mais nous n’avons pas besoin de donner gratuitement toute cette valeur à certaines des plus grandes entreprises du monde. .»

Publicité

Mais lorsque Reddit a commencé à facturer l’accès aux API, il n’a pas seulement facturé les grandes entreprises, il a également commencé à facturer les petits chercheurs indépendants. Ce changement a rendu plus difficile pour les modérateurs de Reddit de gérer leurs communautés, et certains ont fait valoir que cela rendait l’expérience pire pour les utilisateurs. Les 800 millions d’utilisateurs actifs mensuels de Reddit.

Publicité

“Nous pensons que la longévité et le succès de cette plateforme reposent sur la préservation du riche écosystème qui s’est développé autour d’elle”, ont déclaré les modérateurs de Reddit. dans un lettre collective de juin dernier. « La perte potentielle de ces services due au changement de tarifications aurait un impact significatif notre capacité à modérer efficacement, donc affectant négativement l’expérience des utilisateurs de nos communautés.

Reddit n’a pas immédiatement répondu à la demande de commentaires de Gizmodo.

Apple était explorer des contrats d’IA de 50 millions de dollars avec le New York Times, Condé Nast et d’autres éditeurs d’actualités en décembre. Shutterstock est également autoriser son contenu créé par l’homme à OpenAI pour une formation sur ses modèles. Twitter, Instagram et YouTube sont également devenus de plus en plus précieux ces dernières années, car ils sont désormais considérés comme contenu des mines d’or.

Publicité

La plateforme a également introduit des publicités ces dernières années et l’a fait impossible pour les utilisateurs de désactiver de voir le contenu des annonceurs en 2023À mesure que Reddit devient une entreprise publique, les utilisateurs craignent de plus en plus que la gestion nuise au forum communautaire florissant qu’elle a construit.

Il existe également une plus grande inquiétude quant à la manière dont les sociétés d’IA accordent des licences aux données. Les plateformes de contenu signent des accords de licence d’un million de dollars avec des sociétés d’IA, mais les véritables personnes qui ont créé ce contenu n’obtiennent rien. Pendant ce temps, l’IA menace pour remplacer les créateurs de contenu dans les secteurs de l’édition, du graphisme et du cinéma.

Publicité

Cet article a été initialement publié sur Gizmodo.

Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.

Publicité