Le PDG de Reddit critique Microsoft et les startups d’IA pour leur récupération de données

Steve Huffman affirme que bloquer ces entreprises « a été un véritable casse-tête »

Nous pouvons gagner une commission sur les liens sur cette page.
Image de l'article intitulé Le PDG de Reddit critique Microsoft et les startups d’IA pour leur récupération de données
Photo: Jakub Porzycki/NurPhoto (Getty Images)

Steve Huffman, PDG de Reddit, en a assez des entreprises d’IA qui récupèrent les publications de la plateforme de médias sociaux pour extraire des données afin de former leurs derniers modèles d’IA.

Publicité

Dans une interview avec The Verge, a déclaré le directeur : « Microsoft, Anthropic et Perplexity ont agi comme si tout le contenu sur Internet était gratuit pour leur utilisation. »

« Cela a été un véritable casse-tête de bloquer ces entreprises », a-t-il ajouté.

Publicité

Les commentaires de Huffman interviennent juste une semaine après des rapports indiquent que les publications Reddit n’apparaissaient que sur le moteur de recherche de Google, pas Bing de Microsoft, DuckDuckGo, ou d’autres alternatives. Reddit a conclu en février un accord de licence de 60 millions de dollars par an avec Google, qui permet au géant de la technologie d’entraîner son IA sur les publications des utilisateurs de Reddit. The Verge a rapporté en juin que Reddit a mis à jour son site pour bloquer les entreprises qui n’ont pas conclu de tels accords en parcourant les publications. Reddit n’a pas d’accords avec Microsoft ou les start-ups de l’IA Anthropic et Perplexity.

Publicité

Les employés de Microsoft et d’Anthropic auraient confirmé qu’ils n’avaient pas été autorisés à explorer Reddit pour rechercher des données.

Publicité

Comme le dit Matthew McConaughey dans des publicités pour Salesforce, « les données sont le nouvel or » à l’ère de l’IA en rapide évolution. Les développeurs de chatbots se sont tournés vers les confins d’Internet pour obtenir gratuitement du texte, des images, des vidéos et du code afin d’apprendre à leurs logiciels à se comporter comme des humains. Mais leur appétit irréfléchi pour les données gratuites les a placés dans la ligne de mire de poursuites judiciaires intentées par des auteurs, des artistes et des journaux.

Huffman a déclaré à The Verge : « Nous n’avons pas notre mot à dire ni aucune connaissance de la manière dont nos données sont affichées et de l’usage qu’elles en font, ce qui nous met désormais dans une position où nous devons bloquer les personnes qui n’ont pas voulu accepter la manière dont nous souhaitons que nos données soient utilisées ou non. »

Publicité

Mais la sanction infligée à Microsoft par Reddit pose un problème : elle renforce la domination de Google sur le marché de la recherche, alors même que cette domination fait l’objet d’une surveillance réglementaire majeure. Jordi Ribas, responsable de la recherche chez Microsoft, dit dans un article sur X que Reddit « favorise un autre moteur de recherche et impacte la concurrence de Bing et des moteurs propulsés par Bing ».

Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.

Publicité