Besoin d’un autre indicateur que l’industrie de l’intelligence artificielle générative est réelle et en réalisation de progrès ? ce qui constitue une étape essentielle dans la formation des modèles qui alimentent les produits d’IA, allant de ce qui est actuellement à la mode dans l’industrie - les chatbots ! des projets tels que des véhicules autonomes et des outils qui diagnostiquent des maladies.
Au cours de l’étape d’étiquetage des données, généralement, une équipe de humains identifiera les points de données, si c’est la gravité des dommages sur 100 000 photos de différentes voitures pour une compagnie d’assurance, ou des sentiments des personnes qui interagissent avec des agents d’assistance pour une société de service client. Annotation des données est une étape critique dans la formation de modèles en grands langages (LLM) comme le GPT d’OpenAI car il rend les modèles d’IA plus précis.
Suite à la sortie de ChatGPT par OpenAI en novembre dernier, les sociétés d’annotation de données ont reçu tellement de demande qu’elles poussent certaines d’entre elles à augmenter leurs prix. .
Realeyes est une entreprise basée à Londres qui utilise la vision par ordinateur pour lire et comprendre le comportement humain ; ces données sont ensuite utilisées pour améliorer la publicité. l’efficacité ou pour minimiser la fraude à l’identité. Puisque l’entreprise collectait et étiquetait des données pour ses propres algorithmes de vision par ordinateur, l’entreprise a décidé de deux il y a des années pour se lancer dans un service analogue d’étiquetage de données pour d’autres entreprises , a déclaré Mihkel Jäätma, le PDG de Realeyes, qui travaille avec plus de 200 entreprises dans les domaines des médias, de la technologie et de la publicité.
Le service d’étiquetage des données a commencé à générer des revenus l’année dernière, et l’entreprise est devenue « très grande, très rapidement », a-t-il déclaré. Jäätma estime que 80 % de l’activité provient d’entreprises qui cherchent essentiellement à rendre les avatars moins caricaturaux. « C’est vraiment une sorte d’explosion pour devenir une entreprise très substantielle. une partie de notre activité seulement au cours des deux dernières années et cela continue ainsi », a-t-il déclaré.
De la part des grandes entreprises technologiques et des start-ups d’IA bien financées, « l’investissement que nous constatons est que cela va être recouvert de [caractéristiques] très humaines », a-t-il déclaré. En d’autres termes, le travail maintenant consiste à créer ces avatars, des robots qui exposez des personnalités basées sur des personnages inventés ou sur des personnes réelles : comprenez les utilisateurs et parlez d’une manière plus humaine.
Depuis le lancement de son service d’étiquetage de données, Realeyes a augmenté les prix au moins deux fois. Jäätma a déclaré qu’il a dû dire aux clients que si ils n’étaient pas disposés à payer et Realeyes ne voulait pas répondre à la demande dans son intégralité.
Rendre les avatars plus humains
L’étiquetage des enregistrements audio et visuels est complexe. Il ne s’agit pas seulement de données extraites d’Internet. Des annotateurs humains travaillent par exemple à l’évaluation des émotions des gens. — et à mesure que ce travail devient plus nuancé, cela signifie payer davantage les annotateurs. (Realeyes aurait été embauché par Meta pour réaliser les avatars du géant de la tech, qui a déployé son posséder des avatars IA en septembre, plus humain.)
Pendant ce temps, Snorkel AI, une société spécialisée dans l’étiquetage de données, a déclaré que le nombre de demandes reçues au cours des trois derniers mois était plus de cinq fois le nombre total reçu au cours de toute l’année précédente, avec des demandes émanant de start-ups en phase de démarrage qui construisent des modèles en langage étendu ( LLM), ainsi que des agences gouvernementales et des entreprises informatiques.
La société basée à Redwood City, en Californie, n’a pas augmenté ses prix, mais elle a déployé des offres de services supplémentaires autour de la formation en IA depuis les besoins des clients. se sont diversifiés.
L’étiquetage des données représente déjà une industrie de 2,2 milliards de dollars
La croissance de l’étiquetage des données montre que les applications d’IA générative réalisent des progrès. « Avec ChatGPT et d’autres développements, les applications de l’IA ne sont pas “hors de portée”, a déclaré Devang Sachdev, vice-président du marketing chez Snorkel AI. L’essor des produits d’IA vient sous la forme de LLM du Des solutions comme Google et OpenAI sont également devenues beaucoup plus accessibles.
Le marché mondial de la collecte de données et de l’étiquetage a atteint 2,2 milliards de dollars en 2022 et devrait croître de près de 30 % de 2023 à 2030. selon au cabinet d’études de marché Grand View Research.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.