Le mathématicien Clive Humby premier dit En 2006, on a déclaré que « les données sont le nouveau pétrole » : précieuses, mais inutilisables si elles ne sont pas raffinées. Tout comme le pétrole, les données ont également un équivalent synthétique qui alimentera l’avenir de l’intelligence artificielle, selon John Myers, cofondateur et directeur technique de Gretel.
« Je pense que les données synthétiques seront essentiellement le carburant sous-jacent qui alimentera le développement des systèmes d’IA et plus particulièrement les données qui y sont intégrées », a déclaré Myers dans le dernier épisode de Quartz AI Factor, une série vidéo diffusée sur le site du marché Nasdaq (NDAQ).
Gretel fournit des données synthétiques aux entreprises pour améliorer les modèles d’IA et d’apprentissage automatique. Les données constituent la base du développement de systèmes et de la formation de modèles pour rendre l’IA plus intelligente et plus efficace à chaque utilisation.
« Je considère les données synthétiques de la même manière que l’huile synthétique », a-t-il déclaré. « Tous ceux qui conduisent une voiture aujourd’hui utilisent de l’huile synthétique. Ils savent simplement que c’est un peu comme de la vraie huile, mais qu’elle est fabriquée et qu’elle possède des qualités garanties qui garantissent que le moteur peut fonctionner sans problème. »
Les données synthétiques fonctionnent de la même manière. Il existe deux façons de créer des données synthétiques. La première consiste à prendre des données existantes et à les rendre sûres à utiliser : en réduisant le volume, en les rendant portables et en éliminant les risques liés à la confidentialité, a expliqué Myers. L’autre consiste à les créer « à partir de zéro », a-t-il déclaré, en générant des données qui n’existent pas pour résoudre des problèmes et créer de nouveaux produits.
Le cabinet de conseil Gartner a estimé que 60 % des données utilisées pour l’IA et l’analyse seraient générées de manière synthétique d’ici 2024. Le marché de la génération de données synthétiques est prévu devrait atteindre 2,1 milliards de dollars en 2028, contre 381,3 millions de dollars en 2022, selon BCC Research.
La confidentialité est l’un des principaux arguments de vente des données synthétiques, en particulier dans les secteurs hautement réglementés comme les services financiers et les soins de santé, qui traitent de nombreuses informations personnelles sensibles. Mais les données synthétiques peuvent également aider à combler les lacunes là où les données du monde réel font défaut et à compléter les données produites de manière organique qui sont obsolètes ou de mauvaise qualité.
Mais Myers ne considère pas que les données synthétiques remplacent les données brutes. Au lieu de cela, elles serviront de complément aux données et aux enregistrements réels.
« Je pense que vous allez découvrir qu’il y aura une limite assez large qui dira que lorsque nous voulons créer des applications ou mettre ces données en œuvre, nous devons prendre une version synthétique de ces données et l’utiliser », a déclaré Myers. « C’est ensuite là que vos applications seront créées au niveau de l’entreprise, tandis que ces données brutes seront utilisées pour les affiner et les transformer en données synthétiques. »
Regardez le dernier épisode de Quartz AI Factor ci-dessus.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.