Deepseek accusé de tirer parti des données OpenAI, de suspendre les préoccupations éthiques

Openai soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, peuvent avoir été formés à l'aide des données d'Openai. Cette révélation, associée à la montée rapide de la popularité de Deepseek, a déclenché une plongeon boursier pour les principaux acteurs de l'IA. Nvidia, un fournisseur de GPU clé pour l'IA, a subi la plus forte perte d'une journée dans l'histoire de Wall Street, perdant près de 600 milliards de dollars de valeur marchande. D'autres sociétés comme Microsoft, Meta, Alphabet et Dell ont également connu des baisses importantes.

Le modèle R1 de Deepseek, basé sur l'open source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport aux modèles occidentaux. Bien que cette réclamation soit contestée, elle a alimenté les préoccupations des investisseurs concernant les investissements massifs dans l'IA par les entreprises technologiques américaines. L'application de Deepseek a rapidement grimpé les graphiques de téléchargement américains, soulignant davantage la controverse.

OpenAI et Microsoft examinent si Deepseek a violé les conditions d'utilisation d'Openai en utilisant son API pour "distiller" les données des modèles d'Openai. OpenAI reconnaît que les entreprises chinoises tentent fréquemment de reproduire les modèles d'IA en tête, soulignant ses efforts pour protéger sa propriété intellectuelle et collaborer avec le gouvernement américain pour contrer de telles actions.

David Sacks, conseiller de l'IA du président Trump, soutient l'affirmation selon laquelle Deepseek a utilisé la distillation, une technique qui extrait les données de modèles plus grands. Il prévoit que de nouvelles mesures de la direction des entreprises d'IA pour empêcher cette pratique.

La situation met en évidence l'ironie des accusations d'Openai, étant donné sa propre histoire d'utiliser le matériel protégé par le droit d'auteur pour former le chatppt. Openai a précédemment fait valoir que la création de modèles d'IA comme Chatgpt sans matériel protégé par le droit d'auteur est impossible, une position soutenue par leur soumission à la Chambre des Lords du Royaume-Uni. Ce poste est encore compliqué par les poursuites du New York Times et 17 auteurs alléguant une violation du droit d'auteur. Le paysage juridique entourant les données de formation de l'IA reste très controversé, en particulier à la lumière d'un bureau de copyright américain de 2018, la décision de l'art généré par l'IA n'est pas des droits d'auteur.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.