Porté par Leandro von Werra, responsable de la recherche chez Hugging Face, et une équipe d’ingénieurs, le projet Open-R1 ambitionne de reconstruire le modèle R1 de DeepSeek de A à Z, en rendant publics tous ses composants, y compris les données d’entraînement. Si DeepSeek propose une licence permissive pour R1, permettant son utilisation sans restriction majeure, l’entreprise chinoise garde secret certains éléments clés, comme les outils de développement ou les jeux de données. Une approche « boîte noire » qui complique la reproduction et l’amélioration du modèle, selon les chercheurs d’Hugging Face.
Présenté comme surpassant les performances du modèle o1 d’OpenAI dans des domaines comme les sciences ou les mathématiques, R1 se distingue par sa capacité à s’auto-vérifier, réduisant les erreurs classiques des IA. Son succès rapide, notamment via une application gratuite en tête des téléchargements sur l’App Store ,a relancé les débats sur la compétition technologique entre la Chine et les États-Unis. Mais pour Hugging Face, l’urgence est ailleurs : il s’agit avant tout de « désopacifier » le processus de création d’IA.
À lire aussi :
L’IA DeepSeek est gratuite et puissante : découvrez pourquoi et comment l’utiliser
DeepSeek n’est pas aussi ouvert qu’il prétend l’être
« Sans accès aux données d’entraînement ou au code, il est impossible d’étudier en profondeur les biais ou d’adapter le modèle à des contextes sensibles », explique Elie Bakouch, ingénieur chez Hugging Face. C’est là tout l’enjeu d’Open-R1 : permettre à la communauté scientifique de comprendre, et de contrôler, les mécanismes derrière ces IA.
Pour y parvenir, l’équipe s’appuie sur le Science Cluster de Hugging Face, un serveur équipé de 768 GPU Nvidia H100, et sollicite l’aide de contributeurs externes via GitHub. Le projet, déjà suivi par 10 000 utilisateurs sur la plateforme, mise sur une collaboration massive pour reproduire les algorithmes et jeux de données de R1 en quelques semaines.
Si le pari est réussi, Open-R1 pourrait servir de base à une nouvelle génération de modèles open source, combinant performance et transparence. « L’innovation ouverte profite à tous, y compris aux grands laboratoires », rappelle Bakouch, convaincu que ce partage accélérera les avancées dans le domaine.
Chaque matin, WhatsApp s’anime avec les dernières nouvelles tech. Rejoignez notre canal Frandroid pour ne rien manquer !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix