Passer au contenu

Oumi veut rendre l’IA vraiment open source

L’intelligence artificielle open source fait beaucoup parler d’elle, mais en pratique, elle reste loin d’être totalement accessible. Prenez le modèle R1 de DeepSeek, ou encore Llama de Meta : ces modèles sont disponibles en open source… mais pas totalement ! Une nouvelle start-up veut ouvrir en grand les portes et les fenêtres de son IA, au plus grand bénéfice de tous.

Certaines parties clés des modèles IA « open source », comme les données d’entraînement ou les méthodes précises utilisées, restent sous clé. Il est donc mpossible pour les développeurs tiers de comprendre entièrement comment ces modèles ont été construits, et encore moins d’en créer de nouveaux à partir de zéro.

L’accès limité de l’IA en open source

C’est précisément ce que veut changer Oumi, une nouvelle startup fondée par d’anciens ingénieurs de Google et Apple. Avec le soutien de 13 grandes universités, dont Princeton, Stanford et Oxford, Oumi propose une plateforme conçue pour offrir un accès total aux outils nécessaires à la construction d’un modèle IA. Contrairement aux mastodontes comme OpenAI, qui investissent des milliards dans des infrastructures gigantesques, Oumi mise sur une approche plus agile et collaborative.

« Même les plus grandes entreprises ne peuvent pas faire ça seules », explique Oussama Elachqar, cofondateur d’Oumi et ancien ingénieur chez Apple. « On bossait chacun dans notre coin, et ce manque de collaboration ralentit énormément les avancées en IA. »

Là où DeepSeek ou Llama permettent simplement d’utiliser leurs modèles, Oumi veut donner aux chercheurs et aux développeurs tout ce qu’il faut pour en créer de nouveaux, sans avoir à deviner les étapes cachées du processus.

Son approche repose sur une plateforme tout-en-un, qui simplifie chaque étape de la construction d’un modèle IA. En général, développer un modèle demande de jongler avec plusieurs outils, souvent incompatibles entre eux. Oumi intègre directement tout le nécessaire : prise en charge de modèles de 10 millions à 405 milliards de paramètres, utilisation de techniques avancées, compatibilité avec les modèles texte et multimodaux, outils intégrés pour la synthèse et la sélection des données d’entraînement, options de déploiement via des moteurs modernes comme vLLM et SGLang, et évaluation des modèles sur les benchmarks standards.

L’objectif est d’éviter aux développeurs de perdre du temps à assembler des morceaux d’open source parfois incompatibles. « On n’a pas besoin de s’embourber dans le chaos du développement open source en essayant de faire fonctionner ensemble des outils qui ne sont pas faits pour ça », résume Manos Koukoumidis, CEO d’Oumi et ancien cadre chez Google Cloud AI.

Un des aspects les plus intéressants d’Oumi, c’est sa vision de l’infrastructure. Alors qu’OpenAI et d’autres géants misent sur des centres de données à plusieurs centaines de milliards de dollars, Oumi privilégie une approche décentralisée.

« L’idée qu’il faille des centaines de milliards pour l’IA est fondamentalement fausse », affirme Manos Koukoumidis. Selon lui, en répartissant la charge de calcul entre les universités et les centres de recherche, on peut obtenir des résultats tout aussi performants, mais à moindre coût.

Et Oumi ne compte pas s’arrêter à la recherche académique. Si son objectif immédiat est d’élargir la communauté open source, l’entreprise prévoit aussi de développer des outils pour les entreprises, afin de faciliter l’intégration de ces modèles en production.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode