Le 17 avril 2026, OpenAI a mis en ligne GPT-Rosalind, son premier modèle de raisonnement pensé pour la biologie, la découverte de médicaments et la médecine translationnelle.
Le nom rend hommage à Rosalind Franklin, dont la cristallographie aux rayons X a rendu visible la structure de l’ADN.
La presse anglophone a aussitôt parlé de « concurrent direct d’AlphaFold 3 », ce qui est techniquement faux.
Cette confusion risque de coûter plusieurs jours aux équipes R&D francophones qui doivent décider quoi tester cette semaine.
Ce guide démonte l’annonce : ce que le modèle fait, les benchmarks publiés, son articulation avec AlphaFold 3 et Chai-1, et les décisions à trancher pour un CTO biotech francophone.
En bref
- GPT-Rosalind orchestre, ne plie pas de protéines : il lit la littérature, formule des hypothèses, planifie les expériences et délègue la structure 3D à AlphaFold 3 ou Chai-1
- Benchmarks chiffrés : BixBench 0,751 vs 0,732 pour GPT-5.4 et 0,698 pour Grok 4.2, 6 familles battues sur 11 en LABBench2, 95e percentile humain chez Dyno Therapeutics
- Preview gratuite mais fermée aux Français : accès réservé aux entreprises US qualifiées via le Trusted Access Program, vérification biosafety obligatoire
- Fine-tuning au scepticisme : première fois qu’OpenAI livre un modèle entraîné à refuser les cibles fragiles plutôt qu’à complaire
- Deux routes pour la R&D francophone : attendre l’ouverture EU ou basculer sur la pile ESM3 plus Chai-1 plus Boltz-1 auto-hébergée
Ce qu’OpenAI a annoncé le 17 avril 2026
OpenAI a positionné GPT-Rosalind comme le premier modèle d’une série verticale dédiée aux sciences du vivant
L’annonce a été relayée le jour même par FierceBiotech, Pharmaphorum et The Next Web
Le modèle est entraîné à raisonner sur la biologie, pas à générer des structures 3D de protéines
Les partenaires publics incluent Amgen, Moderna, Thermo Fisher Scientific, Novo Nordisk, Broad Institute, Allen Institute, Los Alamos et UCSF School of Pharmacy
NVIDIA fournit le calcul, Benchling assure la connexion avec les cahiers de laboratoire numériques
Séan Bruich, SVP AI chez Amgen, résume la logique : accélérer le délai thérapeutique en appliquant des outils avancés à des tâches nouvelles
Joy Jiao, responsable Life Sciences Research chez OpenAI, tempère : le modèle est conçu pour accélérer les phases chronophages, pas pour remplacer le chercheur
Un modèle de raisonnement, pas un prédicteur structural
La chaîne R&D pharma moderne empile plusieurs modèles spécialisés qui parlent des langages différents
En haut de la pile, un moteur de raisonnement scientifique lit les articles et planifie les étapes, en dessous des prédicteurs structuraux comme AlphaFold 3, Chai-1 ou Boltz-1 transforment une séquence en coordonnées atomiques 3D
GPT-Rosalind occupe le premier étage, pas le second
Ce que GPT-Rosalind fait
Le modèle est calibré pour cinq tâches concrètes listées par OpenAI :
- Synthèse de littérature scientifique : compilation de centaines d’articles PubMed et extraction des preuves convergentes
- Génération d’hypothèses mécanistiques : propositions de voies biologiques classées par solidité
- Planification expérimentale : protocoles CRISPR, clonage et essais cellulaires avec choix des réactifs
- Interprétation multi-omique : lecture de jeux transcriptomiques, protéomiques et métabolomiques
- Validation de cibles : classement d’un pipeline thérapeutique selon des critères de faisabilité
Ce qu’il ne fait pas
GPT-Rosalind ne génère pas de coordonnées atomiques 3D
Il ne plie pas de protéines, ne conçoit pas de molécules de novo, ne remplace pas un docking classique
OpenAI renvoie pour cela vers AlphaFold 3 et Chai-1 appelés comme outils externes
L’erreur fréquente consiste à présenter le modèle comme alternative à AlphaFold 3 : les deux coexistent, ils ne se substituent pas
Le plugin Codex pour les sciences du vivant
OpenAI a livré un plugin gratuit pour Codex
Il connecte les modèles mainstream à plus de 50 outils scientifiques : PubMed, ClinicalTrials.gov, UniProt, ChEMBL, AlphaFold Atlas et STRING-DB
Pour un labo sans accès GPT-Rosalind, ce plugin est déjà un levier utilisable
Il s’inscrit dans la logique de raisonnement inaugurée avec o1, appliquée à un domaine très normé
Benchmarks publiés et barre « sceptique par défaut »
Trois évaluations ancrent les promesses du modèle : BixBench, LABBench2 et une collaboration industrielle avec Dyno Therapeutics
Les chiffres viennent d’OpenAI et ont été confirmés par FierceBiotech, réserve utile d’un biais d’entraînement sur les évaluations publiques
BixBench et LABBench2 : la mesure publique
BixBench est un benchmark bio-informatique maintenu par Edison Scientific : 53 scénarios d’analyse, 296 questions, agent posé devant un notebook Jupyter vide
Sur ce banc, GPT-Rosalind obtient 0,751 pass@1, devant GPT-5.4 à 0,732, GPT-5 à 0,728, Grok 4.2 à 0,698 et Gemini 3.1 Pro à 0,550
L’écart avec la pointe généraliste est de 2 points, pas de dix
LABBench2 pèse 1 900 tâches en 11 familles, et GPT-Rosalind bat GPT-5.4 sur 6 familles, avec un gain maximal sur CloningQA
Le test Dyno Therapeutics : le vrai signal
La mesure la plus citée provient d’une évaluation chez Dyno Therapeutics, spécialisée dans la conception de capsides AAV pour thérapie génique
Dyno a fourni des séquences ARN inédites, non publiées, pour éviter la contamination de benchmark
Sur la prédiction séquence-fonction, les meilleures dix soumissions de GPT-Rosalind ont atteint au-dessus du 95e percentile d’experts humains
Sur la génération, le score tombe à 84e percentile, un résultat à lire avec prudence
Ce chiffre mesure une sous-tâche précise, pas la performance globale du modèle sur toute la R&D biologique
Le fine-tuning au scepticisme
Le point de différenciation le plus intéressant n’est pas un chiffre, c’est un choix d’entraînement
OpenAI a conditionné GPT-Rosalind à refuser les cibles fragiles plutôt qu’à valider par défaut
Le modèle est entraîné à dire « cette hypothèse manque de preuves, je ne la valide pas » au lieu de broder une réponse plaisante, une posture qui évite trois mois de livrables inutiles à une équipe qui valide un brief mal posé
Dans un contexte où une cible mal priorisée peut coûter plus de 2 milliards de dollars sur le cycle clinique, la bascule du modèle complaisant au modèle désagréable a une valeur économique directe
C’est la première fois qu’OpenAI livre publiquement cette posture

Cartographie des verticaux bio-IA : GPT-Rosalind orchestre, les autres exécutent
Analogie utile : la pile bio-IA 2026 fonctionne comme une cuisine étoilée
Les prédicteurs structuraux sont les chefs de partie, GPT-Rosalind est le chef de brigade qui séquence le service
Chacun a sa spécialité, aucun ne remplace les autres
Les prédicteurs structuraux propriétaires et open source
AlphaFold 3 reste la référence structurale : prédiction 3D de complexes protéine-ligand-ADN-ARN, gain de 50 % sur PoseBusters face à AF2
Isomorphic Labs a signé des deals totalisant près de 3 milliards de dollars avec Eli Lilly et Novartis
Evo 2 adresse la génomique longue : 40 milliards de paramètres, contexte d’1 mégabase, utile pour les régions régulatrices
ESM3 unifie séquence, structure et fonction dans un même modèle multimodal
Chai-1 reproduit la qualité AlphaFold 3 en open source, avec ou sans alignement multiple
Boltz-1 est encore plus hackable, entraînement et architecture publiés, actuellement le modèle le plus transparent du lot
Rôles dans un workflow R&D
Grille de lecture pour un responsable R&D :
- GPT-Rosalind : orchestrateur, synthèse littérature, hypothèses, planification
- AlphaFold 3 : structure 3D de complexes, accès pharma restreint
- Evo 2 : génomique longue open source jusqu’à 1 Mb
- ESM3 : design de protéines multimodal avec contraintes
- Chai-1 et Boltz-1 : alternatives open à AlphaFold 3, installables en local
Un CTO biotech qui annonce à son board « on passe d’AlphaFold 3 à GPT-Rosalind » commet une erreur de grammaire architecturale : on passe plutôt de « scripts ad hoc » à « orchestrateur qui appelle AlphaFold 3 proprement »
Accès restreint, prix flou, souveraineté et biosécurité
Le volet économique et juridique, peu traité par la presse francophone, tranche ce que peut faire une PME biotech française cette semaine
La preview : gratuite, US Enterprise, safety review
Pendant la research preview, l’usage de GPT-Rosalind ne consomme ni tokens ni crédits
L’accès est conditionné à quatre critères cumulatifs :
- Entreprise avec contrat Enterprise : ChatGPT, Codex ou API Enterprise
- Siège social ou entité juridique US : les structures UE ne sont pas supportées
- Usage de recherche biologique légitime orienté santé humaine
- Contrôles SOC 2 Type 2, HIPAA, BAA disponibles, audit biosafety
OpenAI n’a publié aucun pricing post-preview, et l’hypothèse raisonnable reste une licence Enterprise custom
Souveraineté FR/EU et biosécurité
Pour un labo francophone, l’équation est claire : pas d’accès direct avant l’ouverture EU
Les voies disponibles se limitent au détour via un partenaire US qualifié, typiquement une filiale d’Amgen ou un collaborateur du Broad Institute
Côté RGPD, les données de santé tombent sous l’article 9, et la contractualisation doit prévoir un transfert hors UE
Plus de 100 chercheurs ont signé une lettre ouverte demandant un contrôle plus strict des données biologiques sensibles
OpenAI a répondu avec un système de « high-precision flags » qui déclenche une alerte dès que des seuils dual-use sont franchis

Trois décisions concrètes à trancher cette semaine
Le lecteur francophone a trois profils probables, chacun avec une décision différente à prendre
PME biotech et labo académique
Cas concret : une biotech française de 12 personnes travaille sur un anticorps anti-cancer colorectal
Avant : trois semaines de biblio croisée et de réunions d’hypothèses
Avec GPT-Rosalind via un partenariat Broad Institute : 2 heures pour 40 papers synthétisés, 6 hypothèses classées et un protocole de validation
Le ROI dépend du coût d’entrée dans un partenariat US, avec souvent un partage de propriété intellectuelle
Pour un labo INSERM ou CNRS sans filiale américaine, héberger ESM3 sur le HPC Jean Zay reste viable et préserve la souveraineté data
Chez Owkin ou InstaDeep, l’arbitrage a déjà été posé : on continue à investir dans la pile open source propriétaire, et on surveille GPT-Rosalind pour ce qui relève de la synthèse littérature, pas pour ce qui touche aux données patient
Dev IA francophone : quel retour sur investissement
Pour un freelance ou une ESN qui construit des offres de conseil biotech, ajouter un workflow GPT-Rosalind suppose deux investissements
Le premier : maîtriser le plugin Codex gratuit, accessible sans Trusted Access Program
Le second : monter une démo Chai-1 ou Boltz-1 en parallèle, pour proposer la version open source aux clients bloqués par l’accès US
La pile hybride plugin Codex plus open source local couvre 80 % des cas d’usage d’une PME biotech sans dépendance au trusted access
La formation représente environ 5 jours de ramp-up pour un data engineer déjà à l’aise avec LangChain
Quarante-huit heures après le lancement, trois signaux méritent d’être suivis : la publication des premières reviews indépendantes, l’annonce d’une ouverture EU, et un pricing public post-preview
La question stratégique reste : quand un modèle vertical vaut-il mieux qu’un généraliste plus RAG maison ?
Pour prolonger, lire le guide technique 2026 du RAG appliqué à la recherche
Questions fréquentes sur GPT-Rosalind
GPT-Rosalind est-il un concurrent direct d’AlphaFold 3 ?
Non, GPT-Rosalind raisonne et AlphaFold 3 prédit des structures 3D, ils coexistent dans une pile R&D où le premier appelle le second comme outil
Puis-je accéder à GPT-Rosalind depuis la France aujourd’hui ?
Pas directement, l’accès est réservé aux entreprises US qualifiées via le Trusted Access Program, un labo français doit passer par un partenariat US ou attendre l’ouverture EU
Combien coûte GPT-Rosalind ?
Pendant la research preview, l’usage ne consomme pas de tokens ni de crédits pour les entreprises approuvées, aucun pricing public post-preview n’a été annoncé
Quels sont les partenaires annoncés ?
Amgen, Moderna, Thermo Fisher, Novo Nordisk, Allen Institute, Broad Institute, Los Alamos, NVIDIA, Oracle Health, Benchling, UCSF School of Pharmacy et Retro Biosciences
Que signifie « fine-tuning au scepticisme » ?
OpenAI a entraîné le modèle à refuser les cibles fragiles ou les hypothèses sous-documentées plutôt qu’à broder une réponse complaisante
Sur quelles tâches GPT-Rosalind bat-il GPT-5.4 ?
Sur BixBench à 0,751 contre 0,732, et sur 6 des 11 familles de LABBench2 avec le gain le plus net sur CloningQA
Le modèle peut-il générer une protéine nouvelle ?
Pas directement, la génération de novo reste du ressort d’ESM3 ou de Chai-1, GPT-Rosalind peut cadrer la demande et appeler ces outils
Quelles alternatives open source existent aujourd’hui ?
Pour la structure 3D Chai-1 et Boltz-1 installables en local, pour le design de protéines ESM3, pour la génomique longue Evo 2
Quel est le risque dual-use évoqué par les chercheurs ?
Plus de 100 scientifiques demandent un contrôle plus strict des données d’entraînement par crainte d’usages détournés sur des agents pathogènes, OpenAI a répondu par les high-precision flags
Quels chiffres publiés sont vérifiables indépendamment ?
Les scores BixBench et LABBench2 reposent sur des benchmarks Edison Scientific consultables, le test Dyno utilise des séquences non publiées et reste à corroborer
Articles Similaires
Claude 4.7 coûte plus cher : 7 leviers pour garder sa facture API sous contrôle
Anthropic a mis en ligne Opus 4.7 le 16 avril 2026 avec la formule la plus rassurante possible : tarif inchangé, $5 par million de tokens en entrée, $25 en…
Construire des agents qui ne cassent plus : la nouvelle stack d’OpenAI expliquée
En 2026, plus aucune entreprise digitale ne se demande si elle doit intégrer un agent IA quelque part : service client, génération de devis, tri de tickets, analyse de contrats….