GPT-5.5 plafonne à 25% sur GeneBench, même OpenAI montre où son raisonnement casse
25 % de réussite pour GPT-5.5 sur un benchmark censé refléter du vrai travail scientifique. Même dans ses déclinaisons Pro, les meilleurs modèles d’OpenAI laissent encore l’essentiel des cas non résolus.
C’est tout l’intérêt — et toute la brutalité — de GeneBench, publié le 23 avril 2026 : mesurer...