Inflection déclare que son modèle d'IA peut désormais rivaliser avec GPT-4

Inflection AI vient de publier une mise à jour majeure du grand modèle de langage qui alimente son assistant personnel Pi. La start-up promet des performances qui se rapprochent de celles de GPT-4, le modèle utilisé par ChatGPT.

Célia Séramour

Publié le 11 mars 2024 à 16h26

PI assistant IA Inflection LLM — La version Inflection-2.5 alimente l'outil d'intelligence artificielle Pi capable de rédiger un texte, coder, aider à la planification d'un voyage, etc.

Elles sont nombreuses à vouloir se mesurer aux grands modèles de langage (LLM) d'OpenAI. La start-up américaine Inflection AI fait partie de celles-là et sa dernière annonce en est la preuve. L'entreprise a en effet dévoilé une mise à jour de son LLM, la version Inflection-2.5 qui alimente son outil d'intelligence artificielle Pi comparable à ChatGPT. L'outil est en effet capable de rédiger un texte, coder, aider à la planification d'un voyage, etc.

La start-up précise que la dernière version de son modèle profite de réglage de fine-tuning tout en gardant les caractéristiques qui lui sont propres et définies par l'entreprise, à savoir "être empathique, utile et sûre". Inflection-2.5 est disponible pour tous les utilisateurs de Pi aujourd'hui, sur pi.ai, sur iOS, sur Android, ou sur l'application de bureau récemment lancée.

Des performances qui se rapprochent de GPT-4 d'OpenAI

"Nous avons atteint cette étape avec une efficacité incroyable : Inflection-2.5 approche les performances de GPT-4, mais n'utilise que 40 % de la quantité de calcul pour l'entraînement", assure Inflection. Dans le détail, les différents benchmarks réalisés montrent que le modèle a particulièrement progressé dans les domaines STEM, à savoir les mathématiques et le codage avec une marge de progression comprise entre 30 et 40 %.

Dans sa batterie de tests, la start-up indique qu'Inflection-1 a utilisé environ 4 % des FLOP d'entraînement de GPT-4 et a, en moyenne, atteint environ 72 % du niveau de GPT-4 sur une gamme variée de tâches axées sur le QI (quotient intellectuel). Inflection-2.5, quant à lui, atteint plus de 94 % des performances moyennes de GPT-4.

Inflection-2.5 montre également des gains substantiels par rapport à Inflection-1 sur le benchmark MMLU (Massive Multitask Language Understanding). Enfin, sur BIG-Bench-Hard, un sous-ensemble de problèmes BIG-Bench difficiles pour les grands modèles de langage, Inflection-2.5 montre une amélioration de plus de 10 % par rapport à Inflection-1 et talonne les modèles les plus performants, y compris GPT-4.

Le chatbot intègre la recherche en ligne en temps réel

Par ailleurs, Pi intègre désormais des capacités de recherche en temps réel sur le web garantissant ainsi aux utilisateurs des informations de dernière minute et actualisées. A ce jour, l'assistant d'IA développé à partir du LLM compte un million d'utilisateurs actifs quotidiens et six millions d'utilisateurs actifs mensuels. La start-up affirme qu'ils ont désormais échangé plus de quatre milliards de messages avec Pi.

Une conversation avec Pi dure en moyenne 33 minutes et une sur dix plus d'une heure par jour. Partant de ce constat, Inflection estime que ses utilisateurs pourront discuter de plus de sujets et ce, plus longtemps.

La liste des concurrents de GPT-4 s'allonge

En dévoilant cette ultime version de son LLM, Inflection montre sa capacité à rivaliser avec les plus grands. L'entreprise n'est toutefois pas la seule. La semaine dernière, Anthropic a dévoilé Claude 3, une famille de modèles d'IA qui surpassent GPT-4, qui alimente la version payante de ChatGPT, et Gemini 1.0 Ultra, version payante de Gemini.

De même, la start-up française Mistral AI a annoncé un modèle, baptisé Mistral Large, dédié au raisonnement de haut niveau pour des tâches complexes qui égalent presque celles de GPT-4. La liste des modèles capables de s'attaquer au modèle le plus en vogue semble donc s'allonger plus vite que prévu.

Inflection déclare que son modèle d'IA peut désormais rivaliser avec GPT-4

Des performances qui se rapprochent de GPT-4 d'OpenAI

Le chatbot intègre la recherche en ligne en temps réel

La liste des concurrents de GPT-4 s'allonge

À lire aussi