OpenAI lance une nouvelle super IA « dotée d’une capacité de raisonnement »

OpenAI o1, nom de code Strawberry, vient d’être annoncé par OpenAI avec la capacité de traiter des questions complexes.

“Je suis très heureux de partager avec tout le monde les réalisations des récents travaux de l’équipe dans la création d’un modèle d’IA doté de réelles capacités de raisonnement”, a écrit OpenAI sur son blog le 12 septembre. « o1 est un grand modèle de langage formé à l’aide de l’apprentissage par renforcement pour effectuer des inférences complexes. OpenAI o1 réfléchit avant de répondre et peut créer une longue chaîne de pensées internes avant de répondre à l’utilisateur.

OpenAI o1 est connu sous le nom de code Strawberry. Photo de : Futurisme
OpenAI o1 porte le nom de code Strawberry. Photo de : Futurisme
Auparavant, selon Reuters, OpenAI a développé un grand modèle de langage (LLM) appelé Q*, alors connu sous le nom de code Strawberry et capable de raisonner sur des tâches complexes, peut mieux résoudre des problèmes et des défis que les modèles précédents dans les domaines scientifiques. codage et mathématiques. Sur X, Noam Brown, un chercheur axé sur l’amélioration du raisonnement dans les modèles LLM d’OpenAI, a confirmé Strawberry comme étant o1.

OpenAI indique que le nouveau LLM comporte deux modèles, nommés o1 et o1-mini. Parmi eux, o1 a commencé à être intégré à ChatGPT et à l’API.

Également dans le billet de blog, OpenAI a déclaré que le modèle o1 avait réussi 83 % des tests de sélection pour l’Olympiade internationale de mathématiques, se classant parmi les 500 meilleurs candidats. Ce nombre est bien supérieur aux 13% du GPT-4o. Le nouveau modèle d’IA s’est également classé à 89 % sur les questions de programmation compétitives (Codeforces), et a dépassé la précision du niveau doctoral sur les scores de référence en physique, biologie et chimie (GPQA).

Les chercheurs d’OpenAI notent que les performances de o1 sur des problèmes complexes seront améliorées grâce à des suggestions, appelées « enchaînement de pensées ». La société automatise désormais cette fonctionnalité afin que le modèle puisse résoudre lui-même le problème sans intervention de l’utilisateur.

« Nous avons formé les nouveaux LLM pour qu’ils passent plus de temps à réfléchir aux problèmes avant d’y répondre, comme le ferait une personne normale. Grâce à la formation, ils apprennent à affiner leur réflexion, à essayer différentes réponses et à reconnaître leurs erreurs », a déclaré OpenAI.

Selon Business Insider, l’apparition de o1 fait que « la frontière entre l’intelligence humaine et l’intelligence artificielle devient de plus en plus étroite ». Gary Marcus, professeur à l’Université de New York, a qualifié le nouveau modèle de « techniquement impressionnant », mais ne constitue pas une avancée majeure. “Je pense que c’est à la mode comme d’habitude, mais certainement pas proche de l’AGI”, a-t-il déclaré.

Bảo Lâm

D’après la source de Vnexpress ici

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *