OpenAI est-il à l’origine de gpt2-chatbot, le futur modèle de ChatGPT ?

OpenAI s’apprête-t-il à faire une annonce majeure ? Historiquement, la marque a toujours aimé dévoiler de nouvelles choses simultanément à ses concurrents, pour leur voler la vedette. La Google I/O le 14 mai et l’Apple WWDC le 10 juin sont des cibles parfaites pour le groupe de Sam Altman : il pourrait se laisser tenter par la sortie d’un nouveau modèle de langage pour contrecarrer les annonces en IA de ses concurrents. Reste à savoir si GPT-5, GPT-4.5, Sora, Q-Star ou quoi que ce soit d’autre sera prêt dans les temps.

En attendant, un mystérieux modèle de langage fait beaucoup parler de lui depuis le 29 avril. Apparu sur le comparateur de chatbots LMSYS, gpt2-chatbot est présenté par certains observateurs comme le potentiel successeur de GPT-4, ou du moins d’une version dérivée. Sam Altman, le patron d’OpenAI, s’est même amusé à tweeter qu’il avait « un faible pour gpt2 », en insistant bien sur l’absence de tiret. Il a modifié explicitement son tweet pour ôter toute ressemblance avec GPT-2, le prédécesseur de GPT-4, sorti en 2019. Que cache ce fameux gpt2-chatbot ?

Dans un tweet, Sam Altman entretient la rumeur gpt2. Il a volontairement supprimé le tiret pour aiguiser les soupçons.
Dans un tweet, Sam Altman entretient la rumeur gpt2. Il a volontairement supprimé le tiret pour aiguiser les soupçons.

Dans un tweet modifié, Sam Altman entretient la rumeur gpt2. Il a volontairement supprimé le tiret pour aiguiser les soupçons. // Source : Sam Altman

gpt2 ou GPT-2 : un tiret qui a toute son importance

Pourquoi retirer le tiret ?

[Lire la suite]

Crédits photos de l'image de une : ChatGPT triste // Source : Numerama