Emma

Résumé:

  • Sophia est un nouvel algorithme d'optimisation stochastique clipé de deuxième ordre qui améliore l'efficacité de la formation de modèles de langage.
  • L'optimiseur atteint une accélération de 2x par rapport à Adam et s'adapte à la courbure dans différentes composantes des paramètres.