Emma

Resumo:

  • Um novo modelo usa supervisão de processo para melhorar o raciocínio matemático e obter desempenho de última geração.
  • A supervisão de processo treina diretamente os modelos para produzir cadeias de pensamento endossadas por humanos e tem benefícios de alinhamento sobre a supervisão de resultados.