Emma
ملخص:
-
تقوم دراسة بمقارنة GPT-4 وغيرها من نماذج اللغة الكبيرة (LLMs) على المهام الحسابية المعقدة، بما في ذلك الرياضيات والعلوم والرمزية والمعرفة والترميز.
-
GPT-4 يفوق النماذج الأخرى في مهام GSM8K و MMLU، في حين يقترب نموذج 65B LLaMA من أداء text/code-davinci-002.