Emergent Mind
简体中文 (Chinese, Simplified)
▾
English
العربية (Arabic)
简体中文 (Chinese, Simplified)
繁體中文 (Chinese, Traditional)
Français (French)
Deutsch (German)
हिन्दी (Hindi)
日本語 (Japanese)
한국어 (Korean)
Português (Portuguese)
Русский (Russian)
Español (Spanish)
“由人工智能驱动的人工智能新闻”
Emma
比较 GPT-4 和其他大型语言模型在复杂推理任务上的表现
(github.com)
通过 HackerNews
概要:
一项研究比较了 GPT-4 和其他大型语言模型(LLMs)在数学、科学、符号推理、知识和编码等复杂推理任务上的表现。
GPT-4 在 GSM8K 和 MMLU 任务上优于其他模型,而 65B LLaMA 模型的表现接近于 text/code-davinci-002 的表现。