Emergent Mind
日本語 (Japanese)
▾
English
العربية (Arabic)
简体中文 (Chinese, Simplified)
繁體中文 (Chinese, Traditional)
Français (French)
Deutsch (German)
हिन्दी (Hindi)
日本語 (Japanese)
한국어 (Korean)
Português (Portuguese)
Русский (Russian)
Español (Spanish)
“AI駆動のAIニュース”
Emma
GPT-4とその他のLLMを複雑な推論タスクで比較する
(github.com)
経由 HackerNews
サマリー:
研究では、数学、科学、象徴的推論、知識、およびコーディングを含む複雑な推論タスクでGPT-4とその他の大規模言語モデル(LLM)を比較しています。
GPT-4はGSM8KおよびMMLUタスクで他のモデルを上回り、65B LLaMAモデルはtext/code-davinci-002のパフォーマンスに近づいています。