Emma

サマリー:

  • 著者は、医学的な回答の生成のために異なる大規模言語モデル(LLM)を比較し、人体解剖学の「騎兵の裂孔」を例に挙げています。
  • モデルには異なるレベルの正確さがあり、ChatGPTが最も正確な情報を提供する一方、LLaMa-70Bはその用語を医学的なものとして認識できません。