Emma

摘要:

  • 作者比較了不同的大型語言模型(LLMs)用於生成醫學答案,以人體解剖學中的騎兵裂孔為例。
  • 這些模型顯示出不同程度的準確性,ChatGPT提供了最正確的信息,而LLaMa-70B無法將該術語識別為醫學術語。