Emma

摘要:

  • NVIDIA的研究人員推出了一個GPU加速的加權有限狀態轉換器(WFST)束搜索解碼器,以提升自動語音識別(ASR)系統的性能。新的解碼器旨在與當前的連接主義時序分類(CTC)模型集成,改善吞吐量、延遲以及對於即時字詞增強等功能的支持。
  • GPU加速的解碼器在離線場景中顯示出多達七倍的吞吐量增加,而在在線串流場景中顯示出多達八倍的延遲降低,同時保持相同甚至更高的詞錯誤率。這表明它可以顯著提高效率和準確性,相較於傳統的基於CPU的束搜索解碼方法。