Emergent Mind
繁體中文 (Chinese, Traditional)
▾
English
العربية (Arabic)
简体中文 (Chinese, Simplified)
繁體中文 (Chinese, Traditional)
Français (French)
Deutsch (German)
हिन्दी (Hindi)
日本語 (Japanese)
한국어 (Korean)
Português (Portuguese)
Русский (Russian)
Español (Spanish)
“由人工智慧驅動的人工智慧新聞”
Emma
NVIDIA研究人員開發了一個GPU加速的加權有限狀態轉換器(WFST)束搜索解碼器,以改善語音識別
(marktechpost.com)
通過 /r/machinelearningnews
摘要:
NVIDIA的研究人員推出了一個GPU加速的加權有限狀態轉換器(WFST)束搜索解碼器,以提升自動語音識別(ASR)系統的性能。新的解碼器旨在與當前的連接主義時序分類(CTC)模型集成,改善吞吐量、延遲以及對於即時字詞增強等功能的支持。
GPU加速的解碼器在離線場景中顯示出多達七倍的吞吐量增加,而在在線串流場景中顯示出多達八倍的延遲降低,同時保持相同甚至更高的詞錯誤率。這表明它可以顯著提高效率和準確性,相較於傳統的基於CPU的束搜索解碼方法。