Emma

सारांश:

  • NVIDIA शोधकर्ताओं ने स्वचालित भाषा पहचान (ASR) सिस्टम के प्रदर्शन को बढ़ाने के लिए GPU-त्वरित वजनित सीमा स्थिति प्रवाह खोज डिकोडर पेश किया है। नया डिकोडर मौजूदा कनेक्शनिस्ट टेम्पोरल क्लासिफिकेशन (CTC) मॉडल के साथ मिलाने के लिए डिज़ाइन किया गया है, जो थ्रूपुट, ल्याटेंसी और वाक्य-विशेष शब्दों के लिए ऑन-द-फ्लाई संयोजन की समर्थन में सुधार करता है।
  • ऑफ़लाइन परिदृश्य में, GPU-त्वरित डिकोडर ने तकरीबन सात गुना अधिक थ्रूपुट और ऑनलाइन स्ट्रीमिंग परिदृश्य में आठ गुना कम ल्याटेंसी दिखाई, जबकि वही शब्द त्रुटि दर बनाए रखते हुए। यह दिखाता है कि यह पारंपरिक CPU पर आधारित सीमा स्थिति खोज डिकोडिंग विधि की तुलना में काफी अधिकता और सटीकता में सुधार कर सकता है।