मेटा ने लॉन्च किया आवाज समझने वाला AI सिस्टम, समझ सकता है 1,600 से ज्यादा भाषाएं
क्या है खबर?
टेक कंपनी मेटा की आर्टिफिशियल इंटेलिजेंस (AI) रिसर्च टीम (FAIR) ने ओमनीलिंगुअल ASR नाम की नई तकनीक पेश की है। यह एक ऐसी स्पीच रिकॉग्निशन सिस्टम है, जो 1,600 से ज्यादा भाषाओं को समझकर उन्हें लिखित रूप में बदल सकती है। इसमें 500 ऐसी भाषाएं भी शामिल हैं, जिन्हें पहले कभी AI तकनीक का समर्थन नहीं मिला था। मेटा का कहना है कि यह नई तकनीक दुनियाभर में लोगों को डिजिटल सेवाओं तक आसानी से पहुंचने में मदद करेगी।
काम
कैसे काम करता है ओमनीलिंगुअल ASR सिस्टम?
मेटा का यह नया ओपन-सोर्स सिस्टम ऑटोमटेट स्पीच रिकॉग्निशन तकनीक पर आधारित है। यह मौजूदा वॉइस रिकग्निशन टूल्स से कई गुना ज्यादा भाषाएं समझ सकता है। ज्यादातर मौजूदा सिस्टम सिर्फ अंग्रेजी या कुछ बड़ी भाषाओं तक सीमित हैं, लेकिन यह मॉडल कम प्रसिद्ध भाषाओं को भी पहचानने में सक्षम है। इसका मकसद है कि हर भाषा बोलने वाला व्यक्ति AI तकनीक का लाभ ले सके, चाहे उसके पास डिजिटल संसाधन हों या नहीं।
मदद
डाटा संग्रह में वैश्विक समुदायों की मदद ली गई
ओमनीलिंगुअल ASR में मेटा ने wav2vec 2.0 तकनीक का इस्तेमाल किया है, जिसमें करीब 7 अरब पैरामीटर हैं। इसे कई उच्चारणों, बोलियों और भाषाई पैटर्नों पर प्रशिक्षित किया गया है। इसके लिए कंपनी ने मोजिला कॉमन वॉइस, लैनफ्रिका और नाइजीरियावॉइस जैसे प्रोजेक्ट्स के साथ मिलकर काम किया। स्थानीय वक्ताओं से असली रिकॉर्डिंग और आवाजें लेकर इसे पहले से कहीं ज्यादा सटीक, वास्तविक और विविध डाटासेट पर तैयार किया गया है।
भविष्य
सटीकता में सुधार और भविष्य की दिशा
मेटा का कहना है कि यह मॉडल अब तक का सबसे बड़ा प्रयास है, लेकिन कुछ भाषाओं में इसकी सटीकता अभी भी सीमित है। उच्च संसाधन वाली भाषाओं में 95 प्रतिशत से अधिक सफलता, जबकि कम संसाधन वाली भाषाओं में लगभग 36 प्रतिशत सफलता दर मिली। कंपनी ने इस मॉडल को ओपन-सोर्स कर दिया है, ताकि शोधकर्ता और डेवलपर इसे और बेहतर बना सकें। मेटा का मानना है कि यह तकनीक सुपर इंटेलिजेंस की दिशा में एक मजबूत कदम है।