मेटा ने लॉन्च किया आवाज समझने वाला AI सिस्टम, समझ सकता है 1,600 से ज्यादा भाषाएं

Nov 11, 2025

01:47 pm

क्या है खबर?

टेक कंपनी मेटा की आर्टिफिशियल इंटेलिजेंस (AI) रिसर्च टीम (FAIR) ने ओमनीलिंगुअल ASR नाम की नई तकनीक पेश की है। यह एक ऐसी स्पीच रिकॉग्निशन सिस्टम है, जो 1,600 से ज्यादा भाषाओं को समझकर उन्हें लिखित रूप में बदल सकती है। इसमें 500 ऐसी भाषाएं भी शामिल हैं, जिन्हें पहले कभी AI तकनीक का समर्थन नहीं मिला था। मेटा का कहना है कि यह नई तकनीक दुनियाभर में लोगों को डिजिटल सेवाओं तक आसानी से पहुंचने में मदद करेगी।

काम

कैसे काम करता है ओमनीलिंगुअल ASR सिस्टम?

मेटा का यह नया ओपन-सोर्स सिस्टम ऑटोमटेट स्पीच रिकॉग्निशन तकनीक पर आधारित है। यह मौजूदा वॉइस रिकग्निशन टूल्स से कई गुना ज्यादा भाषाएं समझ सकता है। ज्यादातर मौजूदा सिस्टम सिर्फ अंग्रेजी या कुछ बड़ी भाषाओं तक सीमित हैं, लेकिन यह मॉडल कम प्रसिद्ध भाषाओं को भी पहचानने में सक्षम है। इसका मकसद है कि हर भाषा बोलने वाला व्यक्ति AI तकनीक का लाभ ले सके, चाहे उसके पास डिजिटल संसाधन हों या नहीं।

मदद

डाटा संग्रह में वैश्विक समुदायों की मदद ली गई

ओमनीलिंगुअल ASR में मेटा ने wav2vec 2.0 तकनीक का इस्तेमाल किया है, जिसमें करीब 7 अरब पैरामीटर हैं। इसे कई उच्चारणों, बोलियों और भाषाई पैटर्नों पर प्रशिक्षित किया गया है। इसके लिए कंपनी ने मोजिला कॉमन वॉइस, लैनफ्रिका और नाइजीरियावॉइस जैसे प्रोजेक्ट्स के साथ मिलकर काम किया। स्थानीय वक्ताओं से असली रिकॉर्डिंग और आवाजें लेकर इसे पहले से कहीं ज्यादा सटीक, वास्तविक और विविध डाटासेट पर तैयार किया गया है।

भविष्य

सटीकता में सुधार और भविष्य की दिशा

मेटा का कहना है कि यह मॉडल अब तक का सबसे बड़ा प्रयास है, लेकिन कुछ भाषाओं में इसकी सटीकता अभी भी सीमित है। उच्च संसाधन वाली भाषाओं में 95 प्रतिशत से अधिक सफलता, जबकि कम संसाधन वाली भाषाओं में लगभग 36 प्रतिशत सफलता दर मिली। कंपनी ने इस मॉडल को ओपन-सोर्स कर दिया है, ताकि शोधकर्ता और डेवलपर इसे और बेहतर बना सकें। मेटा का मानना है कि यह तकनीक सुपर इंटेलिजेंस की दिशा में एक मजबूत कदम है।