
सर्वम AI ने लॉन्च किया फ्लैगशिप LLM, जानिए क्या है इसमें खास
क्या है खबर?
भारतीय आर्टिफिशियल इंटेलिजेंस (AI) स्टार्टअप सर्वम ने अपना फ्लैगशिप लार्ज लैंग्वेज मॉडल (LLM) सर्वम-M लॉन्च किया है।
LLM एक 24-बिलियन-पैरामीटर ओपन-वेट हाइब्रिड लैंग्वेज मॉडल है, जिसे फ्रांस की कंपनी मिस्ट्रल स्मॉल पर बनाया गया है। सर्वम-M ने गणित, प्रोग्रामिंग कार्यों और भारतीय भाषा समझ में नए मानक हासिल किए हैं।
कंपनी के अनुसार, मॉडल को एप्लीकेशंस की एक विस्तृत श्रृंखला के लिए डिजाइन किया गया है। यह मेटा और गूगल जैसी कंपनियों के मॉडल्स के बराबर होगा।
अपडेट
इस तरह किया मॉडल को अपडेट
मॉडल को 3-चरणीय प्रक्रिया के माध्यम से अपडेट किया गया है, जिसमें सुपरवाइज्ड फाइन-ट्यूनिंग (SFT), वेरिफिएबल रिवार्ड्स (RLVR) के साथ सुदृढीकरण सीखना और अनुमान अनुकूलन शामिल है।
SFT प्रक्रिया ने सर्वम-M को सोच, गैर-सोच या सामान्य बातचीत मोड दोनों में काम करने के लिए प्रशिक्षित किया।
दूसरी ओर RLVR के साथ इसको निर्देश अनुसरण, प्रोग्रामिंग डाटासेट और गणित से युक्त पाठ्यक्रम का उपयोग करके आगे प्रशिक्षित किया गया। कस्टम रिवॉर्ड इंजीनियरिंग और प्रॉम्प्ट सैंपलिंग तकनीकों का उपयोग किया गया।
प्रदर्शन
ऐसा रहा है मॉडल का प्रदर्शन
सर्वम-M ने विभिन्न भारतीय भाषाओं, गणित और प्रोग्रामिंग कार्यों में नए मानक स्थापित किए हैं।
AI मॉडल भारतीय भाषा मानकों पर बेस मॉडल की तुलना में औसतन 20 फीसदी सुधार, गणित से संबंधित कार्यों पर 21.6 फीसदी वृद्धि और कोडिंग मानकों में 17.6 फीसदी सुधार प्रदर्शित करता है।
भारतीय भाषाओं और गणित के संयोजन में यह रोमनकृत भारतीय भाषा GSM-8K मानकों में प्रभावशाली +86 फीसदी सुधार दर्शाता है। वर्तमान वर्जन नए स्पीच मॉडल बुलबुल के लॉन्च के बाद आया है।