ChatGPT और बार्ड को चलाने वाले LLMs क्या होते हैं और ये कैसे काम करते हैं?
आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट इस समय टेक जगत में सबसे ज्यादा चर्चा में हैं। इनकी जनरेटिव AI क्षमता ने इन्हें उपयोगी और लोकप्रिय बना दिया है। इस समय ChatGPT और बार्ड जैसे चैटबॉट हर जगह छाये हैं। ये सभी लार्ज लैंग्वेज मॉडल्स (LLMs) पर आधारित होते हैं। दरअसल, LLMs ऐसे मॉडल होते हैं, जिन्हें नैचुरल लैंग्वेज को समझने के लिए डिजाइन किया गया है। आइये जानते हैं कि LLMs क्या होते हैं और कैसे काम करते हैं।
इन कार्यों में मदद करते हैं LLMs
LLMs टेक्स्ट को प्रोसेस करने के साथ ही इनपुट के आधार पर टेक्स्ट जनरेट कर सकते हैं। इस क्षमता के चलते इनका इस्तेमाल ट्रांसलेशन, समरी तैयार करने और प्रश्नोत्तर तैयार करने के लिए किया जा सकता है। ये लैग्वेज मॉडल कई तरह के होते हैं और इन्हें बड़े पैमाने पर डाटासेट पर प्रशिक्षित किया जाता है। अलग-अलग उद्देश्य के लिए इस्तेमाल होने वाले LLMs उसी काम से जुड़े डाटा पर प्रशिक्षित किए जाते हैं।
ज्यादा पैरामीटर पर प्रशिक्षित मॉडल देगा सटीक जानकारी
LLMs को जरूरत के मुताबिक छोटे और बड़े डाटासेट पर प्रशिक्षित किया जाता है। छोटे डाटासेट में आमतौर पर करोड़ों पैरामीटर होते हैं, जबकि बड़े डाटासेट में अरबों डाटा प्वाइंट होते हैं। ये पैरामीटर प्रशिक्षण या ट्रेनिंग के दौरान मॉडल द्वारा प्राप्त ज्ञान को दिखाते हैं। जिस मॉडल को जितने अधिक पैरामीटर पर प्रशिक्षित किया जाता है, उसके पास उतनी अधिक जानकारी होती है। ऐसे में वह मॉडल ज्यादा सटीक जवाब देगा।
इंसानी दिमाग की तरह काम करने के लिए तैयार किए जाते हैं LLMs
सरल शब्दों में LLM को टेक्स्ट डाटा के एक बड़े डाटाबेस के रूप में समझ सकते हैं। इसे इनपुट के आधार मानव-जैसी प्रतिक्रियाएं उत्पन्न करने वाला मॉडल समझा जा सकता है। लैंग्वेज मॉडल न्यूरल नेटवर्क पर निर्भर करते हैं, जो मानवीय दिमाग से प्रेरित मशीन-लर्निंग एल्गोरिदम हैं। इन नेटवर्कों में लेयर्स में इंटरकनेक्टेड नोड्स हैं और प्रत्येक लेयर जानकारी को प्रोसेस करके अगली लेयर तक पहुंचाती है। इसके बाद यूजर्स को उनके इनपुट के आधार पर जानकारी मिलती है।
LLMs को दी जाती है ये ट्रेनिंग
LLMs को दिए जाने वाले प्रशिक्षण को 3 चरणों प्री-ट्रेनिंग, फाइन-ट्यूनिंग और इंफेरेंस में विभाजित किया जा सकता है। प्री-ट्रेनिंग में मॉडल को किताबों, लेखों और वेबसाइटों से बड़ी मात्रा में टेक्स्ट डाटा से प्रशिक्षण दिया जाता है। इसी ट्रेनिंग से ये शब्दों का अर्थ पता लगाने, व्याकरण के नियमों को सीखता है और शब्दों को सही क्रम में रखता है। इस ट्रेनिंग में मॉडल यह सीखता है कि अलग-अलग शब्द मिलकर एक वाक्य कैसे बनते हैं।
खास कार्य के लिए दी जाती है फाइन-ट्यूनिंग ट्रेनिंग
प्री-ट्रेनिंग के बाद मॉडल को विशिष्ट कार्यों जैसे भाषाओं का अनुवाद करने, सवालों का जवाब देने के लिए प्रशिक्षित किया जाता है। इस ट्रेनिंग को फाइन-ट्यूनिंग कहा जाता है। इसमें मॉडल को उस खास काम से जुड़ी अधिक ट्रेनिंग दी जाती है जिसके लिए मॉडल को इस्तेमाल किया जाना है। मॉडल जब प्रशिक्षित हो जाता है तो यह यूजर्स के अगले चरण का अनुमान लगाने तक में सक्षम हो जाता है। GPT-3.5, LaMDA आदि चर्चित लैंग्वेज मॉडल के नाम हैं।
GPT- 3.5 और LaMDA है चर्चित लैंग्वेज मॉडल
जनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर- 3.5 या GPT-3.5 मॉडल OpenAI द्वारा तैयार किया गये सबसे बड़े LLMs में से एक मॉडल है। इस लैंग्वेज मॉडल को ChatGPT की रीढ़ की हड्डी कह सकते हैं। गूगल का लैंग्वेज मॉडल फॉर डायलॉग एप्लिकेशन (LaMDA) है। गूगल के AI चैटबॉट बार्ड के पीछे LaMDA ही काम करता है। गूगल ने इसका एडवांस वर्जन LaMDA 2 भी विकसित किया है। इसी तरह OpenAI ने भी GPT-4 मॉडल भी पेश किया है।
वूडाओ 2.0 है अब तक का सबसे बड़ा मॉडल
इनके अलावा मेटा AI द्वारा विकसित लैंग्वेज मॉडल LLaMA है। बीजिंग एकेडमी ऑफ आर्टिफिशियल इंटेलिजेंस द्वारा विकसित वूडाओ 2.0 अभी तक मौजूद सबसे बड़ा मॉडल है। यह 1.75 ट्रिलियन पैरामीटर्स पर प्रशिक्षित किया गया है और मानव भाषा का अनुकरण कर कंटेंट जनरेट कर सकता है। इसके अलावा एनवीडिया और माइक्रोसॉफ्ट द्वारा संयुक्त रूप से विकसित मेगाट्रॉन-ट्यूरिंग नेचुरल लैंग्वेज जनरेशन (MT-NLG) मॉडल है। इन मॉडलों को एनवीडिया के सेलेन ML सुपरकंप्यूटर पर प्रशिक्षण दिया गया है।