खराब क्वॉलिटी की फोटोज को हाई-रेजॉल्यूशन इमेजेस में बदल सकती है गूगल की AI टेक्नोलॉजी
क्या है खबर?
सर्च इंजन कंपनी गूगल ने आर्टिफीशियल इंटेलिजेंस (AI) पर आधारित डिफ्यूजन मॉडल्स पेश किए हैं, जिसकी मदद से लो-रेजॉल्यूशन इमेजेस की क्वॉलिटी बेहतर की जा सकती है।
दो नए डिफ्यूजन मॉडल्स- इमेज सुपर-रेजॉल्यूशन (SR3) और कास्केडेड डिफ्यूजन मॉडल्स (CDM) हाई क्वॉलिटी फोटोज तैयार करने के लिए AI की मदद लेते हैं।
इन मॉडल्स का इस्तेमाल पुराने फैमिली पोर्ट्रेट्स बेहतर करने से लेकर मेडिकल इमेजिंस सिस्टम, इमेज क्लासिफिकेशन और सेगमेंटेशन बेहतर करने के लिए किया जा सकता है।
रिसर्च
रिसर्च टीम ने शेयर किया ब्लॉग
गूगल रिसर्च टीम के रिसर्चर्स की ओर से एक पोस्ट गूगल के AI ब्लॉग पर शेयर की गई है, जिसमें SR3 और CDM डिफ्यूजन मॉडल्स के बारे में बताया गया है।
SR3 को सुपर-रेजॉल्यूशन डिफ्यूजन मॉडल कहा गया है, जिसकी मदद से लो-रेजॉल्यूशन इमेज को मौजूदा डाटा के साथ हाई-रेजॉल्यूशन इमेज में बदला जा सकता है।
ऐसा करने के लिए मॉडल मौजूद इमेज डाटा की मदद लेता है और उनमें जरूरी बदलाव करता है।
तरीका
ऐसे काम करता है SR3 डिफ्यूजन मॉडल
SR3 मॉडल को इमेज करप्शन प्रोसेस के साथ ट्रेनिंग दी गई है, जो हाई-रेजॉल्यूशन इमेज में तब तक नॉइस ऐड करती है, जब तक केवल नॉइस नहीं बाकी रह जाती।
SR3 मॉडल इस पूरी प्रक्रिया को उल्टा कर देता है और नॉइस से हाई-क्वॉलिटी फोटो तैयार की जा सकती है।
दरअसल, किसी इमेज का साइज कर करने के लिए उसमें नॉइस शामिल किया जाता है और पिक्सेल्स बड़े हो जाते हैं, जिसका असर इमेज क्वॉलिटी पर पड़ता है।
CDM
ऐसे तैयार किया गया है दूसरा डिफ्यूजन मॉडल
CDM डिफ्यूजन मॉडल को इमेजनेट डाटा की मदद से ट्रेनिंग दी गई है, जिससे यह हाई-रेजॉल्यूशन नेचुरल इमेजेस तैयार कर सके।
इमेजनेट मुश्किल और हाई-एंट्रोपी डाटासेट है, गूगल ने CDM को मल्टिपल डिफ्यूजन मॉडल्स के कास्केड की तरह बनाया है।
इस कास्केड के साथ अलग-अलग रेजॉल्यूशंस के लिए मल्टिपल जेनरेटिव मॉडल्स एकसाथ तैयार होते और जोड़ दिए जाते हैं।
चेन में मौजूद मॉडल्स हाई-क्वॉलिटी इमेज तैयार करते हैं, जिसपर गॉसियन नॉइस और गॉसियन ब्लर अप्लाई कर फाइनल आउटपुट मिलता है।
रिजल्ट्स
गूगल ने शेयर किए रिजल्ट्स
सर्च इंजन कंपनी ने इस मॉडल से जुड़े कुछ उदाहरण भी शेयर किए हैं, जिनमें 64x64 पिक्सल्स रेजॉल्यूशन वाली एक फोटो को SR3 के साथ स्केल कर 1,024x1024 पिक्सेल्स रेजॉल्यूशन फोटो में बदल दिया गया।
इस मॉडल की मदद से मिला फाइनल 1,024x1024 पिक्सेल्स रेजॉल्यूशन आउटपुट शानदार है और इसमें दिख रहे चेहरे के डीटेल्स साफ नजर आ रहे हैं।
कंपनी का कहना है कि मॉडल फेस और न्यूरल इमेजेस की 4x और 8x हाई-रेजॉल्यूशंस तक स्केलिंग कर सकता है।
फायदा
फ्यूचर प्रोडक्ट्स का हिस्सा बन सकती है AI टेक
गूगल की AI से जुड़ी नई टेक्नोलॉजी को फ्यूचर प्रोडक्ट्स का हिस्सा बनाया जा सकता है।
कंपनी के गूगल लेंस और मैप्स जैसी सेवाओं में AI का इस्तेमाल पहले भी देखा गया है।
इमेज डिफ्यूजन मॉडल्स का इस्तेमाल सुरक्षा से लेकर स्वास्थ्य जैसे क्षेत्रों में किया जा सकता है, जहां बेहतर इमेज महत्वपूर्ण हो सकती है और मदद कर सकती है।
हालांकि, इस बारे में गूगल ने अभी कुछ नहीं कहा है और मौजूदा टेक को बेहतर कर रही है।