खराब क्वॉलिटी की फोटोज को हाई-रेजॉल्यूशन इमेजेस में बदल सकती है गूगल की AI टेक्नोलॉजी

Sep 02, 2021

11:02 pm

क्या है खबर?

सर्च इंजन कंपनी गूगल ने आर्टिफीशियल इंटेलिजेंस (AI) पर आधारित डिफ्यूजन मॉडल्स पेश किए हैं, जिसकी मदद से लो-रेजॉल्यूशन इमेजेस की क्वॉलिटी बेहतर की जा सकती है। दो नए डिफ्यूजन मॉडल्स- इमेज सुपर-रेजॉल्यूशन (SR3) और कास्केडेड डिफ्यूजन मॉडल्स (CDM) हाई क्वॉलिटी फोटोज तैयार करने के लिए AI की मदद लेते हैं। इन मॉडल्स का इस्तेमाल पुराने फैमिली पोर्ट्रेट्स बेहतर करने से लेकर मेडिकल इमेजिंस सिस्टम, इमेज क्लासिफिकेशन और सेगमेंटेशन बेहतर करने के लिए किया जा सकता है।

रिसर्च

रिसर्च टीम ने शेयर किया ब्लॉग

गूगल रिसर्च टीम के रिसर्चर्स की ओर से एक पोस्ट गूगल के AI ब्लॉग पर शेयर की गई है, जिसमें SR3 और CDM डिफ्यूजन मॉडल्स के बारे में बताया गया है। SR3 को सुपर-रेजॉल्यूशन डिफ्यूजन मॉडल कहा गया है, जिसकी मदद से लो-रेजॉल्यूशन इमेज को मौजूदा डाटा के साथ हाई-रेजॉल्यूशन इमेज में बदला जा सकता है। ऐसा करने के लिए मॉडल मौजूद इमेज डाटा की मदद लेता है और उनमें जरूरी बदलाव करता है।

तरीका

ऐसे काम करता है SR3 डिफ्यूजन मॉडल

SR3 मॉडल को इमेज करप्शन प्रोसेस के साथ ट्रेनिंग दी गई है, जो हाई-रेजॉल्यूशन इमेज में तब तक नॉइस ऐड करती है, जब तक केवल नॉइस नहीं बाकी रह जाती। SR3 मॉडल इस पूरी प्रक्रिया को उल्टा कर देता है और नॉइस से हाई-क्वॉलिटी फोटो तैयार की जा सकती है। दरअसल, किसी इमेज का साइज कर करने के लिए उसमें नॉइस शामिल किया जाता है और पिक्सेल्स बड़े हो जाते हैं, जिसका असर इमेज क्वॉलिटी पर पड़ता है।

CDM

ऐसे तैयार किया गया है दूसरा डिफ्यूजन मॉडल

CDM डिफ्यूजन मॉडल को इमेजनेट डाटा की मदद से ट्रेनिंग दी गई है, जिससे यह हाई-रेजॉल्यूशन नेचुरल इमेजेस तैयार कर सके। इमेजनेट मुश्किल और हाई-एंट्रोपी डाटासेट है, गूगल ने CDM को मल्टिपल डिफ्यूजन मॉडल्स के कास्केड की तरह बनाया है। इस कास्केड के साथ अलग-अलग रेजॉल्यूशंस के लिए मल्टिपल जेनरेटिव मॉडल्स एकसाथ तैयार होते और जोड़ दिए जाते हैं। चेन में मौजूद मॉडल्स हाई-क्वॉलिटी इमेज तैयार करते हैं, जिसपर गॉसियन नॉइस और गॉसियन ब्लर अप्लाई कर फाइनल आउटपुट मिलता है।

रिजल्ट्स

गूगल ने शेयर किए रिजल्ट्स

सर्च इंजन कंपनी ने इस मॉडल से जुड़े कुछ उदाहरण भी शेयर किए हैं, जिनमें 64x64 पिक्सल्स रेजॉल्यूशन वाली एक फोटो को SR3 के साथ स्केल कर 1,024x1024 पिक्सेल्स रेजॉल्यूशन फोटो में बदल दिया गया। इस मॉडल की मदद से मिला फाइनल 1,024x1024 पिक्सेल्स रेजॉल्यूशन आउटपुट शानदार है और इसमें दिख रहे चेहरे के डीटेल्स साफ नजर आ रहे हैं। कंपनी का कहना है कि मॉडल फेस और न्यूरल इमेजेस की 4x और 8x हाई-रेजॉल्यूशंस तक स्केलिंग कर सकता है।

फायदा

फ्यूचर प्रोडक्ट्स का हिस्सा बन सकती है AI टेक

गूगल की AI से जुड़ी नई टेक्नोलॉजी को फ्यूचर प्रोडक्ट्स का हिस्सा बनाया जा सकता है। कंपनी के गूगल लेंस और मैप्स जैसी सेवाओं में AI का इस्तेमाल पहले भी देखा गया है। इमेज डिफ्यूजन मॉडल्स का इस्तेमाल सुरक्षा से लेकर स्वास्थ्य जैसे क्षेत्रों में किया जा सकता है, जहां बेहतर इमेज महत्वपूर्ण हो सकती है और मदद कर सकती है। हालांकि, इस बारे में गूगल ने अभी कुछ नहीं कहा है और मौजूदा टेक को बेहतर कर रही है।