Google AI Technology Kya Hai. Google SR3 & CDM Model

Google AI Technology Kya Hai. Google का mission दुनिया की information को organize करना है और इसे universal रूप से accessible और useful बनाना है। Google AI, users, customers और दुनिया के कई problems को solve करने के लिए exciting new ways से  information को organize करने में हमारी मदद कर रहा है।

आप लोगों ने भी notice किया होगा की आजकल हर कोई Artificial Intelligence की ओर खिंचा चला जा रहा है। अगर आपको भी Artificial Intelligence के बारे में जानना है तो इस Google AI Guide में हमारे साथ बने रहे, यहाँ आपको Google AI से related सारे doubt clear हो जायेंगे । 

यदि आपको इसके बारे में ज्यादा information नहीं है तब आपको चिंतित होने की जरुरत नहीं है क्यूंकि आज आप लोगों को Artificial Intelligence क्या है, हम जानेंगे Artificial Intelligence में use होने वाले 2 Models यानि की Google SR3 & Google CDM Model, साथ ही Artificial Intelligence इस्तेमाल के बारे में भी पता चल जायेगा।  

Computers का आविष्कार होते ही, हर कोई अपने किसी न किसी काम के लिए computer पर depend होना शुरू कर दिया। आजकल लोग Real Time Programming or coding के जरिये अपने हर छोटे बड़े काम को computer के जरिये ही पूरी कर रहे है। इसके कारण लोगों की dependency की exponential growth हुई।  इसके बाद machines की capabilities को भी बढ़ाई गयी। जैसे की : speed, size, capacity – जिससे की हम कम समय में ज्यादा से ज्यादा काम कर सके और लाभ उठा सके।  

तो, आइये हम जान लेते है Google AI के बारे में :

Google AI Technology Kya Hai

Google AI, Google द्वारा created है।  इसे Google का ही  part माना जाता है। Google के CEO सुंदर पिचाई ने इसकी घोषणा 2017 में की थी। यहाँ Google गुगल AI का मतलब है Google Artificial Intelligence यानी की कृत्रिम बुद्धिमत्ता। 

Google AI, Google द्वारा provided एक service है जिसका उद्देश्य world की जानकारी को manage करना और इसे publicly accessible और useful बनाना है। Google AI, हर चीज को सबके लिए easy to use  बनाता जा रहा है जैसे की : किसी Picture या image को search करना या फिर Google Translation में languages के प्रतिबंध को ख़त्म करना हो, email typing करना हो या फिर google assistant के साथ में काम करना। 

Google AI, existing health problems को देखने के लिए नए तरीके भी प्रदान करता है। Google AI हर बड़ी और छोटी Problems को solve करने में help कर रहा है। यह socially beneficial, accountable और सबके के लिए काम करता है।

Artificial Intelligence यानि की कृत्रिम बुद्धिमत्ता। ये एक तरह का simulation है जिसके जरिये बहुत ही आसानी से machines को इंसानी intelligence दिया जाता है।  यानि की, machines को AI के जरिये इस तरह से Programming किया जाता है कि वो इंसानों जैसे काम करने लगे। 

इसे Computer Science द्वारा किया जाता है। इसमें 3 Processes शामिल है, जो इस प्रकार है :

Learning : इस process में machines में इस तरह से data और information को put किया जाता है कि वो machine उसके अनुसार ही काम करना शुरू कर देती है।  

Reasoning : इस process में machines में rules or Protocols set किये जाते है जिसके according machine काम करने लगते है। 

Self-Correction.

AI के किसी specific application की अगर बात की जाए तो इसमें speech recognition, machine vision और expert system भी शामिल है। Artificial Intelligence के द्वारा किसी भी machines को इस तरह से programm या design किया जाता है की वह इंसानो की तरह सोच समझ सके और काम कर सके। 

जिस तरह से इंसानी दिमाग  Problem को पहले समझती है और फिर analysis करती है और उसके  बाद उसे execute करती है। उसी प्रकार, Google artificial intelligence में भी मशीनों को भी इंसानी ढंग से process और execute किया जाता है। 

Natural image synthesis व्यापक अनुप्रयोगों के साथ machine learning (ML) कार्यों का एक class है, जो कई design challenges का सामना करता है। example :  image super-resolution है, जिसमें एक model को low resolution image को detailed high resolution image (जैसे, RAISR) में बदलने के लिए trained किया जाता है। Super-resolution में कई applications हैं जो old family portrait को restore करने से लेकर medical imaging systems में सुधार भी करते हैं।

एक और ऐसा image synthesis कार्य class conditional image का निर्माण है, जिसमें एक model को input class label से एक sample image  को generate करने के लिए प्रशिक्षित किया जाता है। परिणामी उत्पन्न sample images का उपयोग छवि वर्गीकरण, विभाजन, और बहुत कुछ के लिए downstream models के performance को बेहतर बनाने के लिए किया जा सकता है।

आम तौर पर, इन image synthesis task को GAN, VAE और autoregressive models जैसे deep generative models द्वारा किया जाता है। फिर भी इन generative models में से प्रत्येक में इसकी कमियां होती हैं जब कठिन, high resolution datasets पर high quality samples को synthesize करने के लिए trained किया जाता है।

Example : GAN अक्सर unstable training और mode collapse को suffer करते है और autoregressive models आमतौर पर धीमी synthesis speed को suffer करते है।



Diffusion Models

वैकल्पिक रूप से, Diffusion Model, (मूल रूप से 2015 में प्रस्तावित), ने हाल ही में उनकी training stability और image और audio generation पर उनके आशाजनक sample quality results के कारण interest में पुनरुत्थान देखा है। इस प्रकार, वे अन्य प्रकार के deep generative models की तुलना में संभावित रूप से favorable trade-offs की पेशकश करते हैं।

Diffusion models Gaussian noise को progressively add करके training data को corrupt करके काम करते हैं, धीरे-धीरे डेटा में details को pure noise बनने तक मिटा देते हैं, और फिर इस corruption process को reverse करने  के लिए एक neural network को प्रशिक्षित करते हैं। इस reversed corruption process को चलाने से pure noise से deata को धीरे-धीरे तब तक निरूपित किया जाता है जब तक कि एक clean sample तैयार नहीं हो जाता।

इस synthesis procedure को एक optimization algorithm के रूप में व्याख्या किया जा सकता है जो संभावित samples का उत्पादन करने के लिए data density के gradient को follow करता है। आज हम Google AI के two connected approaches को प्रस्तुत करते हैं जो diffusion models के लिए image synthesis quality की boundaries को आगे बढ़ाते हैं – Super-Resolution via Repeated Refinements (SR3) के माध्यम से Super-Resolution और class conditioned synthesis के लिए एक मॉडल, जिसे Cascaded Diffusion Models(CDM) कहा जाता है।

Diffusion models को बढ़ाकर और सावधानीपूर्वक चयनित data augmentation techniques के साथ, हम existing approaches से बेहतर प्रदर्शन कर सकते हैं। विशेष रूप से, SR3 मजबूत image super-resolution परिणाम प्राप्त करता है जो मानव evaluations में GAN को surpass करता है।

CDM, high fidelity ImageNet samples उत्पन्न करता है जो FID score और Classification Accuracy Score दोनों पर large margin से surpass BigGAN deep और VQ-VAE2 से आगे निकल जाते हैं।

आइये जान लेते है Google AI में use  होने वाले 2 methods के बारे में :



1. SR3 Model :

Google AI Technology Kya Hai

SR3 एक super resolution diffusion model है जो input के रूप में low resolution image लेता है, और pure noise से संबंधित high resolution image बनाता है। Model को एक image corruption process पर प्रशिक्षित किया जाता है.

जिसमें noise को high resolution image में progressively added जाता है जब तक कि केवल pure noise न रह जाए। यह तब pure noise से शुरू होकर इस process को reverse कर देता है और input low resolution image के guidance के माध्यम से target distribution तक पहुंचने के लिए progressively noise को हटाता है।

बड़े पैमाने पर प्रशिक्षण के साथ, SR3 face और natural images के लिए super resolution task पर मजबूत benchmark results प्राप्त करता है, जब input low resolution images के resolution 4x-8x तक स्केल किया जाता है। इन super resolution model को प्रभावी super resolution scale factor को बढ़ाने के लिए एक साथ cascade किया जा सकता है, उदाहरण के लिए,

(64×64 → 256×256) और (256×256 → 1024×1024) फेस super resolution मॉडल को एक साथ स्टैक करना ताकि (64×64 → 1024×1024) सुपर-रिज़ॉल्यूशन super resolution task किया जा सके। .

हम human evaluation study का use करते हुए SR3 की मौजूदा विधियों से तुलना करते हैं। हम दो-वैकल्पिक Forced choice experiment करते हैं, जहां विषयों को reference high resolution image और model output के बीच चयन करने के लिए कहा जाता है, जब सवाल पूछा जाता है.

आप किस image का अनुमान लगाएंगे?” हम confusion rates के माध्यम से model के display को मापते हैं (% समय रेटर्स संदर्भ छवियों पर model output चुनते हैं, जहां एक confusion rates 50% confusion rates प्राप्त करेगा)। इस अध्ययन के परिणाम नीचे दिए गए चित्र में दिखाए गए हैं।

Google AI Technology Kya Hai

ऊपर दिए गए image में : हम 16×16 → 128×128 faces के task पर लगभग 50% confusion rate प्राप्त करते हैं, जो face super-resolution methods PULSE और FSRGAN से बेहतर प्रदर्शन करते हैं। नीचे: हम 64×64 → 256×256 natural images, के अधिक difficult task पर 40% confusion rate भी प्राप्त करते हैं, जो बड़े अंतर से प्रतिगमन आधार रेखा से बेहतर प्रदर्शन करते हैं।

2. CDM Model :

Google AI Technology Kya Hai

Natural image super-resolution करने में SR3 की प्रभावशीलता दिखाने के बाद, हम एक कदम आगे बढ़ते हैं और class conditional image generation के लिए इन SR3 मॉडल का उपयोग करते हैं। CDM, high-resolution natural images को उत्पन्न करने के लिए ImageNet Data पर प्रशिक्षित एक class-conditional diffusion model है।

चूंकि, ImageNet एक कठिन, high-entropy dataset है, इसलिए हमने CDM को multiple diffusion models के Cascade के रूप में बनाया है। इस Cascade approach में कई spatial resolutions पर कई generative models  को एक साथ chain की तरह जोड़ना शामिल है: एक  diffusion model जो Low – resolution पर data उत्पन्न करता है, इसके बाद SR 3 super-resolution diffusion models का अनुक्रम होता है.

जो धीरे-धीरे Generated image के संकल्प को highest resolution तक बढ़ाता है। यह पता है कि cascading high resolution data के लिए गुणवत्ता और training speed में सुधार करता है, जैसा कि previous studies (Example : autoregressive models और VQ-VAE-2)  और diffusion model के लिए concurrent work में दिखाया गया है।

जैसा कि नीचे हमारे quantitative results द्वारा demonstrate किया गया है, CDM आगे Sample quality और Downstream tasks में उपयोगिता के लिए diffusion model में cascading की प्रभावशीलता पर प्रकाश डालता है, जैसे कि image classification।

Google AI Technology Kya Hai

Cascading Pipeline का example जिसमें diffusion model का अनुक्रम शामिल है: पहला low resolution वाली image उत्पन्न करता है, और शेष अंतिम high resolution के लिए upsampling करता है।

यहां pipeline class-conditional ImageNet generation के लिए है, जो 32×32 resolution पर class-conditional diffusion model से शुरू होती है, इसके बाद SR3 का Use करके 2x और 4x class-conditional super-resolution होता है।

Google AI Technology Kya Hai

Cascading Pipeline में SR3 Model को शामिल करने के साथ, हम एक New Data augmentation technique भी पेश करते हैं, जिसे हम conditioning augmentation कहते हैं, जो CDM के sample quality results को और बेहतर बनाती है।

जबकि CDM में Super resolution model को dataset से मूल छवियों पर प्रशिक्षित किया जाता है, पीढ़ी के दौरान उन्हें low resolution base model,  द्वारा उत्पन्न images पर Super resolution करने की आवश्यकता होती है, जो कि तुलना में पर्याप्त रूप से high quality का नहीं हो सकता है।

Original images यह super resolution model के लिए train-test mismatch की ओर जाता है। Conditioning augmentation cascading pipeline में प्रत्येक super resolution model की low resolution input image में data augmentation  को लागू करने के लिए संदर्भित करती है। ये संवर्द्धन, जिसमें हमारे मामले में Gaussian noise और Gaussian blur शामिल हैं, प्रत्येक super resolution model को इसके निचले resolution conditioning input से अधिक होने से रोकता है,

अंततः CDM के लिए बेहतर higher resolution sample quality की ओर जाता है।

कुल मिलाकर, सीडीएम class-conditional ImageNet generation पर FID Score और Classification accuracy score दोनों के मामले में BigGAN-deep  और VQ-VAE-2  से बेहतर high fidelity samples generate करता है।

CDM एक pure generative model है जो ADM और वीVQ-VAE-2 जैसे अन्य मॉडलों के विपरीत, sample quality को बढ़ावा देने के लिए classifier का use नहीं करता है। Sample quality पर quantitative results के लिए नीचे देखें।



Google AI Technology Kya Hai – Google AI का इस्तेमाल कैसे करें ?

Google AI का इस्तेमाल करने के लिए आपको Google AI के Website पर जाना होगा  कई categories मिलेंगे जिन्हें आपको अपने requirements के अनुसार select करना होगा।  Example :  अगर आप Computer languages यानि की programming सीखना चाहते है तो इसके लिए आपकोGoogle AI के website पर education category को select करना होगा।

Google AI से आप अपने skills को और विकसित कर सकते है अपने Projects को आगे बढ़ा सकते है। इसके अलावा भी Google AI आपके regular work में आपकी help करता है।

आइये जान लेते है Google AI का इस्तेमाल कहा कहा किया जाता है :

Google AI Technology Kya Hai – Use of Google Artificial Intelligence :

1.  Google AI for Searching :

इसका इस्तेमाल Google Photo Library में अपने favourite photos या किसी भी friend के photos को search करने  जाता है। यह इतना helpful है की आप बिना caption वाले photos को भी search कर सकते है। 

2. Google AI for Playing Music : 

इसका इस्तेमाल Google Play Music में अपने favourite Music या Songs को सुनने और download करने के लिए किया जाता है।  यह इतना helpful है की आप इसमें अपने पसंद का Music search भी कर सकते है।

3. Google AI to Blur the picture :

इसका इस्तेमाल Pixel to Protect mode में photo लेने पर photo को पूरी तरह से blurred कर देगा।  इस Feature का use Google AI ( Picture) में लगभग 1 lakh से भी ज्यादा बार हो चूका है।  

4. Google AI Machine Learning : 

Machine Learning Algorithm द्वारा driven caption के साथ youtube video देखे जाते है। ये video 100 languages में available होते है। 

5. Google AI for Gmail’s auto reply :

Google AI के जरिये आप Gmail पर auto reply भी कर सकते है। Gmail आपको smart reply email की सुविधा देता है। smart reply  के  जरिये  आप AI की सहायता से किसी भी time automatically reply कर सकते है जिससे की आपके समय का बचत होगा। 

Google AI Technology Kya Hai

6.  Google AI for old email’s reply :

Google AI के जरिये आप Gmail पर 2  या 3 दिन पुराने messages का भी reply कर सकते है।

7.  Google AI for Review on Google PlayStore : 

Google AI की मदद से आप Google Play Store के किसी भी Google app पर अपनी review दे सकते है। 

8.  Google AI for Google Translation : 

Google AI के जरिये आप Google Translation का  भी use कर सकते है। Google Translation का use करके आप किसी भी भाषा का translation कर सकते है। 

9.  Google AI for More than one language : 

Google AI के जरिये आप कई languages का use  कर सकते है  और किसी से भी किसी भी language में बात कर सकते है। Google इसमें updation करता है यानी की इसमें New languages को add करता जाता है। 

10.  Google AI for Google Map : 

Google अपने application Google map में Google AI का इस्तेमाल करता है। Google Map के जरिये आप बहुत ही आसानी से किसी भी place के बारे में आसानी से पता कर सकते हैं।

निष्कर्ष :

Google AI Technology Kya Hai. Google AI का USE करके आप Picture resolution, Google Map, Google translation को user friendly और easy to use बनाया गया है। इतना ही नहीं Google AI का use करके किसी भी चीज के बारे जान सिर्फ उसकी picture के जरिये।

इसके साथ ही Google AI का use, Google play store पर reviews देने,  machine learning, यहाँ तक की इसका use searching, playing music और pictures को blur करने किया जाता है। यहाँ Google AI से जुड़ें हर एक doubt  किया गया है।  अब आप Google AI का सही तरीके से use कर सकते है।



LEAVE A REPLY

Please enter your comment!
Please enter your name here