Google का वर्तमान AI और मशीन लर्निंग विकास

 
ww

यूएसए: चैटजीपीटी की क्षमता दुनिया को मंत्रमुग्ध कर रही है। कई लोगों का मानना है कि यह खोज बाजार में Google के आधिपत्य के अंत का संकेत है। Microsoft ने हाल ही में ChatGPT को Bing Search और Azure क्लाउड सेवा में एकीकृत करने के अपने इरादे का खुलासा किया, जिसने कंपनी को और चिंतित कर दिया है।

Google ने निवेशकों (ML) की चिंताओं को दूर करने के लिए अपने AI और मशीन लर्निंग अनुसंधान और विकास का विवरण देते हुए एक ब्लॉग पोस्ट प्रकाशित किया है।


एआई की अधिकांश चर्चाएँ वर्तमान में भाषा मॉडल पर केंद्रित हैं। बड़े भाषा मॉडल की "सुसंगत, प्रासंगिक, और प्राकृतिक-ध्वनि वाली प्रतिक्रियाएं" उत्पन्न करने और लेखन कोड सहित विभिन्न प्रकार के कार्यों को पूरा करने की क्षमता से सभी आश्चर्यचकित हैं।

सामग्री बनाना, और जटिल उत्तर प्रदान करना। LaMDA, कथित तौर पर "संवेदनशील" मशीन-लर्निंग भाषा मॉडल है जिसे Google द्वारा विकसित किया जा रहा है, संवादों पर प्रशिक्षित है।

कंपनी LaMDA के साथ इस बात की जांच कर रही है कि कैसे भाषा मॉडल का उपयोग कई मोड़ों के साथ सुरक्षित और गहन संवाद के लिए किया जा सकता है। चैटजीपीटी ने प्रदर्शित किया है कि यह कितनी आसानी से कई मोड़ों के साथ बातचीत बुन सकता है।

हालाँकि, इसके कुछ समाधान खतरनाक क्षेत्र में हैं। इस संबंध में, सुरक्षित और ठोस प्रतिक्रियाओं पर Google का जोर कंपनी को एआई के खिलाफ दौड़ में लाभान्वित कर सकता है।

PaLM (पाथवेज लैंग्वेज मॉडल), कंपनी के पाथवेज सॉफ्टवेयर इन्फ्रास्ट्रक्चर पर निर्मित 540 बिलियन पैरामीटर लैंग्वेज मॉडल, एक अन्य भाषा मॉडल है जिस पर Google काम कर रहा है।

Google के अनुसार PaLM पर काम ने दिखाया है कि "बहुभाषी डेटा और बड़ी मात्रा में स्रोत कोड" पर प्रशिक्षित बड़े भाषा मॉडल कितने प्रकार के कार्य कर सकते हैं, भले ही उन्हें ऐसा करने के लिए विशेष रूप से प्रशिक्षित करने की आवश्यकता हो। प्रशिक्षित नहीं किया गया है। कार्यों।

एआई में सबसे बड़ी समस्याओं में से एक मल्टी-स्टेप रीजनिंग है। जटिल समस्याओं को छोटे-छोटे कार्यों में तोड़ने के लिए AI सिस्टम प्राप्त करना उतना आसान नहीं है जितना लगता है, फिर बड़ी समस्या से निपटने के लिए उन कार्यों के समाधानों को संयोजित करें। Google "सोच की श्रृंखला" विकसित कर रहा है, जो उत्तर तक पहुँचने के लिए आवश्यक चरणों की रूपरेखा तैयार करने के लिए भाषा मॉडल को प्रोत्साहित करती है।

Google के अनुसार "विचारों की श्रृंखला" का उपयोग, भाषा मॉडल को "अधिक संरचित, संगठित और सटीक प्रतिक्रियाओं" का उत्पादन करने में सक्षम करेगा।

कंपनी के अनुसार, इस पद्धति से इस बात की संभावना बढ़ जाती है कि मॉडल जटिल समस्याओं के सही समाधान पर पहुंचेंगे, जिसके लिए कई चरणों की आवश्यकता होती है। यह चुनौतीपूर्ण वैज्ञानिक और गणितीय समस्याओं से निपटने में विशेष रूप से उपयोगी होगा।

एआई का कंप्यूटर विजन क्षेत्र तेजी से विकसित हो रहा है। यह मानव दृष्टि प्रणाली की जटिलता का अनुकरण करने पर केंद्रित है ताकि कंप्यूटर वस्तुओं को मनुष्यों के समान तरीके से पहचान और संसाधित कर सकें।

कन्वोल्यूशनल न्यूरल नेटवर्क्स के बजाय कंप्यूटर विज़न एप्लिकेशन में ट्रांसफ़ॉर्मर आर्किटेक्चर के उपयोग में अग्रणी होकर Google ने अब तक इस क्षेत्र में सबसे महत्वपूर्ण योगदान दिया है।

Google कंप्यूटर विज़न के लिए कई मॉडल विकसित कर रहा है। विजन मॉडल से स्थानीय और गैर-स्थानीय दोनों जानकारी मैक्सवीआईटी (मल्टी-एक्सिस विजन ट्रांसफॉर्मर) द्वारा संयुक्त है।