गूगल अभी मिथुन का परिचय कराया है, कृत्रिम बुद्धिमत्ता में इसकी नई सीमा, एक ऐसे प्रदर्शन के साथ जिसने दुनिया को स्तब्ध कर दिया। यूट्यूब पर पोस्ट किया गया एक वीडियो मिथुन की दृश्य और मौखिक उत्तेजनाओं की व्याख्या और प्रतिक्रिया करने की असाधारण क्षमता को दर्शाता है।
प्रतीत होने वाला सरल परीक्षण तुरंत आसपास की दुनिया को समझने और उसके साथ बातचीत करने में इस एआई की "लगभग मानवीय" क्षमताओं के एक अविश्वसनीय प्रदर्शन में बदल जाता है।
गूगल जेमिनी: कृत्रिम बुद्धिमत्ता में एक लंबी छलांग
गूगल जेमिनी का उद्भव (जिसे हमने पिछले सितंबर में कवर किया था पहली ही घोषणा में) कृत्रिम बुद्धिमत्ता के परिदृश्य में एक महत्वपूर्ण मोड़ दर्शाता है। विभिन्न दृश्य और मौखिक संकेतों की व्याख्या करने और उन पर प्रतिक्रिया करने की जेमिनी की क्षमता एआई प्रौद्योगिकियों में अब तक देखी गई किसी भी चीज़ से कहीं अधिक है।
यह केवल दृश्य पहचान या प्राकृतिक भाषा समझ में एक सफलता नहीं है। आप प्रदर्शन में जो देख रहे हैं वह दोनों क्षमताओं का एक बेहद सहज एकीकरण है - एक जो एआई को मानवीय संदर्भ की सच्ची समझ के करीब लाता है।
Google जेमिनी डेमो: भविष्य की एक खिड़की
सबसे पहले, यदि आप इसे देखने से चूक गए हैं तो आपको इसे अवश्य देखना चाहिए। ये रही वो:
डेमो की शुरुआत एक मानव प्रतिभागी द्वारा जेमिनी से यह पूछने से होती है कि वह क्या देखता है। पोस्ट-इट रखने और उस पर एक तात्कालिक रेखा खींचने की सरल क्रिया की जेमिनी द्वारा आसानी से व्याख्या की जाती है। लेकिन यह परीक्षण की निरंतरता है जो मिथुन की असली शक्ति को प्रकट करती है।
चित्र के एक पहचानने योग्य आकृति, एक बत्तख, में विकसित होने के साथ, जेमिनी न केवल वस्तु की सही पहचान करता है, बल्कि दृश्य संदर्भ की कुल समझ का प्रदर्शन करते हुए, आसपास के वातावरण के बारे में विवरण भी प्रदान करता है।
मान्यता से परे: बातचीत और अनुवाद
Google जेमिनी की बुद्धिमत्ता केवल दृश्य व्याख्या तक सीमित नहीं है। जब प्रतिभागी गेम और अनुवाद अनुरोध प्रस्तुत करता है, तो जेमिनी सटीक प्रतिक्रिया देता है। विभिन्न भाषाओं में "बत्तख" का अनुवाद करने और सरल खेलों को समझने और उनमें भाग लेने की इसकी क्षमता, अन्तरक्रियाशीलता और बहुमुखी प्रतिभा के स्तर को उजागर करती है जो पहले मनुष्यों के लिए विशेष रूप से संरक्षित लगती थी।
Google जेमिनी जैसी तकनीक का व्यावहारिक अनुप्रयोग? एह। इसकी सीमा निर्धारित करना असंभव है। सर्जरी से लेकर शिक्षा तक, घरेलू अनुप्रयोगों से लेकर रचनात्मक उद्योगों तक, संभावनाएं अनंत लगती हैं। जेमिनी हमारे प्रौद्योगिकी के साथ बातचीत करने के तरीके में क्रांतिकारी बदलाव ला सकता है, जिससे मानव-मशीन इंटरफ़ेस अधिक सहज, प्राकृतिक और कुशल हो जाएगा।
हां, लेकिन हम इसका इस्तेमाल कब कर पाएंगे?
डेमो में हमने जो देखा, उसके लिए ईमानदारी से प्रशंसा करने के बाद, ईमानदारी के लिए ईमानदारी के बाद मुझे यह भी कहना चाहिए कि अब तक Google से आने वाली "वसा" बहुत कम रही है। बार्ड को टकराव के मैदान में घसीटा गया ChatGPT OpenAI का ई क्लाउड एंथ्रोपिक को बहुत अधिक उम्मीदों के साथ प्रस्तुत किया गया था। "क्षेत्र में" तकनीक प्रतिस्पर्धियों से कमतर है (भाषा मॉडल तक सीमित: अन्य एआई जैसे कि डीपमाइंड बहुत अच्छे परिणाम आ रहे हैं). और यह तथ्य कि Google जेमिनी के पास अभी भी कोई आधिकारिक लॉन्च तिथि नहीं है, कुछ निराशा पैदा करती है।
शायद यह "सच होने के लिए बहुत उन्नत" लगता है, शायद ऐसा इसलिए है क्योंकि आप इसे समझने के लिए इंतजार नहीं कर सकते, लेकिन प्रदर्शनों का समय खत्म हो गया है। Google जेमिनी डेमो एआई प्रौद्योगिकियों की वर्तमान सीमाओं को दूर करने का वादा करता है: आइए इसे क्रियान्वित रूप में देखें।
मुझे यह संदेह न होने दें कि यह समय रोकने का एक और तरीका है।
संपादित करें 8/12/2023: और ये हो गया। जानबूझकर भी ऐसा नहीं कर रहे. कई उपयोगकर्ताओं के आग्रह के बाद, Google ने स्वीकार किया कि वास्तविक जेमिनी डेमो "मूवी स्टिल और टेक्स्ट संदेशों का उपयोग करके" बनाया गया था, बजाय इसके कि जेमिनी किसी ड्राइंग या टेबल पर वस्तुओं में बदलाव पर वास्तविक समय में प्रतिक्रिया दे, या यहां तक कि इसकी भविष्यवाणी भी कर सके। यह उस वीडियो की तुलना में बहुत कम प्रभावशाली है जिस पर आप विश्वास कर सकते हैं, और इससे भी बदतर, वास्तविक इनपुट पद्धति के बारे में एक बयान की कमी मिथुन की तत्परता को संदिग्ध बनाती है, जैसा कि Google का व्यवहार है।