कृत्रिम बुद्धिमत्ता कंप्यूटर के साथ हमारे इंटरैक्ट करने के तरीके को बदल रही है। का एक अद्यतन संस्करण क्लाउड 3.5 सॉनेटका प्रमुख AI मॉडल anthropic, इस विकास का एक स्पष्ट उदाहरण है: यदि पिछला संस्करण पाठ संवाद तक ही सीमित था, तो यह नया अद्यतन सिर्फ घोषणा की ग्राफिकल इंटरफेस की व्याख्या करने और अनुप्रयोगों के साथ स्वायत्त रूप से बातचीत करने में सक्षम है।
एक दृष्टिकोण जो डिजिटल गतिविधियों के स्वचालन के लिए नई संभावनाओं को खोलता है, ठीक वैसे ही "चलता" है जैसे कोई व्यक्ति पीसी पर करता है। आइए एक साथ देखें कि यह तकनीक कैसे काम करती है, और इसके वास्तविक अनुप्रयोग क्या हैं।
पीसी के साथ इंटरेक्शन कैसे काम करता है
क्लाउड 3.5 सॉनेट डेस्कटॉप के साथ इंटरैक्ट करने के लिए "कंप्यूटर यूज़ एपीआई" नामक सिस्टम का उपयोग करता है। व्यवहार में, एआई स्क्रीनशॉट के माध्यम से स्क्रीन का अवलोकन करता है और जो देखता है उसका विश्लेषण करता है, ठीक उसी तरह जैसे एक मानव उपयोगकर्ता करता है। जब इसे किसी एप्लिकेशन के साथ इंटरैक्ट करना होता है, तो यह वांछित बिंदु तक पहुंचने के लिए पिक्सेल में दूरी की गणना करता है और आवश्यक क्रियाओं का अनुकरण करता है: माउस क्लिक, कीबोर्ड पर टाइपिंग, कर्सर की गति।
हमने क्लाउड को यह देखने के लिए प्रशिक्षित किया कि स्क्रीन पर क्या होता है और फिर कार्यों को पूरा करने के लिए उपलब्ध सॉफ़्टवेयर टूल का उपयोग करें।
anthropic
इस संस्करण का मुख्य नवाचार? लंबे समय से प्रतीक्षित क्षमता: किसी भी डेस्कटॉप एप्लिकेशन का उपयोग करने की क्षमता। यह अब केवल प्रश्नों का उत्तर देने या पाठ उत्पन्न करने के बारे में नहीं है, लेकिन सॉफ्टवेयर के साथ सक्रिय रूप से बातचीत करने के लिए।
नया सॉनेट 3.5, व्यावहारिक अनुप्रयोग
उपयोग की सम्भावनाएँ असंख्य हैं। उदाहरण के लिए, प्रतिकृतिएक सॉफ्टवेयर डेवलपमेंट प्लेटफॉर्म, पहले से ही एक "स्वायत्त सत्यापनकर्ता" बनाने के लिए क्लाउड 3.5 सॉनेट का उपयोग कर रहा है जो उनके विकास के दौरान अनुप्रयोगों का मूल्यांकन करता है। Canvaऑनलाइन ग्राफ़िक्स संपादन प्लेटफ़ॉर्म, डिज़ाइन और संपादन प्रक्रिया में AI को एकीकृत करने के तरीके तलाश रहा है।
क्या सब कुछ वैसा ही "वाह" है जैसा दिखता है? नहीं। क्या वह हमारी नौकरियाँ चुरा लेगा? कोई भी नहीं। सिस्टम की वर्तमान क्षमताओं के बारे में यथार्थवादी होना महत्वपूर्ण है। उड़ान बुकिंग परीक्षण में, क्लाउड 3.5 सॉनेट निर्धारित कार्यों में से आधे से भी कम को सफलतापूर्वक पूरा करने में सफल रहा। यहां तक कि स्क्रॉलिंग और ज़ूमिंग जैसे सरल प्रतीत होने वाले कार्य भी समस्याग्रस्त हो सकते हैं।
दूसरी ओर, वह खुद इस बात को स्वीकार करती हैं anthropic:
क्लाउड का कंप्यूटर का उपयोग धीमा और अक्सर त्रुटि-प्रवण रहता है। हम डेवलपर्स को कम जोखिम वाले कार्यों से शुरुआत करने के लिए प्रोत्साहित करते हैं।
सॉनेट 3.5 के पूर्ण होने में कितना समय लगेगा? क्या इसमें साल, महीने या हफ्ते लगेंगे? यदि आप इसके बारे में सोचते हैं, तो आप पहले से ही उत्तर जानते हैं, या इसके बहुत करीब कुछ जानते हैं।
सुरक्षा पर कुछ नोट्स
सुरक्षा का मुद्दा बुनियादी है. anthropicएआई कंपनियों का "अच्छा लड़का" होने के नाते, ने कई निवारक उपाय लागू किए हैं:
- एआई को उपयोगकर्ता स्क्रीनशॉट पर प्रशिक्षित नहीं किया गया है;
- प्रशिक्षण के दौरान उसके पास वेब तक पहुंच नहीं है;
- उच्च जोखिम वाली कार्रवाइयों से बचने के लिए क्लासिफायर विकसित किए गए हैं;
- सुरक्षा उपाय के तौर पर स्क्रीनशॉट केवल 30 दिनों के लिए रखे जाते हैं।
भविष्य की संभावनाओं
क्लाउड 3.5 सॉनेट के नए संस्करण के विकास के समानांतर, anthropic क्लाउड श्रृंखला में सबसे किफायती और कुशल मॉडल, हाइकु के एक अद्यतन संस्करण के आगमन की भी घोषणा की। उपयोग के विभिन्न स्तरों पर पहुंच योग्य एआई के क्षेत्र में एक छोटा कदम। बेशक, यह सामान अभी भी ऊर्जा और संसाधनों के मामले में बहुत अधिक खपत करता है।
वैसे भी, यह मुझे विशेष रूप से दिलचस्प लगता है कि यह तकनीक कंप्यूटर के साथ हमारे संबंधों को कैसे बदल रही है। हम अब सरल स्वचालन स्क्रिप्ट के बारे में बात नहीं कर रहे हैं, बल्कि उन प्रणालियों के बारे में बात कर रहे हैं जो ग्राफिकल इंटरफेस को लगभग मानवीय तरीके से समझते हैं और उनके साथ बातचीत करते हैं।
क्लाउड सॉनेट 3.5: संतुलित कदम आगे, लेकिन आश्चर्यजनक दिशा में
जैसा कि एआई के क्षेत्र में अक्सर होता है, इस नवाचार का वास्तविक मूल्य इसकी तकनीकी क्षमताओं में नहीं, बल्कि इस बात में मापा जाएगा कि हम इसे अपने दैनिक वर्कफ़्लो में कैसे उपयोगी रूप से एकीकृत कर सकते हैं। भविष्य के लिए चुनौती स्वचालन और मानव नियंत्रण के बीच सही संतुलन खोजने की होगी, जिससे इसकी सीमाओं और नैतिक जिम्मेदारियों को नजरअंदाज किए बिना इस तकनीक की क्षमता का अधिकतम लाभ उठाया जा सके।
क्लाउड 3.5 सॉनेट की क्षमताएं, अपने आप में प्रभावशाली नहीं हैं, फिर भी वे जो दिशा दिखाते हैं उसके लिए प्रभावशाली हैं। हम अभी भी इस तकनीकी यात्रा की शुरुआत में हैं: जल्द ही क्या होगा?