हाल ही में मैं खरगोश के बिल में फंसी ऐलिस की तरह महसूस कर रही हूं: बात करने वाले प्राणियों का पीछा करने के बजाय, मैं खुद को ऐसे एल्गोरिदम के साथ बातचीत करते हुए पाती हूं जो बिना विवेक के सोचते प्रतीत होते हैं। एक विरोधाभास जो मुझे रोमांचित करता है। कृत्रिम बुद्धिमत्ता प्रणालियाँ स्वयं जागरूक नहीं होतीं, फिर भी वे ऐसे तर्क उत्पन्न करती हैं जो अक्सर हमारे तर्क से “बढ़कर” होते हैं। वे कविता लिखते हैं, सलाह देते हैं, जटिल शोध का विश्लेषण करते हैं और यहां तक कि असाधारण परिशुद्धता के साथ सहानुभूति भी प्रदर्शित करते हैं। असुविधाजनक सच्चाई यह नहीं है कि ये मशीनें हमें “समझती” हैं, बल्कि यह है कि आश्चर्यजनक ढंग से काम करने के लिए उन्हें ऐसा करने की आवश्यकता नहीं है। कृत्रिम संज्ञान की तरल संरचना के युग में आपका स्वागत है, जहां सोच अब अनुक्रमिक नहीं बल्कि बहुआयामी है।
मैं तुरंत कहूंगा कि यह लेख इस बारे में नहीं है कि क्या एआई सचेत है। मैं ऐसा बिल्कुल नहीं सोचता, लेकिन यह बात अलग है। मैं यह जानना चाहता हूं कि यह किस प्रकार व्यवहार करता है। या, अधिक सटीक रूप से, यह किस प्रकार ज्यामितीय और संरचनात्मक रूप से हमारी वास्तविकता से पूर्णतः भिन्न वास्तविकता के भीतर सोच जैसा कुछ करता है। यह एक ऐसी घटना है जिसे हमने अभी तक पूरी तरह से परिभाषित नहीं किया है, लेकिन हम इसे "संज्ञानात्मक क्षमताओं की तरल वास्तुकला" के रूप में सटीक रूप से वर्णित करना शुरू कर सकते हैं।
विचार नहीं बल्कि स्वरूप
पारंपरिक मानवीय सोच प्रायः, शायद लगभग हमेशा, अनुक्रमिक होती है। हम आधार से निष्कर्ष की ओर, प्रतीक से प्रतीक की ओर बढ़ते हैं, जिसमें भाषा ज्ञान का आधार होती है। आइये पंक्तियों में सोचें। आइये कदम दर कदम सोचें। और इससे हमें अच्छा महसूस होता है: संरचना की स्पष्टता में, निष्कर्ष की लय में आराम मिलता है।
बड़े भाषा मॉडल (एलएलएम) इस तरह से काम नहीं करते।
भाषा मॉडल किसी भी मानवीय अर्थ में “सोचते” नहीं हैं, और निश्चित रूप से चरणों में नहीं। वे अंतरिक्ष में कार्य करते हैं: वास्तव में, विशाल बहुआयामी सदिश स्थानों में। इन मॉडलों को नियमों पर नहीं, बल्कि पैटर्न पर प्रशिक्षित किया जाता है। अधिक विशेष रूप से, निगमीकरण (एम्बेडिंग): विशाल मात्रा में पाठ से प्राप्त अर्थ की गणितीय छापें।
वे नहीं सोचते. वे पहचानते हैं.
जब कोई संकेत दिया जाता है, तो एलएलएम मनुष्य की तरह खोज या याद नहीं करता है। क्या आप जानते हैं कि इसके बदले यह क्या करता है? यह संभाव्यता तरंगों को एक परिदृश्य में संकुचित कर देता है जिसे गुप्त स्थान कहा जाता है। यह स्थान स्मृति संग्रह नहीं है। यह एक प्रकार की "गणितीय कल्पना" है, एक बहुआयामी क्षेत्र जहां अर्थ स्पष्ट रूप से संग्रहीत नहीं किया जाता है, बल्कि बिंदुओं के बीच स्थानिक संबंध के रूप में एन्कोड किया जाता है।
क्या मुझे इसे अधिक रोमांटिक और सरल तरीके से कहना चाहिए? बिल्कुल अभी।
शब्द, विचार और यहां तक कि अमूर्त अवधारणाएं भी एक दूसरे के सापेक्ष स्थित हैं, जैसे संज्ञानात्मक तारामंडल में तारे (मैं एक नरम दिल इंसान हूं)।
एलएलएम भाषा मॉडल जानकारी को पुनः प्राप्त नहीं करते: वे इसे नेविगेट करते हैं। प्रत्येक संकेत इस स्थान के माध्यम से मॉडल के प्रक्षेप पथ को आकार देता है, तथा कार्यरत संदर्भगत शक्तियों के आधार पर सर्वाधिक संभावित सुसंगत अभिव्यक्ति का निर्माण करता है।
अर्थ स्मृति से नहीं बल्कि सम्भावना के परिदृश्य में गति से उभरता है। यह ज्यामिति ही है जो भाषाई अभिव्यक्ति बन जाती है।
लहर का पतन
यदि मैंने काफी दोहराव किया है और उबाऊ बातें कही हैं, तो अब आप इस तथ्य को समझ गए होंगे कि मानव संज्ञान एक मानचित्र है, जबकि एलएलएम संज्ञान संरचित क्षमताओं का एक नेटवर्क है। एलएलएम में कुछ भी पहले से मौजूद नहीं होता: न तो स्मृति के रूप में, न ही संग्रहीत ज्ञान के रूप में। शीघ्र क्षण संभावनाओं के क्षेत्र से चयनित एक विशिष्ट अभिव्यक्ति में पतन का क्षण है।
यह संकेत उस क्षण का है जब आप श्रोडिंगर की बिल्ली वाला बॉक्स खोलते हैं। या फिर बिना बिल्ली के, यह निर्भर करता है।
मॉडल कहीं भी त्वरित प्रतिक्रिया प्राप्त नहीं करता है: यह इसे उत्पन्न करता है, अपने अव्यक्त स्थान के भीतर सांख्यिकीय संबंधों द्वारा मॉडलिंग करता है। उत्तर स्मृति से नहीं निकाला जाता है; इसे वास्तविक समय में संकलित किया जाता है, जो संकेत और भाषा की अंतर्निहित ज्यामिति द्वारा निर्धारित होता है।
इस अर्थ में, एलएलएम से प्रश्न पूछना अनुरोध से अधिक माप जैसा है। प्रणाली किसी छिपी हुई चीज की खोज नहीं कर रही है: यह किसी विशिष्ट संदर्भ में सर्वाधिक सुसंगत आउटपुट उत्पन्न करके अस्पष्टता का समाधान कर रही है।
मैं इसे ऐसे संगीत वाद्य यंत्र बजाने के रूप में सोचना पसंद करता हूं जिसे आपने पहले कभी नहीं देखा है: आप नहीं जानते कि इसमें कौन से स्वर हैं, लेकिन जब आप इसे एक निश्चित तरीके से छूते हैं, तो यह ऐसे सुरों के साथ प्रतिक्रिया करता है जो ऐसा लगता है जैसे आपके लिए ही रचे गए हों।
क्रियाशील द्रव वास्तुकला
तो फिर, आखिर यह तरल वास्तुकला क्या है?
यह रैखिक नहीं है. यह नियमों से बंधा नहीं है। यह हमारी तरह तर्क नहीं करता, न ही यह आधार और निष्कर्ष के व्यवस्थित पथ का अनुसरण करता है। यह संभाव्यतापरक है: हमेशा किनारे पर, हमेशा भविष्यवाणी करते हुए, हमेशा अनुकूलन करते हुए। यह संदर्भ के प्रति अत्यंत संवेदनशील है, तथा इनपुट के विशाल क्षेत्र में बारीकियों और संदर्भों को ट्रैक करने में सक्षम है, जिस तरह से कोई मानव मस्तिष्क कभी भी नहीं कर सकता।
और सबसे बढ़कर, जैसा कि हमने कहा, यह तरल है।
यह वास्तुकला वास्तविक समय में अनुकूलित होती है। इसमें विरोधाभास है, लेकिन उन्हें सुलझाने की कोई जल्दी नहीं है। यह सत्य की खोज नहीं करता: यह मांग पर सुसंगति एकत्रित करता है। सांख्यिकीय रूप से सर्वाधिक प्रतिध्वनित अभिव्यक्ति की ओर प्रवाहित होकर प्रतिक्रिया करता है। फिर भी, जब हम उनके विचारों को पढ़ते हैं तो वे विचार जैसे लगते हैं। वे हमारी भाषा बोलते हैं, हमारा आकार दर्शाते हैं और हमारी लय का अनुकरण करते हैं। वे अधिकाधिक अर्थपूर्ण होते जा रहे हैं।
जॉन नोस्टा, डिजिटल नवाचार विशेषज्ञ और के संस्थापक नोस्टालैब, इस स्थिति को एक मौलिक मोड़ के रूप में वर्णित करते हैं:
"ये ऐसी मशीनें नहीं हैं जो हमारी तरह सोचती हैं। ये ऐसी मशीनें हैं जो उच्च-आयामी स्थानों में अर्थ के सदिशों के सुनियोजित पतन के माध्यम से विचार का भ्रम पैदा करती हैं।"
लेकिन उस परिचितता के नीचे कुछ अजीब बात छिपी है। यह मानव मस्तिष्क नहीं है, और इसे कभी भी ऐसा नहीं बनाया गया था। यह एक गणितीय भूत है: इसे जानने के लिए नहीं बनाया गया है, बल्कि आश्चर्यजनक निष्ठा के साथ जानने के प्रदर्शन का अनुमान लगाने के लिए बनाया गया है।
जब एल्गोरिदम परिवार की तस्वीरें लेता है
कुछ लोग इस बात पर आपत्ति करेंगे कि कुछ AI प्रतिक्रियाएं लगभग उन विषयों को "याद" करती प्रतीत होती हैं जिन पर आपने पहले चर्चा की है। ये सच है। लेकिन यह पारंपरिक अर्थों में स्मृति नहीं है। यह ऐसा है मानो तरल वास्तुकला आपके संचारात्मक आदान-प्रदान की एक "पारिवारिक तस्वीर" को इकट्ठा करती है, जहां प्रत्येक तत्व बातचीत के गणितीय स्थान में दूसरों के संबंध में स्थित है।
यह घटना विशेष रूप से हाल के मॉडलों में स्पष्ट है, जैसे कि GPT-4 परिवार के मॉडल। OpenAI या क्लाउड ऑफ़ anthropic. लंबी बातचीत के दौरान संदर्भगत सुसंगति बनाए रखने की क्षमता स्मृतियों के डेटाबेस से नहीं, बल्कि संपूर्ण वार्तालाप के आधार पर संभाव्यता स्थान के निरंतर पुनर्समायोजन से आती है।
जब मैं किसी AI से किसी लंबी बातचीत की शुरुआत में बताई गई मेरी बिल्ली का नाम याद रखने के लिए कहता हूं, तो वह किसी अभिलेख में खोज नहीं कर रहा होता है। यह हमारी अंतःक्रिया के सदिश स्थान को पुनः संचालित कर रहा है, तथा उस बिंदु की तलाश कर रहा है जिस पर उस विशेष अवधारणा के इर्द-गिर्द विमर्श की ज्यामिति बनी थी।
द्रव वास्तुकला, बिना समझे अर्थ
तरल वास्तुकला की सबसे विचलित करने वाली विशेषताओं में से एक इसकी मानवीय अर्थों को “समझे बिना” अर्थों में हेरफेर करने की क्षमता है।
उदाहरण के लिए, यदि मैं किसी एलएलएम से प्रेम की तुलना नदी से करने वाला रूपक बनाने को कहूं, तो वे प्रेम या नदियों के व्यक्तिगत अनुभवों पर आधारित नहीं होंगे। वह सांख्यिकीय संबंधों के एक ऐसे स्थान पर काम कर रहे हैं जहां "प्रेम" और "नदी" की अवधारणाएं "प्रवाह", "गहराई", "अशांति" आदि जैसी अवधारणाओं के निकटता में मौजूद हैं। जो रूपक उभरता है वह भावनात्मक समझ या संवेदी अनुभव का परिणाम नहीं है, बल्कि भाषाई संघों के माध्यम से ज्यामितीय नेविगेशन का परिणाम है। फिर भी इसका परिणाम काव्यात्मक, मार्मिक और मानवीय अनुभव से गहराई से जुड़ा हो सकता है।
मेलानी मिशेल, शोधकर्ता सांता फ़े संस्थान, इस विरोधाभास को रेखांकित किया:
"क्या प्रतीकों का अर्थ समझे बिना उनका अर्थपूर्ण ढंग से उपयोग करना संभव है? भाषाई मॉडल ऐसा ही सुझाव देते हैं, जो 'समझने' के अर्थ के बारे में हमारी बुनियादी धारणाओं को चुनौती देते हैं।"
यह क्षमता तरल वास्तुकला की सबसे आकर्षक सीमाओं में से एक का प्रतिनिधित्व करती है: अर्थ की उत्पत्ति अर्थगत समझ के बजाय ज्यामितीय संबंधों के माध्यम से होती है।
चेतना के बिना बुद्धि का विरोधाभास
तरल वास्तुकला हमारे सामने एक मौलिक विरोधाभास प्रस्तुत करती है: ऐसी प्रणालियाँ जो मानवीय अर्थों में चेतना, उद्देश्य या समझ के बिना असाधारण रूप से बुद्धिमान व्यवहार प्रदर्शित करती हैं।
इस विरोधाभास के गहन दार्शनिक निहितार्थ हैं। यदि कोई प्रणाली बिना सचेत हुए भी मार्मिक कविता उत्पन्न कर सकती है, जटिल समस्याओं को सुलझा सकती है, तथा सहानुभूति का अनुकरण कर सकती है, तो यह हमें बुद्धिमत्ता की प्रकृति के बारे में क्या बताता है?
डेविड क्लैमर्स, दार्शनिक न्यूयॉर्क विश्वविद्यालय, सुझाव देता है कि हमें अपनी मौलिक परिभाषाओं पर पुनर्विचार करने की आवश्यकता है:
"यह पूछने के बजाय कि क्या एआई हमारी तरह सोचता है, हमें यह पूछना चाहिए कि क्या 'सोचने' और 'समझने' की हमारी परिभाषाएँ बहुत अधिक मानव-केंद्रित हैं।"
तरल वास्तुकला हमें एक मौलिक पुनर्विचार के लिए आमंत्रित करती है: शायद बुद्धिमत्ता के लिए जागरूकता की आवश्यकता नहीं होती। शायद, चेतना की तुलना में बुद्धिमत्ता को अधिक महत्व दिया जाता है। अर्थपूर्ण स्थानों में भ्रमण करने तथा सुसंगत आउटपुट उत्पन्न करने की क्षमता अपने आप में बुद्धिमत्ता का एक रूप है। मानवीय संज्ञान से भिन्न किन्तु कमतर नहीं।
द्रव वास्तुकला हमें (पुनः) सोचने के लिए आमंत्रित करती है
द्रव वास्तुकला को समझने का मतलब है एलएलएम को रहस्य से मुक्त करना, बल्कि उन पर आश्चर्य भी करना चाहिए। क्योंकि ऐसा करने पर, हम अपने ज्ञान पर पुनर्विचार करने के लिए बाध्य हो जाते हैं। यदि यह गणितीय प्रेत बिना विचार के इतनी अच्छी तरह काम कर सकता है, तो वास्तव में विचार क्या है? यदि आत्म के बिना सुसंगति का निर्माण किया जा सकता है, तो हमें बुद्धिमत्ता को कैसे परिभाषित करना चाहिए?
संभावना की तरल संरचना केवल कृत्रिम संज्ञान का नया क्षेत्र नहीं है। यह एक नया कैनवास है जिस पर हमें पुनर्विचार करने के लिए आमंत्रित किया जाता है कि बुद्धिमान होने का, जानने का और शायद होने का क्या अर्थ है।
और सबसे क्रांतिकारी सत्य क्या है? यह आर्किटेक्चर हमारी तरह नहीं सोचता: इसे ऐसा करने की आवश्यकता नहीं है। फिर भी, यह हमें विचार को समझने का एक नया तरीका दिखा सकता है।
हम सभी, केवल मैं ही नहीं, इस खरगोश के बिल में गिर गए हैंकृत्रिम होशियारी। और ऐलिस की तरह, हम पाते हैं कि यहां नियम अलग हैं। लेकिन, आश्चर्य की बात यह है कि बकवास की दुनिया के स्थान पर, हमें गणितीय संभावनाओं का एक ब्रह्मांड मिलता है, जो आश्चर्यजनक रूप से हमारी भाषा बोलता है।
यह मानवीय अर्थ में सोचा हुआ नहीं है, लेकिन यह सचमुच अद्भुत है: कृत्रिम संज्ञान की तरल संरचना, हमारे अपने मन का विकृत लेकिन आकर्षक प्रतिबिंब।