ब्रुकलिन के एक मचान में, मेज पर बिखरे केबलों और लेंसों से भरे, का प्रोटोटाइप कैरा गंदगी फिर से लौट आती है: प्रिंटों के ढेर, घंटों पड़ा एक मग। फिर नैनो बनाना काम शुरू करता है: यह वस्तुओं को हिलाता है, रंगों को निखारता है, और तस्वीर साफ़ हो जाती है, इंस्टाग्राम के लिए एकदम सही। यह सिर्फ़ एक टच-अप नहीं है; ऐसा लगता है जैसे हार्डवेयर और आर्टिफिशियल इंटेलिजेंस बिना कुछ कहे एक-दूसरे से बात कर रहे हों। और हम खुद को एक तरह के "विरूपण के पोलारॉइड" के साथ पाते हैं, जो वास्तविकता को देखते हुए उसे बदल रहा है।
शॉट का वह क्षण जो झुक जाता है
आपकी उंगली बटन को छूती है और प्रकाश लेंस में प्रवेश करता है। आपके iPhone से चुंबकीय रूप से जुड़ा एक AI कैमरा, कैरा, दृश्य को कैद कर लेता है: एक कम रोशनी वाला चेहरा, एक विचलित करने वाला बैकग्राउंड, या शायद परिणाम में कुछ गड़बड़। लेकिन पोस्ट-प्रोसेसिंग के लिए इंतज़ार करने की ज़रूरत नहीं है: Google द्वारा विकसित जेनरेटिव इमेज मॉडल, नैनो बनाना, तुरंत काम करना शुरू कर देता है। प्रकाश धीमा हो जाता है, ड्रेस का लाल रंग नीला हो जाता है, वाइन का गिलास पानी में बदल जाता है (माफ़ कीजिए, जीसस: कोई व्यक्तिगत बात नहीं)। यह एक सहज प्रवाह है, कैप्चर से आउटपुट तक, बिना किसी जटिल मेनू या बाहरी ऐप्स के। ऐसा लगता है जैसे कैमरा पहले से ही जानता था कि आप क्या करना चाहते हैं, इससे पहले कि आप इसके बारे में सोचें भी।
लेकिन फिर कुछ गड़बड़ हो जाती है। संपादन बहुत ज़्यादा प्रवाहपूर्ण है, और असली शॉट और AI संस्करण के बीच की रेखा धुंधली हो जाती है। एक स्थानांतरित वस्तु अब सिर्फ़ एक विवरण नहीं रह जाती; यह एक विकल्प बन जाती है जो संदर्भ बदल देती है। अगर विषय कोई व्यक्ति है, तो प्रकाश में बदलाव मूड बदल सकता है, चेहरे का सुधार धारणा को बदल सकता है। यह वहीं, एक सेकंड में होता है, और iOS पर निर्यात की गई तस्वीर असली, बेदाग़ लगती है। फिर भी, दर्शक को पता नहीं चलता कि पहले क्या था। इस तरह के किसी भी उपकरण का यही जोखिम है: वास्तविकता आकार लेती है, और इसके साथ ही, आप जो देखते हैं उस पर भरोसा भी।
कैरा कैसे काम करता है
कैमरा इंटेलिजेंसकैरा के पीछे की स्टार्टअप कंपनी ने नैनो बनाना को इसकी विश्वसनीयता के लिए चुना। यह एक हल्का मॉडल है, जो जेमिनी 2.5 फ्लैश पर आधारित है, जो बिना किसी आर्टिफैक्ट के ऑप्टिकल डिटेल्स को सुरक्षित रखता है। इसका सेंसर एक मानक आईफोन से चार गुना बड़ा है, और इंटरचेंजेबल लेंस एक कॉम्पैक्ट सेटअप में प्रो क्वालिटी लाते हैं। कंपनी के सीईओ विशाल कुमार बताते हैं कि इसका उद्देश्य वर्कफ़्लो को एक साथ समेटना है: शूट करना, एडिट करना, शेयर करना, सब एक ही चरण में। उन्होंने नैतिक बाधाओं को एकीकृत किया हैGoogle की नीतियों के अनुरूप: त्वचा के रंग, जातीयता या चेहरे की बुनियादी विशेषताओं में कोई बदलाव नहीं। और पहचान से छेड़छाड़ करने वाले बदलावों को ब्लॉक कर दिया जाता है।
और फिर भी, कुछ मानवीय बारीकियाँ हैं जो खटकती हैं। एक रिपोर्ट की कल्पना कीजिए: एक वास्तविक घटना, जिसे कैरा ने कैद किया है, लेकिन कहानी को "बेहतर" बनाने के लिए उसमें कुछ बदलाव किए गए हैं। एआई नस्लीय बदलावों को रोकता है, ठीक है, लेकिन उस बदली हुई परछाई का क्या जो माहौल बदल दे? या नाटकीयता के लिए जोड़ी गई कोई वस्तु? यह ऐसा है जैसे कोई सहकर्मी आपके बोलते समय आपकी बात सुधार रहा हो: कभी-कभी उपयोगी, लेकिन यह नियंत्रण छीन लेता है, और सबसे बढ़कर, सहजता। डीपफेक और धारणा पर एमआईटी मीडिया लैब के शोध का हवाला देते हुए, एआई पहले से ही छवियों में विश्वास को बड़े पैमाने पर खत्म कर रहा है। और यह विश्वास का एक अपरिहार्य नुकसान है, क्योंकि एआई यह वास्तव में वास्तविकता को विकृत कर देता है, और इसके साथ हमारी दृश्य स्मृति।
शायद यही विरोधाभास है: कैरा रचनात्मकता को गति देता है, लेकिन चिंतन को धीमा कर देता है। एक जल्दबाज़ रचनाकार वन-शॉट एडिटिंग की सराहना करता है; एक कलाकार नहीं। अगर कोई ग्राहक मूल तस्वीर माँगे तो क्या होगा? या क्या होगा अगर एक "परफेक्ट" तस्वीर में एक ऑप्टिकल त्रुटि छिपी हो जिसे एआई ने ढक दिया हो? ऐसा सोचना निराशाजनक है, लेकिन तकनीक पूर्णता का वादा करती है, जबकि हम इंसान उन खामियों पर ठोकर खाते हैं जो वास्तविकता को सचमुच दिलचस्प बनाती हैं।