एआई शोधकर्ता अपने क्षेत्र को इसकी कड़वी दवा दे रहा है

स्रोत नोड: 1644765

कैलिफोर्निया इंस्टीट्यूट ऑफ टेक्नोलॉजी में कंप्यूटिंग के ब्रेन प्रोफेसर और एनवीडिया में मशीन लर्निंग रिसर्च के वरिष्ठ निदेशक अनिमा आनंदकुमार के पास मैट्रिक्स के साथ चुनने के लिए एक हड्डी है। उसकी गलतफहमी विज्ञान-फाई फिल्मों के बारे में नहीं है, बल्कि गणितीय मैट्रिक्स के बारे में है - पूरे कंप्यूटर विज्ञान में उपयोग की जाने वाली संख्याओं या चर के ग्रिड। जबकि शोधकर्ता आमतौर पर डेटा के बड़े सेट के भीतर छिपे संबंधों और पैटर्न का अध्ययन करने के लिए मैट्रिक्स का उपयोग करते हैं, ये उपकरण दो-तरफा संबंधों के लिए सबसे उपयुक्त हैं। दूसरी ओर, सामाजिक गतिशीलता जैसी जटिल प्रक्रियाओं में उच्च-क्रम की बातचीत शामिल होती है।

सौभाग्य से, आनंदकुमार ने लंबे समय से ऐसी चुनौतियों का अनुभव किया है। जब वह भारत के मैसूर (अब मैसूर) में एक बच्चे के रूप में मनाए गए एक नए साल के त्योहार उगादी को याद करती है, तो दो स्वाद सामने आते हैं: गुड़, जीवन की मिठास का प्रतिनिधित्व करने वाली एक अपरिष्कृत चीनी, और नीम, कड़वा फूल जीवन की असफलताओं और कठिनाइयों का प्रतिनिधित्व करते हैं। "यह सबसे कड़वी चीजों में से एक है जिसके बारे में आप सोच सकते हैं," उसने कहा।

वह आम तौर पर नीम पर लोड करती थी, उसने कहा। "मुझे चुनौतियां चाहिए।"

प्रयास की इस भूख ने उन्हें मद्रास में भारतीय प्रौद्योगिकी संस्थान में इलेक्ट्रिकल इंजीनियरिंग का अध्ययन करने के लिए प्रेरित किया। उसने कॉर्नेल विश्वविद्यालय में डॉक्टरेट की उपाधि प्राप्त की और मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी में पोस्टडॉक थी। उसके बाद उसने कैलिफोर्निया विश्वविद्यालय, इरविन में एक सहायक प्रोफेसर के रूप में अपना समूह शुरू किया, मशीन सीखने पर ध्यान केंद्रित किया, कृत्रिम बुद्धि का एक सबसेट जिसमें एक कंप्यूटर स्पष्ट प्रोग्रामिंग के बिना ज्ञान प्राप्त कर सकता है। इरविन में, आनंदकुमार ने "विषय मॉडलिंग" की दुनिया में गोता लगाया, एक प्रकार की मशीन लर्निंग जहां एक कंप्यूटर डेटा से महत्वपूर्ण विषयों को इकट्ठा करने की कोशिश करता है; एक उदाहरण ट्विटर पर एक एल्गोरिथम होगा जो छिपे हुए रुझानों की पहचान करता है। लेकिन शब्दों के बीच संबंध उन उच्च-क्रम की बातचीत में से एक है जो मैट्रिक्स संबंधों के लिए बहुत सूक्ष्म है: शब्दों के कई अर्थ हो सकते हैं, कई शब्द एक ही विषय को संदर्भित कर सकते हैं, और भाषा इतनी जल्दी विकसित होती है कि कुछ भी लंबे समय तक व्यवस्थित नहीं रहता है।

इसने आनंदकुमार को मैट्रिक्स विधियों पर एआई की निर्भरता को चुनौती देने के लिए प्रेरित किया। उन्होंने निष्कर्ष निकाला कि इस तरह की अराजकता के बीच सीखने के लिए एल्गोरिदम को पर्याप्त रूप से देखने के लिए, शोधकर्ताओं को इसे उच्च आयामों के बीजगणित को समझने के लिए डिजाइन करना चाहिए। इसलिए उसने उस चीज़ की ओर रुख किया जो लंबे समय से बीजगणित में एक कम इस्तेमाल किया गया उपकरण था जिसे टेंसर कहा जाता था। टेंसर मैट्रिसेस की तरह होते हैं, लेकिन वे मैट्रिक्स के दो आयामों की पंक्तियों और स्तंभों से परे जाकर किसी भी आयाम तक विस्तार कर सकते हैं। नतीजतन, टेंसर अधिक सामान्य उपकरण हैं, जो उन्हें "ओवरफिटिंग" के लिए कम संवेदनशील बनाते हैं - जब मॉडल प्रशिक्षण डेटा से निकटता से मेल खाते हैं लेकिन नए डेटा को समायोजित नहीं कर सकते हैं। उदाहरण के लिए, यदि आप कई संगीत शैलियों का आनंद लेते हैं, लेकिन केवल जैज़ गाने स्ट्रीम करते हैं, तो आपके स्ट्रीमिंग प्लेटफॉर्म का AI यह अनुमान लगाना सीख सकता है कि आपको कौन से जैज़ गाने पसंद आएंगे, लेकिन इसके R&B पूर्वानुमान निराधार होंगे। आनंदकुमार का मानना ​​है कि टेंसर मशीन लर्निंग को अधिक अनुकूलनीय बनाते हैं।

यह एकमात्र चुनौती नहीं है जिसे उसने अपनाया है। आनंदकुमार उन प्रणालियों में बदलाव के लिए एक सलाहकार और वकील हैं जो हाशिए के समूहों को मैदान से बाहर कर देते हैं। 2018 में, उसने अपने क्षेत्र के वार्षिक तंत्रिका सूचना प्रसंस्करण प्रणाली सम्मेलन का नाम सीधे संक्षिप्त से "न्यूरिप्स" में बदलने के लिए एक याचिका का आयोजन किया। सम्मेलन बोर्ड ने अक्टूबर की याचिका को खारिज कर दिया। लेकिन आनंदकुमार और उनके साथियों ने हार मानने से इनकार कर दिया और हफ्तों बाद बोर्ड ने अपना रुख पलट दिया।

क्वांटा आनंदकुमार के साथ पसादेना में उनके कार्यालय में उनकी परवरिश, तनाव और एआई के सामने आने वाली नैतिक चुनौतियों के बारे में बात की। साक्षात्कार को स्पष्टता के लिए संघनित और संपादित किया गया है।

आपके माता-पिता ने मशीनों के बारे में आपकी धारणा को कैसे प्रभावित किया?

1990 के दशक की शुरुआत में वे मैसूर में प्रोग्राम करने योग्य निर्माण मशीनों को लाने वाले पहले लोगों में से थे। उस समय इसे कुछ अजीब के रूप में देखा जाता था: "हम ऐसा करने के लिए मानव ऑपरेटरों को काम पर रख सकते हैं, तो स्वचालन की क्या आवश्यकता है?" मेरे माता-पिता ने देखा कि बड़ी क्षमताएं हो सकती हैं, और वे इसे मानव-संचालित मशीनों की तुलना में बहुत तेजी से कर सकते हैं।

क्या यह आपका ऑटोमेशन से परिचय था?

हाँ। और प्रोग्रामिंग। मैं हरे रंग की स्क्रीन देखूंगा जहां मेरे पिताजी कार्यक्रम लिखेंगे, और वह बुर्ज और औजारों को हिलाएगा। यह देखना वास्तव में आकर्षक था - ज्यामिति को समझना, यह समझना कि उपकरण को कैसे चलना चाहिए। आप इंजीनियरिंग पक्ष को देखें कि इतनी बड़ी मशीन ऐसा कैसे कर सकती है।

इंजीनियरिंग में आपकी माँ का अनुभव कैसा था? 

 मेरी माँ एक मायने में अग्रणी थीं। वह इंजीनियरिंग करने वाली अपने समुदाय और पारिवारिक पृष्ठभूमि की पहली महिला थीं। कई अन्य रिश्तेदारों ने मेरे दादाजी को यह कहते हुए न भेजने की सलाह दी कि वह आसानी से शादी नहीं कर सकते। मेरे दादा हिचकिचाते थे। तभी मेरी मां तीन दिन की भूख हड़ताल पर चली गईं।

नतीजतन, मैंने इसे महिलाओं के लिए इंजीनियरिंग में रुचि रखने के लिए कुछ अजीब नहीं देखा। मेरी माँ ने हममें गणित और विज्ञान के बारे में बहुत पहले ही समझ लिया था। बचपन से मैं कौन हूं, इसका सिर्फ एक स्वाभाविक हिस्सा होने के नाते एक लंबा सफर तय किया। अगर मेरी माँ ने कभी सेक्सिज्म देखा, तो वह इसे इंगित करती और कहती, "नहीं, इसे स्वीकार मत करो।" इससे वास्तव में मदद मिली।

क्या किसी और चीज ने आपको गणित और विज्ञान के बारे में उत्साहित किया?

हाई स्कूल से पहले पढ़ाया जाने वाला सारा गणित नियतात्मक होता है। जोड़, गुणा, सब कुछ जो आप करते हैं — एक ही उत्तर है। हाई स्कूल में, मैंने प्रायिकता के बारे में सीखना शुरू किया और यह कि हम चीजों के बारे में यादृच्छिकता के साथ तर्क कर सकते हैं। मेरे लिए यह अधिक समझ में आता है, क्योंकि प्रकृति के लिए और भी बहुत कुछ है। यादृच्छिकता है, और यहां तक ​​​​कि अराजकता भी है।

हमारे अपने जीवन में इतना कुछ है कि हम भविष्यवाणी नहीं कर सकते। लेकिन हमें पिछले अनुभवों को "ओवरफिट" नहीं करना चाहिए जो हमें अपने जीवन में नई परिस्थितियों के अनुकूल होने की अनुमति नहीं देगा। मैंने महसूस किया कि एआई के साथ, आपके पास नई चीजों को सामान्य बनाने, नए कौशल सीखने का लचीलापन होना चाहिए।

और इसीलिए आपने मशीन लर्निंग में मैट्रिक्स ऑपरेशंस पर सवाल उठाना शुरू कर दिया?

व्यवहार में, मशीन लर्निंग में मैट्रिक्स विधियाँ उच्च-क्रम संबंधों को प्रभावी ढंग से पकड़ नहीं सकती हैं। अनिवार्य रूप से, आप बिल्कुल नहीं सीख सकते। तो हमने पूछा: क्या होगा अगर हम उच्च-क्रम [संचालन] को देखें? यह हमें टेंसर बीजगणित में मिला।

अपने कई आयामों और लचीलेपन के साथ, एआई में उच्च-क्रम की समस्याओं के लिए टेंसर एक प्राकृतिक फिट की तरह लगते हैं। पहले किसी ने उनका इस्तेमाल क्यों नहीं किया?

मुझे यकीन था कि लोगों ने इस बारे में सोचा होगा। एक विधि के साथ आने के बाद, हम एक साहित्य खोज करने और देखने के लिए वापस गए। वास्तव में, 1927 में एक साइकोमेट्रिक्स पेपर था जिसमें सुझाव दिया गया था कि विभिन्न प्रकार की बुद्धिमत्ता का विश्लेषण करने के लिए, आपको ये टेंसर ऑपरेशन करने चाहिए। इसलिए लोग कुछ समय से इन विचारों को प्रस्तावित कर रहे हैं।

लेकिन समय की गणना इन उच्च-क्रम [संचालन] को संभाल नहीं पाई, जिसका अर्थ आम तौर पर कम से कम तीन पक्षों के बीच संबंध होता है। हमारे पास पर्याप्त डेटा भी नहीं था। समय महत्वपूर्ण था। नवीनतम हार्डवेयर, अधिक डेटा होने से अब हमें उच्च-क्रम विधियों पर जाने में मदद मिलेगी।

यदि आप AI को और अधिक लचीला बनाने में सफल हो जाते हैं, तो क्या होता है?

एआई की नींव पर ही पुनर्विचार।

उदाहरण के लिए, कई वैज्ञानिक क्षेत्रों में मैं अपने डेटा को एक निश्चित ग्रिड पर रखने के लिए बाध्य नहीं कर सकता। संख्यात्मक सॉल्वर लचीले होते हैं: यदि आप पारंपरिक सॉल्वर का उपयोग कर रहे हैं, तो आप अंतरिक्ष में किसी भी बिंदु पर आसानी से समाधान ढूंढ सकते हैं। लेकिन मानक मशीन लर्निंग मॉडल इस तरह से नहीं बनाए जाते हैं। इमेजनेट [छवियों को पहचानने के लिए एआई को प्रशिक्षित करने के लिए इस्तेमाल किया जाने वाला डेटाबेस] का एक निश्चित छवि आकार या रिज़ॉल्यूशन होता है। आप उस रिज़ॉल्यूशन पर एक नेटवर्क को प्रशिक्षित करते हैं, इसलिए आप उसी रिज़ॉल्यूशन में उसका परीक्षण करते हैं। यदि आप अब इस नेटवर्क का उपयोग करते हैं लेकिन रिज़ॉल्यूशन बदलते हैं, तो यह पूरी तरह से विफल हो जाता है। यह वास्तविक अनुप्रयोगों में उपयोगी नहीं है। वैज्ञानिक लचीलापन चाहते हैं।

हमने ऐसे तंत्रिका संचालक विकसित किए हैं जिनमें यह कमी नहीं है। इससे सटीकता बनाए रखते हुए महत्वपूर्ण गति प्राप्त हुई है। उदाहरण के लिए, हम वास्तविक समय में द्रव की गतिशीलता का सटीक अनुमान लगा सकते हैं और हम इसे ऐसे ड्रोन पर तैनात करने की योजना बना रहे हैं जो कैलटेक में एक ड्रोन पवन परीक्षण सुविधा में उच्च हवा की स्थिति में उड़ सकते हैं।

एक छात्र के रूप में, आपने IBM में इंटर्नशिप की, और अब Caltech में अपनी नौकरी के अलावा, आप Nvidia के साथ काम करते हैं। आप अकादमिक सिद्धांत और औद्योगिक अनुप्रयोग को क्यों मिलाते हैं?

मेरे माता-पिता उद्यमी हैं। लेकिन मेरे पिता की ओर से मेरे परदादा एक विद्वान थे जिन्होंने इस प्राचीन ग्रंथ को फिर से खोजा जिसे कहा जाता है अर्थशास्त्र. यह 300 ईसा पूर्व से अर्थशास्त्र पर पहली ज्ञात पुस्तक थी। इसलिए बड़े होकर, मैं हमेशा सोचता था: मैं इन दो दुनियाओं में कैसे घूमूं?

मुझे लगता है कि यह वह जगह है जहाँ यह वर्तमान युग इतना महान है। हम बहुत खुलापन देख रहे हैं कि कैसे एनवीडिया जैसी कंपनियां खुले शोध में निवेश कर रही हैं।

आपने एआई शोध के लिए एक प्रकार की हिप्पोक्रेटिक शपथ चाहने का उल्लेख किया है। क्यों?

यह सवाल करना हमेशा महत्वपूर्ण होता है कि हमारा काम दुनिया को कैसे प्रभावित करने वाला है। यह चुनौतीपूर्ण हो सकता है, खासकर एक बड़ी कंपनी में, क्योंकि आप इस विशाल प्रणाली के एक हिस्से का निर्माण कर रहे हैं। लेकिन जिस तरह से हम विश्वविद्यालयों में पढ़ाते हैं, वह सैन्य स्कूल से लिया गया है। इंजीनियरिंग उस पृष्ठभूमि से आई है, और इसमें से कुछ रुकी हुई है। जैसे यह सोचना कि वैज्ञानिकों और इंजीनियरों को तकनीकी चीजों पर ध्यान देना चाहिए और बाकी को दूसरों को संभालने देना चाहिए। यह गलत है। हम सभी को मानवीय सोच की जरूरत है।

आज के अनम्य एल्गोरिदम इन नैतिक समस्याओं में कैसे योगदान करते हैं?

मनुष्य को यह सोचने के लिए वातानुकूलित किया गया है कि आप मशीनों पर भरोसा कर सकते हैं। इससे पहले, यदि आप किसी मशीन को गुणा करने के लिए कहते हैं, तो यह हमेशा सही होगा। जबकि इंसान गलत हो सकते हैं और हमारा डेटा भी गलत हो सकता है। अब, जब एआई का प्रशिक्षण डेटा नस्लीय रूप से पक्षपाती है, तो हम प्रशिक्षण डेटा की मान्यताओं के लिए उपयुक्त हैं। हमारे पास न केवल गलत उत्तर हो सकते हैं, बल्कि उच्च आत्मविश्वास के साथ गलत उत्तर भी हो सकते हैं। यह खतरनाक है।

फिर हम कैसे आगे बढ़ें?

बेहतर एल्गोरिदम के निर्माण के संदर्भ में, हमें कम से कम यह पूछने की जरूरत है: क्या हम सही आत्मविश्वास का स्तर दे सकते हैं? अगर कोई दूसरा इंसान कहता है, "शायद मुझे 60% यकीन है कि यह सही जवाब है," तो आप इसे ध्यान में रखते हैं।

इसलिए अगर मैं अपनी खिड़की के बाहर देखता हूं और एक इमारत के आकार का एक बिल्ली जैसा जानवर देखता हूं, तो मैं सोच सकता हूं: "हां, यह बिल्ली की तरह दिखता है, लेकिन मुझे अभी तक यकीन नहीं है कि वास्तव में वह चीज क्या है।"

बिल्कुल। क्योंकि तभी इन मॉडलों में अति आत्मविश्वास की समस्या होती है। मानक प्रशिक्षण में, आप उन्हें बहुत आश्वस्त होने के लिए प्रोत्साहित कर रहे हैं।

आपने सलाह दी है Caltech का WAVE अध्येता कार्यक्रम, जो कम प्रतिनिधित्व वाली पृष्ठभूमि के छात्रों को शोध करने के लिए लाता है। आपको क्या लगता है कि AI में मेंटरशिप की क्या भूमिका है?

क्षेत्र की वरिष्ठ महिलाओं में से एक ने एक बार मुझसे कहा था कि महिलाओं को लगता है कि हम द्वीपों की तरह हैं। हम इतने डिस्कनेक्ट हो गए हैं। हम नहीं जानते कि दूसरों के साथ क्या हो रहा है। हम वेतनमान, या कुछ भी के बारे में नहीं जानते हैं। यह अलगाव की भावना है - कि आप सिस्टम का हिस्सा नहीं हैं। आपको ऐसा नहीं लगता कि आप यहां के हैं। मुझे लगता है कि यह दिखाकर ठीक करना बहुत महत्वपूर्ण है कि केवल एफ़िनिटी समूहों के अलावा और भी बहुत कुछ है, जैसे डब्लूआईएमएल और ऐ में काला. इन प्रयासों में निवेशित सलाहकारों और लोगों का एक व्यापक समूह है।

क्या यह NeurIPS नाम परिवर्तन के साथ आपके अनुभव से संबंधित है? वह लड़ाई आपके लिए इतनी महत्वपूर्ण क्यों थी?

बहुत से लोगों के लिए, यह ऐसा था, "ओह, एक मूर्खतापूर्ण नाम परिवर्तन।" लेकिन यह विषाक्तता में लाया। मुझे उम्मीद नहीं थी कि लंबे समय तक Reddit सूत्र हमारा और हमारी उपस्थिति का मज़ाक उड़ाएंगे, और सभी प्रकार की धमकियाँ, लोगों को परेशान करने के सभी प्रकार के प्रयास। इसमें से बहुत कुछ भूमिगत था। और इसने लोगों को इस बात से अवगत कराया कि इन सम्मेलनों में महिलाओं को क्या सामना करना पड़ेगा।

अंत में, मैं कहूंगा कि यह समुदाय को एक साथ लाया। यह उन लोगों के उदारवादी समूह को लाया जो अनजान थे। और इससे वास्तव में हमारी विविधता और समावेश को बढ़ाने में मदद मिली है।

भले ही आप लोगों को चुनौती देने के अभ्यस्त हैं, मुझे लगता है कि बोलना अभी भी कठिन था।

यह वास्तव में कठिन था। मैं एक निजी व्यक्ति हूं, लेकिन जब मैंने सोशल मीडिया पर बोलना शुरू किया, यहां तक ​​​​कि हम जो काम कर रहे हैं या बहुत ही सौम्य कुछ पोस्ट कर रहे हैं, तो टिप्पणियां अनफ़िल्टर्ड थीं। यह पूरी प्रकृति थी "चलो नकारात्मक चीजों के बारे में बात करने से बचें। चलो इसे दफनाते हैं।" लेकिन मेरी मानसिकता है कि हमें इसे खुले में लाना होगा और हमें खुद को जवाबदेह ठहराना होगा।

कि लोगों को अपना नीम खाना चाहिए?

बिल्कुल, बिल्कुल। कड़वे सच को आपको ही लेना होगा।

समय टिकट:

से अधिक क्वांटमगाज़ी