एक गणितज्ञ बार में प्रवेश करता है (गलत सूचना देने के लिए)

स्रोत नोड: 1865101

गलत सूचना, गलत सूचना, सूचना मनोरंजन, अलगोवार - यदि पिछले कुछ दशकों में मीडिया के भविष्य पर बहस का कोई मतलब है, तो उन्होंने कम से कम अंग्रेजी भाषा पर एक तीखी छाप छोड़ी है। हमारे व्यक्तिगत मनोविज्ञान और तंत्रिका विज्ञान से लेकर लोकतांत्रिक समाजों की ताकत के बारे में व्यापक चिंताओं तक सोशल मीडिया हमारे साथ क्या कर रहा है, इस पर बहुत अधिक अभद्रता और भय है। जैसा कि जोसेफ बर्नस्टीन ने हाल ही में रखा था, "भीड़ के ज्ञान" से "विघटन" में बदलाव वास्तव में एक अचानक हुआ है।

दुष्प्रचार क्या है? क्या यह अस्तित्व में है, और यदि हां, तो यह कहां है और हम कैसे जानते हैं कि हम इसे देख रहे हैं? क्या हमें इस बात की परवाह करनी चाहिए कि हमारे पसंदीदा प्लेटफार्मों के एल्गोरिदम हमें क्या दिखाते हैं, क्योंकि वे हमारे ध्यान को निचोड़ने का प्रयास करते हैं? यह केवल उसी प्रकार के जटिल गणितीय और सामाजिक विज्ञान के प्रश्न हैं जो प्राप्त हुए नूह गियानसिराकुसा विषय में रुचि।

बोस्टन में बेंटले विश्वविद्यालय के एक प्रोफेसर गियानसिराकुसा को गणित में प्रशिक्षित किया गया है (बीजगणितीय ज्यामिति जैसे क्षेत्रों में अपने शोध पर ध्यान केंद्रित करते हुए), लेकिन उनके पास गणितीय लेंस के माध्यम से सामाजिक विषयों को देखने का भी शौक था, जैसे कि कनेक्ट करना सुप्रीम कोर्ट के लिए कम्प्यूटेशनल ज्यामिति. हाल ही में, उन्होंने "" नामक एक पुस्तक प्रकाशित की है।एल्गोरिथम कैसे फेक न्यूज बनाते और रोकते हैं”आज के मीडिया परिदृश्य के आसपास के कुछ चुनौतीपूर्ण सवालों का पता लगाने के लिए और कैसे तकनीक उन प्रवृत्तियों को बढ़ा रही है और सुधार रही है।

मैंने हाल ही में एक ट्विटर स्पेस पर गियानसिराकुसा की मेजबानी की, और चूंकि ट्विटर ने बाद में इन वार्ताओं को सुनना आसान नहीं बनाया है (अल्पकालिकता!), मुझे लगा कि मैं आपके और आने वाली पीढ़ी के लिए हमारी बातचीत के सबसे दिलचस्प अंश निकालूंगा।

इस साक्षात्कार को संपादित किया गया है और स्पष्टता के लिए संघनित किया गया है।

डैनी क्रिचटन: आपने नकली समाचारों पर शोध करने और इस पुस्तक को लिखने का निर्णय कैसे लिया?

नूह गियानसिराकुसा: एक बात मैंने देखी है कि फेक न्यूज और इस प्रकार की चीजों पर वास्तव में बहुत दिलचस्प समाजशास्त्रीय, राजनीति विज्ञान चर्चा है। और फिर तकनीकी पक्ष पर, आपके पास मार्क जुकरबर्ग जैसी चीजें होंगी जो कह रही हैं कि एआई इन सभी समस्याओं को ठीक करने जा रहा है। ऐसा लग रहा था, उस अंतर को पाटना थोड़ा मुश्किल है।

सभी ने शायद बिडेन के इस हालिया उद्धरण को यह कहते हुए सुना होगा, “वे लोगों को मार रहे हैं,” सोशल मीडिया पर गलत सूचना के संबंध में। इसलिए हमारे पास राजनेता इन चीजों के बारे में बोल रहे हैं जहां उनके लिए एल्गोरिथम पक्ष को समझना मुश्किल है। फिर हमारे पास कंप्यूटर विज्ञान के लोग हैं जो वास्तव में विवरण में गहरे हैं। तो मैं एक तरह से बीच में बैठा हूँ, मैं वास्तव में कट्टर कंप्यूटर विज्ञान वाला व्यक्ति नहीं हूँ। इसलिए मुझे लगता है कि मेरे लिए बस पीछे हटना और विहंगम दृश्य प्राप्त करना थोड़ा आसान है।

दिन के अंत में, मुझे लगा कि मैं समाज के साथ कुछ और बातचीत करना चाहता हूं जहां चीजें गड़बड़ हो जाती हैं, जहां गणित इतना साफ नहीं है।

क्रिस्टन: एक गणितीय पृष्ठभूमि से आते हुए, आप इस विवादास्पद क्षेत्र में प्रवेश कर रहे हैं जहाँ बहुत सारे लोगों ने बहुत से विभिन्न कोणों से लिखा है। लोग इस क्षेत्र में क्या सही कर रहे हैं और लोगों ने शायद कुछ बारीकियों को याद किया है?

गियानसिराकुसा: बहुत सारी अविश्वसनीय पत्रकारिता है; मैं इस बात से हैरान रह गया कि कैसे बहुत सारे पत्रकार वास्तव में सुंदर तकनीकी चीजों से निपटने में सक्षम थे। लेकिन मैं एक बात कहूंगा कि शायद वे गलत नहीं थे, लेकिन मुझे बहुत अच्छा लगा, ऐसा कई बार होता है जब कोई अकादमिक पेपर निकलता है, या यहां तक ​​कि Google या फेसबुक या इन तकनीकी कंपनियों में से एक की घोषणा, और वे कुछ का उल्लेख करेंगे, और पत्रकार शायद एक उद्धरण निकालेंगे, और इसका वर्णन करने की कोशिश करेंगे, लेकिन वे वास्तव में इसे देखने और समझने की कोशिश करने में थोड़ा डरे हुए लगते हैं। और मुझे नहीं लगता कि ऐसा है कि वे ऐसा करने में सक्षम नहीं थे, यह वास्तव में डराने और डरने जैसा लगता है।

एक गणित शिक्षक के रूप में मैंने एक बात का बहुत अनुभव किया है कि लोग कुछ गलत कहने और गलती करने से डरते हैं। और यह उन पत्रकारों के लिए जाता है जिन्हें तकनीकी चीजों के बारे में लिखना होता है, वे कुछ गलत नहीं कहना चाहते। इसलिए फेसबुक से केवल एक प्रेस विज्ञप्ति उद्धृत करना या किसी विशेषज्ञ को उद्धृत करना आसान है।

एक बात जो शुद्ध गणित के बारे में बहुत मजेदार और सुंदर है, क्या आप गलत होने के बारे में वास्तव में चिंता नहीं करते हैं, आप केवल विचारों को आजमाते हैं और देखते हैं कि वे कहाँ जाते हैं और आप इन सभी इंटरैक्शन को देखते हैं। जब आप एक पेपर लिखने या भाषण देने के लिए तैयार हों, तो आप विवरणों की जांच करें। लेकिन अधिकांश गणित यह रचनात्मक प्रक्रिया है जहाँ आप खोज कर रहे हैं, और आप देख रहे हैं कि विचार कैसे परस्पर क्रिया करते हैं। एक गणितज्ञ के रूप में मेरा प्रशिक्षण आपको लगता है कि मुझे गलतियाँ करने और बहुत सटीक होने के बारे में आशंकित करेगा, लेकिन इसका विपरीत प्रभाव पड़ा।

दूसरा, इनमें से बहुत सारी एल्गोरिथम चीजें, जितनी जटिल लगती हैं उतनी जटिल नहीं हैं। मैं वहां उन्हें लागू करने के लिए नहीं बैठा हूं, मुझे यकीन है कि उन्हें प्रोग्राम करना कठिन है। लेकिन सिर्फ बड़ी तस्वीर, ये सभी एल्गोरिदम आजकल, इनमें से बहुत सी चीजें गहरी शिक्षा पर आधारित हैं। तो आपके पास कुछ तंत्रिका जाल है, वास्तव में मेरे लिए एक बाहरी व्यक्ति के रूप में मायने नहीं रखता है कि वे किस वास्तुकला का उपयोग कर रहे हैं, जो वास्तव में मायने रखता है, भविष्यवक्ता क्या हैं? मूल रूप से, वे कौन से चर हैं जिन्हें आप इस मशीन लर्निंग एल्गोरिथम को खिलाते हैं? और यह क्या उत्पादन करने की कोशिश कर रहा है? यह ऐसी बातें हैं जो कोई भी समझ सकता है।

क्रिस्टन: मुझे लगता है कि इन एल्गोरिदम का विश्लेषण करने में एक बड़ी चुनौती पारदर्शिता की कमी है। इसके विपरीत, कहें, शुद्ध गणित की दुनिया जो समस्याओं को हल करने के लिए काम कर रहे विद्वानों का एक समुदाय है, इनमें से कई कंपनियां वास्तव में व्यापक समुदाय को डेटा और विश्लेषण की आपूर्ति करने के बारे में काफी प्रतिकूल हो सकती हैं।

गियानसिराकुसा: ऐसा लगता है कि केवल बाहर से होने के कारण कोई भी क्या निष्कर्ष निकाल सकता है, इसकी एक सीमा है।

तो YouTube के साथ एक अच्छा उदाहरण है - शिक्षाविदों की टीम यह पता लगाना चाहती थी कि YouTube अनुशंसा एल्गोरिथ्म लोगों को अतिवाद के इन षड्यंत्र सिद्धांत खरगोश छेदों को नीचे भेजता है या नहीं। चुनौती यह है कि क्योंकि यह अनुशंसा एल्गोरिथ्म है, यह गहन शिक्षा का उपयोग कर रहा है, यह आपके खोज इतिहास, आपके जनसांख्यिकी, आपके द्वारा देखे गए अन्य वीडियो और कितनी देर तक - इन सभी चीजों के आधार पर सैकड़ों और सैकड़ों भविष्यवाणियों पर आधारित है। यह आपके और आपके अनुभव के लिए इतना अनुकूलित है, कि जितने भी अध्ययन मैं ढूंढ पाया उनमें गुप्त मोड का उपयोग किया गया।

तो वे मूल रूप से एक उपयोगकर्ता हैं जिनके पास कोई खोज इतिहास नहीं है, कोई जानकारी नहीं है और वे एक वीडियो पर जाएंगे और फिर पहले अनुशंसित वीडियो पर क्लिक करेंगे। और देखते हैं कि एल्गोरिथ्म लोगों को कहाँ ले जाता है। इतिहास के साथ वास्तविक मानव उपयोगकर्ता की तुलना में यह एक अलग अनुभव है। और यह वास्तव में कठिन रहा है। मुझे नहीं लगता कि किसी ने YouTube एल्गोरिथम को बाहर से एल्गोरिद्म रूप से एक्सप्लोर करने का एक अच्छा तरीका खोजा है।

ईमानदारी से, मुझे लगता है कि आप इसे एक पुराने स्कूल के अध्ययन की तरह ही कर सकते हैं, जहां आप स्वयंसेवकों के एक पूरे समूह की भर्ती करते हैं और उनके कंप्यूटर पर एक ट्रैकर लगाते हैं और कहते हैं, "अरे, बस जिस तरह से आप जीवन जीते हैं सामान्य रूप से अपने इतिहास और सब कुछ के साथ करें और हमें बताएं कि आप जो वीडियो देख रहे हैं। तो इस तथ्य को पार करना मुश्किल हो गया है कि इनमें से बहुत से एल्गोरिदम, लगभग सभी, मैं कहूंगा, आपके व्यक्तिगत डेटा पर बहुत अधिक आधारित हैं। हम नहीं जानते कि समग्र रूप से इसका अध्ययन कैसे किया जाए।

और ऐसा नहीं है कि केवल मुझे या बाहर के किसी और को परेशानी है क्योंकि हमारे पास डेटा नहीं है। इन कंपनियों के भीतर के लोग भी हैं जिन्होंने एल्गोरिथम का निर्माण किया है और जो जानते हैं कि एल्गोरिथम कागज पर कैसे काम करता है, लेकिन वे नहीं जानते कि यह वास्तव में कैसे व्यवहार करने वाला है। यह फ्रेंकस्टीन के राक्षस की तरह है: उन्होंने इस चीज का निर्माण किया, लेकिन वे नहीं जानते कि यह कैसे काम करेगा। तो मुझे लगता है कि आप वास्तव में इसका अध्ययन कर सकते हैं, अगर अंदर के लोग उस डेटा के साथ बाहर जाते हैं और इसका अध्ययन करने के लिए समय और संसाधन खर्च करते हैं।

क्रिस्टन: किसी प्लेटफॉर्म पर गलत सूचना का मूल्यांकन करने और जुड़ाव निर्धारित करने के लिए बहुत सारे मैट्रिक्स का उपयोग किया जाता है। आपकी गणितीय पृष्ठभूमि से आते हुए, क्या आपको लगता है कि वे उपाय मजबूत हैं?

गियानसिराकुसा: लोग गलत सूचनाओं को खत्म करने की कोशिश करते हैं। लेकिन इस प्रक्रिया में, वे इस पर टिप्पणी कर सकते हैं, वे इसे रीट्वीट या साझा कर सकते हैं, और यह सगाई के रूप में गिना जाता है। तो जुड़ाव के इन मापों में से बहुत सारे, क्या वे वास्तव में सकारात्मक या केवल सभी जुड़ाव देख रहे हैं? तुम्हें पता है, यह सब एक साथ हो जाता है।

अकादमिक शोध में भी ऐसा होता है। शोध कितना सफल है, इसके उद्धरण सार्वभौमिक मीट्रिक हैं। खैर, वेकफील्ड के मूल ऑटिज्म और वैक्सीन पेपर जैसी वास्तव में फर्जी चीजों को बहुत सारे उद्धरण मिले, उनमें से बहुत से लोग इसका हवाला दे रहे थे क्योंकि उन्हें लगा कि यह सही है, लेकिन इसमें से बहुत सारे वैज्ञानिक थे जो इसे खारिज कर रहे थे, वे इसे अपने पेपर में उद्धृत करते हैं कहते हैं, हम प्रदर्शित करते हैं कि यह सिद्धांत गलत है। लेकिन किसी तरह एक उद्धरण एक उद्धरण है। तो यह सब सफलता मीट्रिक की ओर गिना जाता है।

इसलिए मुझे लगता है कि सगाई के साथ जो कुछ हो रहा है, वह थोड़ा सा है। अगर मैं अपनी टिप्पणियों पर यह कहते हुए कुछ पोस्ट करता हूं, "अरे, यह पागल है," एल्गोरिदम को कैसे पता चलेगा कि मैं इसका समर्थन कर रहा हूं या नहीं? वे कोशिश करने के लिए कुछ एआई भाषा प्रसंस्करण का उपयोग कर सकते हैं लेकिन मुझे यकीन नहीं है कि वे हैं, और ऐसा करने के लिए यह बहुत प्रयास है।

क्रिस्टन: अंत में, मैं GPT-3 और सिंथेटिक मीडिया और नकली समाचारों के बारे में चिंता के बारे में थोड़ी बात करना चाहता हूं। इस बात का बहुत डर है कि एआई बॉट्स मीडिया को दुष्प्रचार से अभिभूत कर देंगे - हमें कितना डरना चाहिए या नहीं डरना चाहिए?

गियानसिराकुसा: क्योंकि मेरी पुस्तक वास्तव में अनुभव से एक वर्ग से निकली है, मैं निष्पक्ष रहने की कोशिश करना चाहता था, और बस लोगों को सूचित करना चाहता था और उन्हें अपने फैसले तक पहुंचने देना चाहता था। मैंने उस बहस को काटने की कोशिश करने का फैसला किया और वास्तव में दोनों पक्षों को बोलने दिया। मुझे लगता है कि न्यूज़फ़ीड एल्गोरिदम और मान्यता एल्गोरिदम बहुत हानिकारक सामग्री को बढ़ाते हैं, और यह समाज के लिए विनाशकारी है। लेकिन नकली समाचारों को सीमित करने के लिए उत्पादकता और सफलतापूर्वक एल्गोरिदम का उपयोग करने की बहुत आश्चर्यजनक प्रगति भी है।

ये टेक्नो-यूटोपियन हैं, जो कहते हैं कि एआई सब कुछ ठीक करने जा रहा है, हमारे पास सत्य-कथन, और तथ्य-जांच और एल्गोरिदम होंगे जो गलत सूचना का पता लगा सकते हैं और इसे नीचे ले जा सकते हैं। कुछ प्रगति हुई है, लेकिन वह चीज होने वाली नहीं है, और यह कभी भी पूरी तरह सफल नहीं होगी। इसे हमेशा मनुष्यों पर निर्भर रहने की आवश्यकता होगी। लेकिन दूसरी चीज जो हमारे पास है वह एक प्रकार का अतार्किक भय है। इस तरह का अतिशयोक्तिपूर्ण एआई डायस्टोपिया है जहां एल्गोरिदम इतने शक्तिशाली हैं, इस तरह की एकवचन प्रकार की चीजें हैं जो वे हमें नष्ट करने जा रहे हैं।

जब डीप फेक पहली बार 2018 में खबरों में आ रहे थे, और GPT-3 को कुछ साल पहले जारी किया गया था, तो बहुत डर था कि, "अरे शिट, यह फर्जी खबरों और यह समझने में हमारी सभी समस्याओं को दूर करने वाला है कि इसमें क्या सच है। दुनिया बहुत, बहुत कठिन। और मुझे लगता है कि अब हमारे पास कुछ वर्षों का फासला है, हम देख सकते हैं कि उन्होंने इसे थोड़ा कठिन बना दिया है, लेकिन उतना नहीं जितना हमने उम्मीद की थी। और मुख्य मुद्दा किसी भी चीज़ से अधिक मनोवैज्ञानिक और आर्थिक है।

इसलिए GPT-3 के मूल लेखकों के पास एक शोध पत्र है जो एल्गोरिथम का परिचय देता है, और उन्होंने जो कुछ किया वह एक परीक्षण था जिसमें उन्होंने कुछ पाठ चिपकाए और इसे एक लेख में विस्तारित किया, और फिर उनके पास कुछ स्वयंसेवकों का मूल्यांकन और अनुमान था कि कौन सा एल्गोरिथम-जनित एक है और कौन सा लेख मानव-निर्मित है। उन्होंने बताया कि उन्हें बहुत, बहुत करीब 50% सटीकता मिली, जिसका अर्थ है यादृच्छिक अनुमानों से बमुश्किल ऊपर। तो ऐसा लगता है, आप जानते हैं, आश्चर्यजनक और डरावना दोनों।

लेकिन यदि आप विवरणों को देखें, तो वे पाठ के एक पैराग्राफ के लिए एक पंक्ति के शीर्षक की तरह विस्तारित हो रहे थे। यदि आपने एक पूरा करने की कोशिश की, द अटलांटिक-लेंथ या न्यू यॉर्कर-लेंथ लेख, तो आप विसंगतियों को देखना शुरू कर देंगे, विचार भटकने वाला है। इस पत्र के लेखकों ने इसका जिक्र नहीं किया, उन्होंने बस अपना प्रयोग किया और कहा, "अरे, देखो यह कितना सफल है।"

तो यह आश्वस्त करने वाला लगता है, वे ये प्रभावशाली लेख बना सकते हैं। लेकिन यहाँ मुख्य कारण है, आखिरकार, GPT-3 नकली समाचार और गलत सूचना और इन सभी चीजों के संबंध में इतना परिवर्तनकारी क्यों नहीं रहा है। ऐसा इसलिए है क्योंकि फेक न्यूज ज्यादातर कचरा होती है। यह खराब लिखा गया है, यह कम गुणवत्ता वाला है, यह इतना सस्ता है और जल्दी से निकल जाता है, आप अपने 16 वर्षीय भतीजे को मिनटों में नकली समाचार लेखों का एक समूह बनाने के लिए भुगतान कर सकते हैं।

यह इतना नहीं है कि गणित ने मुझे यह देखने में मदद की। बात सिर्फ इतनी है कि गणित में हम जो मुख्य चीज करने की कोशिश कर रहे हैं वह है संशयवादी होना। इसलिए आपको इन बातों पर सवाल उठाना होगा और थोड़ा सशंकित होना होगा।

स्रोत: https://techcrunch.com/2021/08/20/a-mathematician-walks-into-a-bar-of-disinformation/

समय टिकट:

से अधिक Techcrunch