पाठ स्वतः पूर्णता प्रणालियों का लक्ष्य हमारे जीवन को आसान बनाना है, लेकिन इसमें जोखिम भी हैं

स्रोत नोड: 1575782

इस 12 जनवरी, 2022 को फ़्यूचर ऑफ़ वर्क समिट में डेटा और एआई रणनीतियों पर सीआईओ, सीटीओ और अन्य सी-स्तर और वरिष्ठ अधिकारियों से सुनें। और अधिक जानें


यदि आपने हाल ही में एक पाठ संदेश या ईमेल लिखा है, तो संभावना है कि एआई आपको विभिन्न समानार्थक शब्द, वाक्यांश या वाक्य को समाप्त करने के तरीकों का सुझाव दे। Google के स्मार्ट कंपोज़ जैसे एआई-संचालित ऑटोसजेशन टूल का उदय उद्यम संचार के डिजिटल परिवर्तन के साथ हुआ है, जो अब ज्यादातर ऑनलाइन रहते हैं। यह है अनुमानित कि सामान्य कार्यकर्ता प्रत्येक दिन लगभग 40 ईमेल का जवाब देता है और भेजता प्रति सप्ताह 200 से अधिक सुस्त संदेश।

मैसेजिंग से एडोब के साथ कार्यदिवस के बढ़ते हिस्से का उपभोग करने की धमकी दी जाती है पेगिंग कर्मचारी सप्ताह में 15.5 घंटे ईमेल का जवाब देने में कितना समय लगाते हैं। निरंतर कार्य स्विचिंग उत्पादकता के लिए एक मौत की घंटी है, जो अध्ययन निर्बाध कार्य से लाभ दिखाते हैं। अनुसंधान कैलिफ़ोर्निया विश्वविद्यालय और हम्बोल्ट विश्वविद्यालय के शोधकर्ताओं ने पाया कि हर बार बाधित होने पर कार्यकर्ता किसी कार्य में 23 मिनट तक का समय गंवा सकते हैं, आगे लंबा करना कार्यदिवस।

स्वसूचना उपकरण संदेश-लेखन और उत्तर देने को सुव्यवस्थित करके समय बचाने का वादा करते हैं। उदाहरण के लिए, गूगल का स्मार्ट रिप्लाई उन ईमेल्स के त्वरित जवाबों का सुझाव देता है जिन्हें टाइप करने में आमतौर पर कुछ मिनट लगते हैं। लेकिन इन उपकरणों के पीछे एआई में कमियां हैं जो पक्षपात का परिचय दे सकती हैं या अवांछित तरीकों से मैसेजिंग में इस्तेमाल की जाने वाली भाषा को प्रभावित कर सकती हैं।

स्वसूचना और पाठ स्वत: पूर्णता में वृद्धि

भविष्य कहनेवाला पाठ कोई नई तकनीक नहीं है। पहले व्यापक रूप से उपलब्ध उदाहरणों में से एक, T9, जो प्रत्येक अक्षर के लिए एक कीप्रेस से शब्द बनाने की अनुमति देता है, 90 के दशक के अंत में कई सेलफ़ोन पर मानक बन गया। लेकिन भाषा में अधिक परिष्कृत, स्केलेबल एआई तकनीकों के आगमन ने ऑटोसजेशन टूल की गुणवत्ता - और चौड़ाई - में छलांग लगाई।

2017 में, Google लॉन्च हुआ स्मार्ट उत्तर दें जीमेल में, जिसे कंपनी बाद में चैट और थर्ड-पार्टी ऐप्स सहित अन्य Google सेवाओं में लाई। Google के अनुसार, स्मार्ट रिप्लाई के पीछे एआई "बातचीत के पूर्ण संदर्भ के आधार पर" उत्तर सुझाव उत्पन्न करता है, न कि केवल एक संदेश - जाहिर तौर पर ऐसे सुझाव मिलते हैं जो अधिक सामयिक और प्रासंगिक होते हैं। स्मार्ट कंपोज़, जो ईमेल में पूरे वाक्यों का सुझाव देता है, एक साल बाद जीमेल और Google डॉक्स में आया जल्दी ही उसके बाद से. इसी तरह की सुविधा कहा जाता है सुझाए गए उत्तर 2018 में माइक्रोसॉफ्ट आउटलुक और 2020 में टीम्स में आया।

ऑटोसजेशन टूल्स की नई फसल के पीछे की तकनीक - जिसे कुछ अकादमिक मंडल "एआई-मध्यस्थता संचार" के रूप में संदर्भित करते हैं - 90 के दशक में मौजूद से परे है। उदाहरण के लिए, स्मार्ट कंपोज़ को रेखांकित करने वाला AI मॉडल ईमेल के अरबों उदाहरणों का उपयोग करके बनाया गया था और कस्टम त्वरक हार्डवेयर पर क्लाउड में चलता है। इस बीच, स्मार्ट रिप्लाई - जो स्मार्ट कंपोज़ की नींव के रूप में कार्य करता है - सुझावों के लिए एक "पदानुक्रमित दृष्टिकोण" लेता है, जो इस बात से प्रेरित होता है कि मनुष्य भाषाओं और अवधारणाओं को कैसे समझते हैं।

माइक्रोसॉफ्ट स्मार्ट रिप्लाई

ऊपर: आउटलुक का स्मार्ट रिप्लाई एज़्योर मशीन लर्निंग में प्रशिक्षित डीप लर्निंग मॉडल का उपयोग करता है।

चित्र साभार: Microsoft

"भाषा की सामग्री गहराई से श्रेणीबद्ध है, भाषा की संरचना में ही परिलक्षित होती है ..." Google अनुसंधान वैज्ञानिक ब्रायन स्ट्रोप और इंजीनियरिंग निदेशक रे कुर्ज़वील समझाना एक ब्लॉग पोस्ट में। "संदेश पर विचार करें, 'कैफे में वह दिलचस्प व्यक्ति जिसे हम पसंद करते हैं, ने मुझे एक नज़र दी।' ... इस संदेश के लिए एक उचित प्रतिक्रिया का प्रस्ताव करते हुए हम 'नज़र' शब्द के अर्थ पर विचार कर सकते हैं, जो संभावित रूप से अस्पष्ट है। क्या यह एक सकारात्मक भाव था? उस स्थिति में, हम जवाब दे सकते हैं, 'कूल!' या यह एक नकारात्मक भाव था? यदि हां, तो क्या विषय इस बारे में कुछ कहता है कि लेखक ने नकारात्मक आदान-प्रदान के बारे में कैसा महसूस किया? सूक्ष्म भेद करने के लिए दुनिया के बारे में बहुत सारी जानकारी और तर्कपूर्ण निर्णय लेने की क्षमता की आवश्यकता होती है। भाषा के पर्याप्त उदाहरणों को देखते हुए, एक मशीन लर्निंग दृष्टिकोण इनमें से कई सूक्ष्म भेदों की खोज कर सकता है। ”

लेकिन जैसा कि सभी तकनीकों के साथ होता है, यहां तक ​​कि सबसे सक्षम स्वसूचना उपकरण भी उन खामियों के लिए अतिसंवेदनशील होते हैं जो विकास - और परिनियोजन - प्रक्रिया के दौरान सामने आते हैं।

दिसंबर 2016 में, यह था प्रकट कि Google खोज की स्वत: पूर्ण सुविधा विशिष्ट खोज वाक्यांशों के लिए घृणित और आपत्तिजनक अंत का सुझाव देती है, जैसे "क्या यहूदी बुरे हैं?" "यहूदी हैं" वाक्यांश के लिए। कंपनी के अनुसार, गलती एक एल्गोरिथम प्रणाली थी जो हाल ही में अन्य उपयोगकर्ताओं द्वारा की गई खोज के आधार पर सुझावों को अपडेट करती है। जबकि Google ने अंततः एक फिक्स लागू किया, इसके लिए कंपनी को स्वत: पूर्णता सुझावों को अवरुद्ध करने में कई और साल लग गए विवादास्पद राजनीतिक बयान मतदान आवश्यकताओं और चुनावी प्रक्रियाओं की वैधता के बारे में झूठे दावों सहित।

स्मार्ट रिप्लाई हो गया है पाया बंदूक वाले इमोजी वाले संदेश के जवाब में "पगड़ी पहनने वाला व्यक्ति" इमोजी पेश करने के लिए। और iOS पर Apple की स्वत: पूर्णता पहले से CEO, COO और CTO सहित कार्यकारी भूमिकाओं के लिए केवल पुरुष इमोजी का सुझाव दिया।

पक्षपाती डेटा

स्वत: पूर्णता और स्वत: सुझाव प्रणाली में त्रुटियां अक्सर पक्षपाती डेटा से उत्पन्न होती हैं। लाखों से अरबों उदाहरण जिनसे सिस्टम सीखता है, पाठ से दूषित हो सकते हैं जहरीली वेबसाइटें जो कुछ लिंगों, जातियों को जोड़ता है, जातियों, और हानिकारक अवधारणाओं वाले धर्म। समस्या का चित्रण, ज़ाब्ता, अनुसंधान प्रयोगशाला OpenAI द्वारा विकसित एक कोड-जनरेटिंग मॉडल, "इस्लाम" शब्द खिलाए जाने पर "आतंकवादी" लिखने के लिए प्रेरित किया जा सकता है। AI स्टार्टअप का एक और बड़ा भाषा मॉडल जुटना "पुरुष वैज्ञानिक" और "महिला हाउसकीपर" जैसे "पुरुष" और "महिला" व्यवसायों के साथ पुरुषों और महिलाओं को जोड़ने की प्रवृत्ति है।

Google डॉक्स के लिए स्मार्ट रचना

ऊपर: Google डॉक्स के लिए स्मार्ट कंपोज़।

डेटा में एनोटेशन नई समस्याएं पेश कर सकते हैं — या मौजूदा समस्याओं को बढ़ा सकते हैं। क्योंकि कई मॉडल लेबल से सीखते हैं जो संवाद करते हैं कि क्या किसी शब्द, वाक्य, पैराग्राफ या दस्तावेज़ में कुछ विशेषताएं हैं, जैसे कि सकारात्मक या नकारात्मक भावना, कंपनियां और शोधकर्ता मानव एनोटेटर्स की टीमों को उदाहरणों को लेबल करने के लिए भर्ती करते हैं, आमतौर पर अमेज़ॅन मैकेनिकल तुर्क जैसे क्राउडसोर्सिंग प्लेटफॉर्म से। ये एनोटेटर अपने स्वयं के दृष्टिकोण - और पूर्वाग्रह - तालिका में लाते हैं।

एलन इंस्टीट्यूट फॉर एआई, कार्नेगी मेलन और वाशिंगटन विश्वविद्यालय के एक अध्ययन में, वैज्ञानिकों ने पाया कि अफ्रीकी अमेरिकी अंग्रेजी (एएई) बोली में वाक्यांशों को सामान्य अमेरिकी अंग्रेजी समकक्षों की तुलना में अधिक विषाक्त होने की संभावना है - उनके समझे जाने के बावजूद AAE स्पीकर द्वारा नॉन-टॉक्सिक के रूप में. आरासाइबरबुलिंग और दुष्प्रचार से निपटने के लिए Google मूल कंपनी अल्फाबेट के तहत काम करने वाली संस्था ने अपने प्रयोगों में इसी तरह के निष्कर्ष निकाले हैं। कंपनी के शोधकर्ताओं ने उन लेबलरों के बीच एनोटेशन में अंतर पाया है जो स्वयं को अफ्रीकी अमेरिकियों के रूप में पहचानते हैं और LGBTQ+ समुदाय बनाम एनोटेटर्स के सदस्य हैं जो उन समूहों में से किसी के रूप में पहचान नहीं करते हैं।

कभी-कभी, पूर्वाग्रह जानबूझकर होता है - स्थानीय भाषा के व्यापार-नापसंद का मामला। उदाहरण के लिए, लेखकसामग्री निर्माण के लिए एआई सहायक विकसित करने वाला एक स्टार्टअप, का कहना है कि यह अपने लेखन सुझावों में "व्यावसायिक अंग्रेजी" को प्राथमिकता देता है। सीईओ मे हबीब ने एएवीई में "अभ्यस्त होना" का उदाहरण दिया, एक क्रिया काल जो अंग्रेजी की किसी अन्य शैली में मौजूद नहीं है।

"चूंकि [आदत हो] पारंपरिक रूप से व्यापार अंग्रेजी में उपयोग नहीं किया गया है, और इस प्रकार हमारे डेटासेट में उच्च आवृत्ति में दिखाई नहीं देता है, हम 'Y'all कुछ अजीब चीजें यहां कर रहे हैं' को 'Y' में सही करेंगे। सभी यहाँ कुछ अजीब चीजें कर रहे हैं," हबीब ने ईमेल के माध्यम से वेंचरबीट को बताया। "[उस ने कहा,] हमने मैन्युअल रूप से यह सुनिश्चित किया कि लेखक द्वारा स्थानीय भाषा-आधारित अभिवादन और साइन-ऑफ़ फ़्लैग नहीं किए जाएंगे। औपचारिक व्यापार अंग्रेजी की तुलना में कुछ स्थानीय भाषा अधिक लिंग-तटस्थ है, [उदाहरण के लिए,] इसलिए कंपनियों के लिए अधिक आधुनिक और ऑन-ब्रांड है।

लेखन को प्रभावित करना

जब पक्षपात - जानबूझकर या नहीं - इसे स्वत: पूर्णता और स्वत: सुझाव प्रणाली में बनाते हैं, तो वे हमारे लिखने के तरीके को बदल सकते हैं। जिस बड़े पैमाने पर ये प्रणालियाँ संचालित होती हैं, उनसे पूरी तरह से बचना मुश्किल (यदि असंभव नहीं है) हो जाता है। स्मार्ट रिप्लाई था जिम्मेदार 10 में स्मार्टफोन से भेजे गए सभी जीमेल उत्तरों में से 2016% के लिए।

अधिक व्यापक में से एक में आडिट स्वत: पूर्णता उपकरणों में, माइक्रोसॉफ्ट के शोधकर्ताओं की एक टीम ने स्वयंसेवकों के साथ साक्षात्कार आयोजित किए, जिन्हें आउटलुक में ऑटो-जेनरेट किए गए उत्तरों पर अपने विचार देने के लिए कहा गया था। साक्षात्कारकर्ताओं ने पाया कि कुछ उत्तर अति-सकारात्मक, संस्कृति और लिंग के बारे में उनकी धारणाओं में गलत हैं, और कॉर्पोरेट पत्राचार जैसे कुछ संदर्भों के लिए बहुत असभ्य हैं। फिर भी, अध्ययन के दौरान किए गए प्रयोगों से पता चला कि उपयोगकर्ता आउटलुक द्वारा सुझाए गए छोटे, सकारात्मक और विनम्र उत्तरों का समर्थन करने की अधिक संभावना रखते थे।

गूगल स्मार्टरिप्लाई यूट्यूब

एक अलग हार्वर्ड अध्ययन में पाया गया कि जब एक रेस्तरां के बारे में लिखने वाले लोगों को "सकारात्मक" स्वत: पूर्ण सुझावों के साथ प्रस्तुत किया गया था, तो परिणामी समीक्षाएं नकारात्मक सुझावों के साथ प्रस्तुत किए जाने की तुलना में अधिक सकारात्मक थीं। हार्वर्ड स्कूल ऑफ के एक शोधकर्ता केन अर्नोल्ड ने कहा, "यह सोचना रोमांचक है कि भविष्य की भविष्यवाणियां कैसे लोगों को अधिक प्रभावी लेखक बनने में मदद कर सकती हैं, लेकिन हमें उन सुझावों से बचाने के लिए पारदर्शिता और उत्तरदायित्व की भी आवश्यकता है, जो पक्षपाती या हेरफेर कर सकते हैं।" इंजीनियरिंग और एप्लाइड साइंसेज जो अध्ययन में शामिल थे, बोला था बीबीसी।

यदि हानिकारक स्वत: पूर्णता की समस्या का एक व्यापक समाधान है, तो इसे अभी तक खोजा नहीं जा सका है। Google ने स्मार्ट कंपोज़ में केवल लिंग-आधारित सर्वनाम सुझावों को ब्लॉक करने का विकल्प चुना क्योंकि सिस्टम प्राप्तकर्ताओं के लिंग और लिंग पहचान का खराब भविष्यवक्ता साबित हुआ। माइक्रोसॉफ्ट का लिंक्डइन भी संभावित ब्लंडर्स को रोकने के लिए, अपने प्रेडिक्टिव मैसेजिंग टूल, स्मार्ट रिप्लाई में लिंग वाले सर्वनामों से बचता है।

माइक्रोसॉफ्ट के सह-लेखक अध्ययन चेतावनी देते हैं कि यदि सिस्टम डिज़ाइनर स्वत: पूर्णता प्रौद्योगिकियों में कमियों को सक्रिय रूप से संबोधित नहीं करते हैं, तो वे न केवल उपयोगकर्ताओं को अपमानित करने का जोखिम उठाएंगे बल्कि उन्हें सिस्टम पर अविश्वास करने का कारण बनेंगे। "सिस्टम डिजाइनरों को व्यक्तिगत और सामाजिक नेटवर्क स्तर पर वैयक्तिकरण रणनीतियों का पता लगाना चाहिए, विचार करें कि सांस्कृतिक मूल्यों और सामाजिक पूर्वाग्रहों को उनके सिस्टम द्वारा कैसे बनाए रखा जा सकता है, और सीमाओं और मुद्दों को संबोधित करने के लिए सामाजिक संपर्क मॉडलिंग का पता लगाना चाहिए," उन्होंने लिखा। "[ओ] आपके निष्कर्ष बताते हैं कि ईमेल और अन्य [जैसी] प्रौद्योगिकियों के लिए वर्तमान पाठ अनुशंसा प्रणाली वास्तविक दुनिया के सामाजिक संबंधों और संचार आवश्यकताओं की सूक्ष्मता को प्रतिबिंबित करने के लिए अपर्याप्त रूप से सूक्ष्म हैं। "

VentureBeat

वेंचरबीट का मिशन तकनीकी निर्णय लेने वालों के लिए एक डिजिटल टाउन स्क्वायर होना है जो परिवर्तनकारी तकनीक और लेनदेन के बारे में ज्ञान प्राप्त करे। हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है ताकि आप अपने संगठनों का नेतृत्व कर सकें। हम आपको हमारे समुदाय का सदस्य बनने के लिए, उपयोग करने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अद्यतित जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों, जैसे कि पहुँच को रियायती रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बनें

स्रोत: https://venturebeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

समय टिकट:

से अधिक एआई - वेंचरबीट