ट्रांसफर लर्निंग क्या है?

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

ट्रांसफर लर्निंग एक मशीन लर्निंग विधि है जहां एक कार्य में प्रयुक्त मॉडल से प्राप्त ज्ञान के अनुप्रयोग को दूसरे कार्य के लिए आधार बिंदु के रूप में पुन: उपयोग किया जा सकता है।

मशीन लर्निंग एल्गोरिदम ऐतिहासिक डेटा का उपयोग उनके इनपुट के रूप में भविष्यवाणी करने और नए आउटपुट मान उत्पन्न करने के लिए करते हैं। वे आम तौर पर पृथक कार्यों का संचालन करने के लिए डिज़ाइन किए गए हैं। एक स्रोत कार्य एक ऐसा कार्य है जिससे ज्ञान को लक्ष्य कार्य में स्थानांतरित किया जाता है। एक लक्ष्य कार्य तब होता है जब एक स्रोत कार्य से ज्ञान के हस्तांतरण के कारण बेहतर शिक्षण होता है।

स्थानांतरण सीखने के दौरान, एक स्रोत कार्य से प्राप्त ज्ञान और तेजी से प्रगति का उपयोग सीखने और विकास को एक नए लक्ष्य कार्य में सुधार करने के लिए किया जाता है। ज्ञान का अनुप्रयोग स्रोत कार्य की विशेषताओं और विशेषताओं का उपयोग कर रहा है, जिसे लागू किया जाएगा और लक्ष्य कार्य पर मैप किया जाएगा।

हालाँकि, यदि स्थानांतरण विधि के परिणामस्वरूप नए लक्ष्य कार्य के प्रदर्शन में कमी आती है, तो इसे नकारात्मक स्थानांतरण कहा जाता है। स्थानांतरण सीखने के तरीकों के साथ काम करते समय प्रमुख चुनौतियों में से एक कम संबंधित कार्यों के बीच नकारात्मक हस्तांतरण से बचने के साथ-साथ संबंधित कार्यों के बीच सकारात्मक हस्तांतरण प्रदान करने और सुनिश्चित करने में सक्षम है।

क्या, कब, और कैसे स्थानांतरण सीखना

हम क्या ट्रांसफर करते हैं? यह समझने के लिए कि ज्ञान के किन हिस्सों को स्थानांतरित करना है, हमें यह पता लगाना होगा कि ज्ञान के कौन से हिस्से स्रोत और लक्ष्य दोनों को सर्वोत्तम रूप से दर्शाते हैं। कुल मिलाकर, लक्ष्य कार्य के प्रदर्शन और सटीकता में सुधार।
हम कब ट्रांसफर करते हैं? यह समझना महत्वपूर्ण है कि कब स्थानांतरण करना है, क्योंकि हम ज्ञान को स्थानांतरित नहीं करना चाहते हैं, जो बदले में मामले को बदतर बना सकता है, जिससे नकारात्मक हस्तांतरण हो सकता है। हमारा लक्ष्य लक्ष्य कार्य के प्रदर्शन में सुधार करना है, न कि इसे बदतर बनाना।
हम कैसे ट्रांसफर करते हैं? अब हमारे पास एक बेहतर विचार है कि हम क्या स्थानांतरित करना चाहते हैं और जब हम ज्ञान को कुशलतापूर्वक स्थानांतरित करने के लिए विभिन्न तकनीकों के साथ काम करने के लिए आगे बढ़ सकते हैं। इसके बारे में हम बाद में लेख में बात करेंगे।

इससे पहले कि हम ट्रांसफर लर्निंग के पीछे की कार्यप्रणाली में उतरें, ट्रांसफर लर्निंग के विभिन्न रूपों को जानना अच्छा है। स्रोत कार्य और लक्ष्य कार्य के बीच संबंधों के आधार पर हम तीन अलग-अलग प्रकार के स्थानांतरण सीखने के परिदृश्यों से गुजरेंगे। नीचे विभिन्न प्रकार के स्थानांतरण सीखने का अवलोकन दिया गया है:

विभिन्न प्रकार के स्थानांतरण सीखना

आगमनात्मक स्थानांतरण सीखना: इस प्रकार के स्थानांतरण सीखने में, स्रोत और लक्ष्य कार्य समान होते हैं, हालांकि, वे अभी भी एक दूसरे से भिन्न होते हैं। लक्ष्य कार्य के प्रदर्शन को बेहतर बनाने में मदद करने के लिए मॉडल स्रोत कार्य से आगमनात्मक पूर्वाग्रहों का उपयोग करेगा। स्रोत कार्य में लेबल किए गए डेटा हो सकते हैं या नहीं भी हो सकते हैं, जो आगे चलकर मल्टीटास्क लर्निंग और स्व-सिखाया सीखने का उपयोग करते हुए मॉडल की ओर अग्रसर होते हैं।

अनुपयोगी स्थानांतरण सीखना: मुझे लगता है कि आप जानते हैं कि अप्रशिक्षित शिक्षा क्या है, हालांकि, यदि आप नहीं करते हैं, तो यह तब होता है जब एक एल्गोरिदम को डेटासेट में पैटर्न की पहचान करने में सक्षम होने के अधीन किया जाता है जिसे लेबल या वर्गीकृत नहीं किया गया है। इस मामले में, स्रोत और लक्ष्य समान हैं, हालांकि, कार्य अलग है, जहां दोनों डेटा स्रोत और लक्ष्य दोनों में लेबल रहित हैं। अनियंत्रित शिक्षा में आयामीता में कमी और क्लस्टरिंग जैसी तकनीकों को अच्छी तरह से जाना जाता है।

ट्रांसडक्टिव ट्रांसफर लर्निंग: इस अंतिम प्रकार के ट्रांसफर लर्निंग में, स्रोत और लक्ष्य कार्य समानताएं साझा करते हैं, हालांकि, डोमेन अलग हैं। स्रोत डोमेन में बहुत अधिक लेबल वाला डेटा होता है, जबकि लक्ष्य डोमेन में लेबल किए गए डेटा का अभाव होता है, जो आगे चलकर डोमेन अनुकूलन का उपयोग करके मॉडल की ओर अग्रसर होता है।

ट्रांसफर लर्निंग बनाम फाइन-ट्यूनिंग

फाइन-ट्यूनिंग ट्रांसफर लर्निंग में एक वैकल्पिक कदम है और इसे मुख्य रूप से मॉडल के प्रदर्शन को बेहतर बनाने के लिए शामिल किया गया है। ट्रांसफर लर्निंग और फाइन-ट्यूनिंग के बीच का अंतर नाम में है।

ट्रांसफर लर्निंग एक कार्य से सीखी गई विशेषताओं को अपनाने और लीवरेज्ड ज्ञान को एक नए कार्य पर "स्थानांतरित" करने पर बनाया गया है। स्थानांतरण सीखने का उपयोग आमतौर पर उन कार्यों पर किया जाता है जहां डेटासेट बहुत छोटा होता है, ताकि पूर्ण पैमाने पर मॉडल को खरोंच से प्रशिक्षित किया जा सके। प्रदर्शन को और बेहतर बनाने के लिए वांछित आउटपुट प्राप्त करने के लिए एक प्रक्रिया में "ठीक" समायोजन करने पर फ़ाइन-ट्यूनिंग बनाया गया है। फ़ाइन-ट्यूनिंग के दौरान एक प्रशिक्षित मॉडल के मापदंडों को समायोजित और सटीक और विशेष रूप से सिलवाया जाता है, जबकि वांछित आउटपुट प्राप्त करने के लिए मॉडल को मान्य करने का प्रयास किया जाता है।

ट्रांसफर लर्निंग का उपयोग क्यों करें?

ट्रांसफर लर्निंग का उपयोग करने के कारण:

बहुत अधिक डेटा की आवश्यकता नहीं है - इसकी उपलब्धता में कमी के कारण डेटा तक पहुंच प्राप्त करना हमेशा एक बाधा है। अपर्याप्त मात्रा में डेटा के साथ काम करने के परिणामस्वरूप कम प्रदर्शन हो सकता है। यह वह जगह है जहां ट्रांसफर लर्निंग चमकता है क्योंकि मशीन लर्निंग मॉडल को छोटे प्रशिक्षण डेटासेट के साथ बनाया जा सकता है, क्योंकि यह पूर्व-प्रशिक्षित है।

प्रशिक्षण समय की बचत - मशीन लर्निंग मॉडल को प्रशिक्षित करना मुश्किल है और इसमें बहुत समय लग सकता है, जिससे अक्षमता हो सकती है। एक जटिल कार्य पर खरोंच से गहरे तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए लंबे समय की आवश्यकता होती है, इसलिए पूर्व-प्रशिक्षित मॉडल का उपयोग करने से एक नया निर्माण करने में समय की बचत होती है।

सीखने के पेशेवरों को स्थानांतरित करें

बेहतर आधार: ट्रांसफर लर्निंग में एक पूर्व-प्रशिक्षित मॉडल का उपयोग करना आपको एक बेहतर आधार और शुरुआती बिंदु प्रदान करता है, जिससे आप बिना प्रशिक्षण के भी कुछ कार्य कर सकते हैं।

उच्च सीखने की दर: मॉडल को पहले से ही इसी तरह के कार्य पर प्रशिक्षित होने के कारण, मॉडल की सीखने की दर अधिक होती है।

उच्च सटीकता दर: बेहतर आधार और उच्च सीखने की दर के साथ, मॉडल उच्च प्रदर्शन पर काम करता है, और अधिक सटीकता आउटपुट उत्पन्न करता है।

ट्रांसफर लर्निंग कब करता है नहीं काम?

जब आपके स्रोत कार्य से प्रशिक्षित भार आपके लक्षित कार्य से भिन्न हों, तो स्थानांतरण सीखने से बचना चाहिए। उदाहरण के लिए, यदि आपका पिछला नेटवर्क बिल्लियों और कुत्तों को वर्गीकृत करने के लिए प्रशिक्षित किया गया था और आपका नया नेटवर्क जूते और मोजे का पता लगाने की कोशिश कर रहा है, तो एक समस्या होने वाली है क्योंकि आपके स्रोत से लक्ष्य कार्य में स्थानांतरित वजन नहीं दे पाएगा आप सबसे अच्छे परिणाम हैं। इसलिए, पूर्व-प्रशिक्षित वज़न के साथ नेटवर्क को प्रारंभ करना जो आपके द्वारा अपेक्षित समान आउटपुट के अनुरूप है, बिना किसी सहसंबंध के वज़न का उपयोग करने से बेहतर है।

पूर्व-प्रशिक्षित मॉडल से परतों को हटाने से मॉडल की वास्तुकला के साथ समस्याएँ पैदा होंगी। यदि आप पहली परतों को हटाते हैं, तो आपके मॉडल की सीखने की दर कम होगी क्योंकि उसे निम्न-स्तरीय सुविधाओं के साथ काम करना होगा। परतों को हटाने से प्रशिक्षित किए जा सकने वाले मापदंडों की संख्या कम हो जाती है, जिसके परिणामस्वरूप ओवरफिटिंग हो सकती है। ओवरफिटिंग को कम करने के लिए परतों की सही मात्रा का उपयोग करने में सक्षम होना महत्वपूर्ण है, हालांकि, यह भी एक समयबद्ध प्रक्रिया है।

स्थानांतरण सीखना विपक्ष

नकारात्मक स्थानांतरण सीखना: जैसा कि मैंने ऊपर उल्लेख किया है, नकारात्मक स्थानांतरण सीखना तब होता है जब पिछली सीखने की विधि नए कार्य में बाधा डालती है। यह केवल तभी होता है जब स्रोत और लक्ष्य पर्याप्त रूप से समान नहीं होते हैं, जिससे प्रशिक्षण का पहला दौर बहुत दूर हो जाता है। एल्गोरिदम को हमेशा उसी के साथ सहमत होने की ज़रूरत नहीं है जिसे हम समान मानते हैं, जिससे बुनियादी बातों और मानकों को समझना मुश्किल हो जाता है कि किस प्रकार का प्रशिक्षण पर्याप्त है।

6 चरणों में स्थानांतरण सीखना

आइए इस बात को बेहतर ढंग से समझें कि ट्रांसफर लर्निंग को कैसे लागू किया जाता है और क्या कदम उठाए जाते हैं। ट्रांसफर लर्निंग में 6 सामान्य कदम उठाए गए हैं और हम उनमें से प्रत्येक के बारे में जानेंगे।

स्रोत कार्य का चयन करें: पहला कदम एक पूर्व-प्रशिक्षित मॉडल का चयन करना है जिसमें आपके चुने हुए लक्ष्य कार्य के साथ इनपुट और आउटपुट डेटा के बीच संबंध रखने वाले डेटा की एक बहुतायत है।
बेस मॉडल बनाएं: पूर्व-प्रशिक्षित वजन के साथ बेस मॉडल को इंस्टेंट करें। पूर्व-प्रशिक्षित वज़न को एक्ससेप्शन जैसे आर्किटेक्चर के माध्यम से एक्सेस किया जा सकता है। यह आपके स्रोत मॉडल को विकसित कर रहा है, ताकि यह सीखने की दर में कुछ वृद्धि सुनिश्चित करते हुए, हमारे द्वारा शुरू किए गए भोले मॉडल से बेहतर हो।
फ्रीज परतें: वजन को फिर से शुरू करने को कम करने के लिए, पूर्व-प्रशिक्षित मॉडल से परतों को फ्रीज करना आवश्यक है। यह पहले से सीखे गए ज्ञान को भुनाएगा और आपको मॉडल को खरोंच से प्रशिक्षित करने से बचाएगा।

base_model.trainable = गलत

नई ट्रेन करने योग्य परतें जोड़ें: जमे हुए परत के शीर्ष पर नई प्रशिक्षित परतें जोड़ने से, पुरानी सुविधाओं को नए डेटासेट पर पूर्वानुमानों में बदल दिया जाएगा।
नई परतों को प्रशिक्षित करें: पूर्व-प्रशिक्षित मॉडल में पहले से ही अंतिम आउटपुट परत होती है। संभावना है कि पूर्व-प्रशिक्षित मॉडल पर वर्तमान आउटपुट और आपके मॉडल से आप जो आउटपुट चाहते हैं, वह अलग होगा, उच्च है। इसलिए, आपको मॉडल को एक नई आउटपुट परत के साथ प्रशिक्षित करना होगा। इसलिए, आपके अपेक्षित मॉडल के अनुरूप नई सघन परतें और अंतिम सघन परत जोड़ने से, सीखने की दर में सुधार होगा और आपकी इच्छा के आउटपुट का उत्पादन होगा।
फ़ाइन-ट्यूनिंग: आप फ़ाइन-ट्यूनिंग द्वारा अपने मॉडल के प्रदर्शन में सुधार कर सकते हैं, जो सभी या बेस मॉडल के कुछ हिस्सों को अनफ़्रीज़ करके और फिर बहुत कम सीखने की दर के साथ मॉडल को फिर से प्रशिक्षित करके किया जाता है। इस स्तर पर कम सीखने की दर का उपयोग करना महत्वपूर्ण है, क्योंकि आप जिस मॉडल का प्रशिक्षण ले रहे हैं, वह पहले दौर की तुलना में बहुत बड़ा है, साथ ही यह एक छोटा डेटासेट भी है। नतीजतन, यदि आप बड़े वजन अपडेट लागू करते हैं, तो आपको ओवरफिटिंग का खतरा होता है, इसलिए आप वृद्धिशील तरीके से फाइन-ट्यून करना चाहते हैं। मॉडल को फिर से संकलित करें क्योंकि आपने मॉडल के व्यवहार को बदल दिया है और फिर किसी भी ओवरफिटिंग फीडबैक की निगरानी करते हुए मॉडल को फिर से प्रशिक्षित करें।

मुझे उम्मीद है कि इस लेख ने आपको ट्रांसफर लर्निंग का अच्छा परिचय और समझ प्रदान की है। देखते रहिए, मेरा अगला लेख इमेज रिकॉग्निशन और नेचुरल लैंग्वेज प्रोसेसिंग के लिए ट्रांसफर लर्निंग को लागू करना होगा।

निशा आर्य एक डेटा वैज्ञानिक और स्वतंत्र तकनीकी लेखक हैं। वह विशेष रूप से डेटा साइंस करियर सलाह या ट्यूटोरियल और डेटा साइंस के आसपास सिद्धांत आधारित ज्ञान प्रदान करने में रुचि रखती है। वह उन विभिन्न तरीकों का भी पता लगाना चाहती है, जो आर्टिफिशियल इंटेलिजेंस मानव जीवन की लंबी उम्र का लाभ उठा सकते हैं। एक उत्सुक शिक्षार्थी, दूसरों को मार्गदर्शन करने में मदद करते हुए, अपने तकनीकी ज्ञान और लेखन कौशल को व्यापक बनाने की कोशिश कर रही है।

स्रोत: https://www.kdnuggets.com/2022/01/transfer-learning.html

समय टिकट: जनवरी ७,२०२१

समय टिकट: सितम्बर 7, 2023

प्लेटो द्वारा पुनर्प्रकाशित

2023 की पहली छमाही: डेटा विज्ञान और एआई विकास - केडीनगेट्स

SQL के निष्पादन आदेश के लिए आवश्यक मार्गदर्शिका - KDnuggets

घरेलू बड़े भाषा मॉडल का मामला - केडीनगेट्स

जेनरेटिव एआई प्लेग्राउंड: कैमल-5बी के साथ एलएलएम और नवीनतम इंटेल® जीपीयू पर ओपन एलएलएएमए 3बी - केडीनगेट्स

शीर्ष पोस्ट 16-22 जनवरी: चैटजीपीटी एक पायथन प्रोग्रामिंग सहायक के रूप में

इस GitHub रिपॉजिटरी - KDnuggets के साथ कमांड लाइन की कला में महारत हासिल करें

लामा और चैटजीपीटी का उपयोग करके मल्टी-चैट बैकएंड के लिए माइक्रोसर्विस का निर्माण - केडीनगेट्स

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा