জিরো-শট লার্নিং, ব্যাখ্যা করা হয়েছে

জিরো-শট লার্নিং, ব্যাখ্যা করা হয়েছে

উত্স নোড: 1776319

জিরো-শট লার্নিং, ব্যাখ্যা করা হয়েছে
ব্রুস ওয়ারিংটন আনস্প্ল্যাশ মাধ্যমে
 

সাধারণভাবে মেশিন লার্নিং মডেলগুলি কেন স্মার্ট হয়ে উঠছে তার কারণ হল দুটি অনুরূপ বস্তুর মধ্যে পার্থক্য করতে সাহায্য করার জন্য লেবেলযুক্ত ডেটা ব্যবহার করার উপর তাদের নির্ভরতা। 

যাইহোক, এই লেবেলযুক্ত ডেটাসেটগুলি ছাড়া, সবচেয়ে কার্যকর এবং বিশ্বস্ত মেশিন-লার্নিং মডেল তৈরি করার সময় আপনি প্রধান বাধাগুলির সম্মুখীন হবেন৷ একটি মডেলের প্রশিক্ষণ পর্বের সময় লেবেলযুক্ত ডেটাসেটগুলি গুরুত্বপূর্ণ। 

তত্ত্বাবধানে শেখার ব্যবহার করে কম্পিউটার ভিশনের মতো কাজগুলি সমাধান করতে গভীর শিক্ষা ব্যাপকভাবে ব্যবহৃত হয়েছে। যাইহোক, জীবনের অনেক কিছুর মতো এটি সীমাবদ্ধতার সাথে আসে। তত্ত্বাবধানে শ্রেণীবিভাগের জন্য একটি শক্তিশালী মডেল তৈরি করার জন্য লেবেলযুক্ত প্রশিক্ষণ ডেটার উচ্চ পরিমাণ এবং গুণমানের প্রয়োজন। এর মানে হল যে শ্রেণীবদ্ধ মডেলটি অদেখা ক্লাসগুলি পরিচালনা করতে পারে না। 

এবং আমরা সকলেই জানি যে একটি গভীর শিক্ষার মডেলকে প্রশিক্ষণ দিতে কত গণনা শক্তি, পুনরায় প্রশিক্ষণ, সময় এবং অর্থ লাগে।

কিন্তু একটি মডেল কি এখনও প্রশিক্ষণ ডেটা ব্যবহার না করে দুটি বস্তুর মধ্যে পার্থক্য করতে সক্ষম হতে পারে? হ্যাঁ, এটাকে বলা হয় জিরো-শট লার্নিং। জিরো-শট লার্নিং হল একটি মডেলের ক্ষমতা যা কোনো প্রশিক্ষণের উদাহরণ গ্রহণ বা ব্যবহার না করেই একটি টাস্ক সম্পূর্ণ করতে সক্ষম হয়। 

মানুষ খুব বেশি পরিশ্রম না করেই স্বাভাবিকভাবেই জিরো-শট লার্নিং করতে সক্ষম। আমাদের মস্তিষ্ক ইতিমধ্যে অভিধান সংরক্ষণ করে এবং আমাদের বর্তমান জ্ঞানের ভিত্তির কারণে বস্তুর ভৌত বৈশিষ্ট্যগুলি দেখে আমাদেরকে আলাদা করতে দেয়। আমরা বস্তুর মধ্যে মিল এবং পার্থক্য দেখতে এবং তাদের মধ্যে লিঙ্ক খুঁজে পেতে এই জ্ঞান ভিত্তি ব্যবহার করতে পারেন.

উদাহরণস্বরূপ, ধরা যাক আমরা প্রাণী প্রজাতির উপর একটি শ্রেণিবিন্যাস মডেল তৈরি করার চেষ্টা করছি। অনুসারে OurWorldInData2.13 সালে 2021 মিলিয়ন প্রজাতি গণনা করা হয়েছিল। তাই, আমরা যদি প্রাণী প্রজাতির জন্য সবচেয়ে কার্যকর শ্রেণীবিভাগ মডেল তৈরি করতে চাই, আমাদের 2.13 মিলিয়ন বিভিন্ন শ্রেণীর প্রয়োজন হবে। এছাড়াও প্রচুর ডেটার প্রয়োজন হবে। উচ্চ পরিমাণ এবং গুণমান ডেটা জুড়ে আসা কঠিন.

তাহলে কিভাবে জিরো-শট লার্নিং এই সমস্যার সমাধান করে?

যেহেতু জিরো-শট লার্নিংয়ের জন্য মডেলের প্রশিক্ষণের ডেটা এবং কীভাবে ক্লাসগুলিকে শ্রেণীবদ্ধ করতে হয় তা শেখার প্রয়োজন হয় না, এটি আমাদের লেবেলযুক্ত ডেটার জন্য মডেলের প্রয়োজনীয়তার উপর কম নির্ভর করতে দেয়। 

শূন্য-শট শেখার সাথে এগিয়ে যাওয়ার জন্য আপনার ডেটাতে যা থাকতে হবে তা নিম্নরূপ।

ক্লাস দেখেছি

এটি ডেটা ক্লাস নিয়ে গঠিত যা পূর্বে একটি মডেলকে প্রশিক্ষণের জন্য ব্যবহার করা হয়েছে। 

অদেখা ক্লাস

এটি এমন ডেটা ক্লাস নিয়ে গঠিত যা একটি মডেলকে প্রশিক্ষণের জন্য ব্যবহার করা হয়নি এবং নতুন শূন্য-শট শেখার মডেলটি সাধারণীকরণ করবে। 

সহায়ক তথ্য

যেহেতু অদেখা ক্লাসের ডেটা লেবেলযুক্ত নয়, শূন্য-শট লার্নিং শিখতে এবং পারস্পরিক সম্পর্ক, লিঙ্ক এবং বৈশিষ্ট্যগুলি খুঁজে পেতে সহায়ক তথ্যের প্রয়োজন হবে। এটি শব্দ এম্বেডিং, বর্ণনা এবং শব্দার্থিক তথ্যের আকারে হতে পারে।

জিরো-শট শেখার পদ্ধতি

জিরো-শট লার্নিং সাধারণত ব্যবহৃত হয়:

  • ক্লাসিফায়ার-ভিত্তিক পদ্ধতি
  • উদাহরণ ভিত্তিক পদ্ধতি

ধাপসমূহ

জিরো-শট লার্নিং এমন ক্লাসের জন্য মডেল তৈরি করতে ব্যবহৃত হয় যেগুলি লেবেলযুক্ত ডেটা ব্যবহার করে প্রশিক্ষণ দেয় না, তাই এই দুটি পর্যায়ের প্রয়োজন:

1। প্রশিক্ষণ

প্রশিক্ষণ পর্যায় হল শেখার পদ্ধতির প্রক্রিয়া যা ডেটার গুণাবলী সম্পর্কে যতটা সম্ভব জ্ঞান অর্জন করার চেষ্টা করে। এটাকে আমরা শেখার পর্যায় হিসেবে দেখতে পারি। 

2. অনুমান

অনুমান পর্যায়ে, প্রশিক্ষণের পর্যায় থেকে সমস্ত শেখা জ্ঞান প্রয়োগ করা হয় এবং উদাহরণগুলিকে একটি নতুন সেটে শ্রেণীবদ্ধ করার জন্য ব্যবহার করা হয়। আমরা এটিকে ভবিষ্যদ্বাণী করার পর্যায় হিসাবে দেখতে পারি। 

এটা কিভাবে কাজ করে?

দেখা ক্লাস থেকে জ্ঞান একটি উচ্চ-মাত্রিক ভেক্টর স্পেসে অদেখা ক্লাসে স্থানান্তরিত হবে; একে বলা হয় শব্দার্থিক স্থান। উদাহরণস্বরূপ, চিত্র শ্রেণীবিভাগে চিত্রের সাথে শব্দার্থিক স্থান দুটি ধাপ অতিক্রম করবে:

1. জয়েন্ট এমবেডিং স্পেস

এখানেই শব্দার্থিক ভেক্টর এবং ভিজ্যুয়াল বৈশিষ্ট্যের ভেক্টরগুলিকে অভিক্ষিপ্ত করা হয়েছে। 

2. সর্বোচ্চ মিল

এখানেই বৈশিষ্ট্যগুলি একটি অদেখা শ্রেণীর সাথে মিলে যায়৷ 

দুটি ধাপ (প্রশিক্ষণ এবং অনুমান) সহ প্রক্রিয়াটি বুঝতে সাহায্য করার জন্য, আসুন চিত্র শ্রেণিবিন্যাসের ব্যবহারে সেগুলি প্রয়োগ করি।

প্রশিক্ষণ

জিরো-শট লার্নিং, ব্যাখ্যা করা হয়েছে
জারি হাইটনেন আনস্প্ল্যাশ মাধ্যমে
 

একজন মানুষ হিসাবে, আপনি যদি উপরের চিত্রের ডানদিকে লেখাটি পড়েন, আপনি অবিলম্বে অনুমান করবেন যে একটি বাদামী ঝুড়িতে 4টি বিড়ালছানা রয়েছে। তবে ধরা যাক যে আপনি 'বিড়ালছানা' কী তা জানেন না। আপনি অনুমান করবেন যে একটি বাদামী ঝুড়ি আছে যার ভিতরে 4 টি জিনিস রয়েছে, যাকে 'বিড়ালছানা' বলা হয়। একবার আপনি 'বিড়ালছানা'-এর মতো দেখতে এমন কিছু ধারণ করে এমন আরও চিত্র দেখতে পেলে, আপনি অন্য প্রাণীদের থেকে 'বিড়ালছানা'কে আলাদা করতে সক্ষম হবেন। 

আপনি যখন ব্যবহার করেন তখন এটি হয় বিপরীত ভাষা-ইমেজ প্রিট্রেনিং (CLIP) OpenAI দ্বারা ইমেজ শ্রেণীবিভাগে শূন্য-শট শিক্ষার জন্য। এটি সহায়ক তথ্য হিসাবে পরিচিত। 

আপনি হয়তো ভাবছেন, 'ঠিক আছে এটা শুধু লেবেল করা ডেটা'। আমি বুঝতে পারি আপনি কেন এটি মনে করবেন, কিন্তু তারা তা নয়। সহায়ক তথ্যগুলি ডেটার লেবেল নয়, এগুলি প্রশিক্ষণের পর্যায়ে মডেলকে শিখতে সাহায্য করার জন্য তত্ত্বাবধানের একটি রূপ।

যখন একটি শূন্য-শট শেখার মডেল পর্যাপ্ত পরিমাণে ইমেজ-টেক্সট পেয়ারিং দেখতে পায়, তখন এটি বাক্যাংশগুলিকে আলাদা করতে এবং বুঝতে সক্ষম হবে এবং কীভাবে তারা চিত্রগুলির নির্দিষ্ট প্যাটার্নের সাথে সম্পর্কযুক্ত। CLIP টেকনিক 'কন্ট্রাস্টিভ লার্নিং' ব্যবহার করে, জিরো-শট লার্নিং মডেলটি শ্রেণীবিভাগের কাজ সম্পর্কে ভবিষ্যদ্বাণী করতে সক্ষম হওয়ার জন্য একটি ভাল জ্ঞানের ভিত্তি সংগ্রহ করতে সক্ষম হয়েছে। 

এটি CLIP পদ্ধতির একটি সারসংক্ষেপ যেখানে তারা একটি ইমেজ এনকোডার এবং একটি টেক্সট এনকোডারকে একসাথে প্রশিক্ষণ দেয় যাতে (চিত্র, পাঠ্য) প্রশিক্ষণ উদাহরণগুলির একটি ব্যাচের সঠিক জোড়ার পূর্বাভাস দেওয়া যায়। অনুগ্রহ করে নীচের ছবিটি দেখুন:

 

জিরো-শট লার্নিং, ব্যাখ্যা করা হয়েছে
প্রাকৃতিক ভাষা তত্ত্বাবধান থেকে স্থানান্তরযোগ্য ভিজ্যুয়াল মডেল শেখা

অনুমিতি

মডেলটি একবার প্রশিক্ষণের পর্যায়ে চলে গেলে, এটির ইমেজ-টেক্সট পেয়ারিংয়ের একটি ভাল জ্ঞানের ভিত্তি রয়েছে এবং এখন ভবিষ্যদ্বাণী করতে ব্যবহার করা যেতে পারে। কিন্তু আমরা সঠিকভাবে ভবিষ্যদ্বাণী করার আগে, মডেলটি আউটপুট করতে পারে এমন সমস্ত সম্ভাব্য লেবেলের একটি তালিকা তৈরি করে শ্রেণীবিভাগের কাজটি সেট আপ করতে হবে। 

উদাহরণস্বরূপ, প্রাণীর প্রজাতির চিত্র শ্রেণীবিভাগের কাজটির সাথে লেগে থাকা, আমাদের সমস্ত প্রজাতির প্রাণীর একটি তালিকা প্রয়োজন হবে। এই লেবেলগুলির প্রতিটি এনকোড করা হবে, টি? টি? প্রশিক্ষণ পর্যায়ে ঘটে যাওয়া পূর্বপ্রশিক্ষিত পাঠ্য এনকোডার ব্যবহার করে। 

একবার লেবেল এনকোড করা হয়ে গেলে, আমরা প্রাক-প্রশিক্ষিত ইমেজ এনকোডারের মাধ্যমে ছবি ইনপুট করতে পারি। আমরা ইমেজ এনকোডিং এবং প্রতিটি টেক্সট লেবেল এনকোডিংয়ের মধ্যে মিল গণনা করতে দূরত্ব মেট্রিক কোসাইন সাদৃশ্য ব্যবহার করব।

চিত্রের শ্রেণীবিভাগটি চিত্রের সাথে সর্বাধিক মিল সহ লেবেলের উপর ভিত্তি করে করা হয়। এবং এভাবেই জিরো-শট লার্নিং অর্জন করা হয়, বিশেষ করে ইমেজ শ্রেণীবিভাগে। 

ডেটার অভাব

যেমন আগে উল্লেখ করা হয়েছে, উচ্চ পরিমাণ এবং গুণমান ডেটা আপনার হাতে পাওয়া কঠিন। মানুষের বিপরীতে যারা ইতিমধ্যেই শূন্য-শট শেখার ক্ষমতার অধিকারী, মেশিনগুলিকে শেখার জন্য ইনপুট লেবেলযুক্ত ডেটার প্রয়োজন হয় এবং তারপরে প্রাকৃতিকভাবে ঘটতে পারে এমন ভিন্নতার সাথে খাপ খাইয়ে নিতে সক্ষম হয়। 

আমরা যদি প্রাণী প্রজাতির উদাহরণ দেখি, সেখানে অনেকগুলি ছিল। এবং বিভিন্ন ডোমেনে বিভাগের সংখ্যা ক্রমাগত বাড়তে থাকায় টীকাযুক্ত ডেটা সংগ্রহের সাথে তাল মিলিয়ে চলতে অনেক কাজ করতে হবে।

এই কারণে, জিরো-শট লার্নিং আমাদের কাছে আরও মূল্যবান হয়ে উঠেছে। আরও বেশি সংখ্যক গবেষকরা উপলব্ধ ডেটার অভাব পূরণ করতে স্বয়ংক্রিয় বৈশিষ্ট্য স্বীকৃতিতে আগ্রহী। 

ডেটা লেবেলিং

জিরো-শট শেখার আরেকটি সুবিধা হল এর ডেটা লেবেলিং বৈশিষ্ট্য। ডেটা লেবেলিং শ্রম-নিবিড় এবং খুব ক্লান্তিকর হতে পারে এবং এর কারণে, এটি প্রক্রিয়া চলাকালীন ত্রুটির কারণ হতে পারে। ডেটা লেবেলিংয়ের জন্য বিশেষজ্ঞদের প্রয়োজন, যেমন চিকিৎসা পেশাদার যারা বায়োমেডিকাল ডেটাসেটে কাজ করছেন, যা অত্যন্ত ব্যয়বহুল এবং সময়সাপেক্ষ। 

ডেটার উপরোক্ত সীমাবদ্ধতার কারণে জিরো-শট লার্নিং আরও জনপ্রিয় হয়ে উঠছে। আপনি যদি এর ক্ষমতার প্রতি আগ্রহী হন তবে আমি আপনাকে পড়ার সুপারিশ করব কয়েকটি কাগজ রয়েছে:

 
 
নিশা আর্য একজন ডেটা সায়েন্টিস্ট এবং ফ্রিল্যান্স টেকনিক্যাল রাইটার। তিনি বিশেষ করে ডেটা সায়েন্স ক্যারিয়ার পরামর্শ বা টিউটোরিয়াল এবং ডেটা সায়েন্সের আশেপাশে তত্ত্ব ভিত্তিক জ্ঞান প্রদানে আগ্রহী। তিনি কৃত্রিম বুদ্ধিমত্তা মানব জীবনের দীর্ঘায়ু লাভ করতে পারে এমন বিভিন্ন উপায় অন্বেষণ করতে চান। একজন প্রখর শিক্ষার্থী, তার প্রযুক্তি জ্ঞান এবং লেখার দক্ষতা প্রসারিত করতে চাচ্ছে, অন্যদের গাইড করতে সাহায্য করার সময়।
 

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস

শীর্ষ খবর, অগাস্ট 30 - সেপ্টেম্বর 5: আপনি কি পাইথনের সাথে এক্সেল ফাইলগুলি পড়েন? একটি 1000x দ্রুত উপায় আছে; হাইপোথিসিস টেস্টিং ব্যাখ্যা করা হয়েছে

উত্স নোড: 1866146
সময় স্ট্যাম্প: সেপ্টেম্বর 6, 2021