زیرو شاٹ لرننگ، وضاحت کی گئی۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

زیرو شاٹ لرننگ، وضاحت کی گئی۔
بروس وارنگٹن Unsplash کے ذریعے

عام طور پر مشین لرننگ کے ماڈلز کیوں ہوشیار ہوتے جا رہے ہیں اس کی وجہ لیبل لگا ڈیٹا استعمال کرنے پر انحصار کرنا ہے تاکہ انہیں دو ملتے جلتے اشیاء کے درمیان تفریق کرنے میں مدد ملے۔

تاہم، ان لیبل والے ڈیٹاسیٹس کے بغیر، آپ کو مشین لرننگ کا سب سے موثر اور قابل اعتماد ماڈل بناتے وقت بڑی رکاوٹوں کا سامنا کرنا پڑے گا۔ ایک ماڈل کے تربیتی مرحلے کے دوران لیبل لگا ڈیٹاسیٹس اہم ہیں۔

نگرانی شدہ سیکھنے کا استعمال کرتے ہوئے کمپیوٹر وژن جیسے کاموں کو حل کرنے کے لیے گہری سیکھنے کا وسیع پیمانے پر استعمال کیا گیا ہے۔ تاہم، زندگی میں بہت سی چیزوں کی طرح، یہ پابندیوں کے ساتھ آتا ہے۔ ایک مضبوط ماڈل تیار کرنے کے لیے زیر نگرانی درجہ بندی کے لیے لیبل لگائے گئے تربیتی ڈیٹا کی اعلیٰ مقدار اور معیار کی ضرورت ہوتی ہے۔ اس کا مطلب ہے کہ درجہ بندی کرنے والا ماڈل ان دیکھی کلاسوں کو نہیں سنبھال سکتا۔

اور ہم سب جانتے ہیں کہ گہرے سیکھنے کے ماڈل کو تربیت دینے میں کتنی کمپیوٹیشنل طاقت، دوبارہ تربیت، وقت اور پیسہ لگتا ہے۔

لیکن کیا کوئی ماڈل اب بھی تربیتی ڈیٹا استعمال کیے بغیر دو چیزوں کے درمیان فرق کر سکتا ہے؟ ہاں، اسے زیرو شاٹ لرننگ کہتے ہیں۔ زیرو شاٹ لرننگ ایک ماڈل کی قابلیت ہے کہ وہ کسی بھی تربیتی مثال کو حاصل یا استعمال کیے بغیر کسی کام کو مکمل کرنے کے قابل ہو۔

انسان فطری طور پر بہت زیادہ محنت کیے بغیر زیرو شاٹ لرننگ کرنے کی صلاحیت رکھتا ہے۔ ہمارا دماغ پہلے سے ہی لغات کو ذخیرہ کرتا ہے اور ہمارے موجودہ علم کی بنیاد کی وجہ سے ہمیں اشیاء کی جسمانی خصوصیات کو دیکھ کر ان میں فرق کرنے کی اجازت دیتا ہے۔ ہم اس علمی بنیاد کا استعمال اشیاء کے درمیان مماثلت اور فرق کو دیکھنے اور ان کے درمیان ربط تلاش کرنے کے لیے کر سکتے ہیں۔

مثال کے طور پر، ہم کہتے ہیں کہ ہم جانوروں کی انواع پر درجہ بندی کا ماڈل بنانے کی کوشش کر رہے ہیں۔ کے مطابق ہمارے ورلڈ ان ڈیٹا، 2.13 میں 2021 ملین پرجاتیوں کا حساب لگایا گیا تھا۔ لہذا، اگر ہم جانوروں کی انواع کے لیے سب سے مؤثر درجہ بندی کا ماڈل بنانا چاہتے ہیں، تو ہمیں 2.13 ملین مختلف طبقات کی ضرورت ہوگی۔ اس کے علاوہ بہت سارے ڈیٹا کی ضرورت ہوگی۔ اعلیٰ مقدار اور کوالٹی ڈیٹا کا ملنا مشکل ہے۔

تو زیرو شاٹ لرننگ اس مسئلے کو کیسے حل کرتی ہے؟

چونکہ زیرو شاٹ لرننگ کے لیے ماڈل کو تربیتی ڈیٹا اور کلاسوں کی درجہ بندی کرنے کا طریقہ سیکھنے کی ضرورت نہیں ہوتی، یہ ہمیں لیبل والے ڈیٹا کے لیے ماڈل کی ضرورت پر کم انحصار کرنے کی اجازت دیتا ہے۔

زیرو شاٹ لرننگ کے ساتھ آگے بڑھنے کے لیے آپ کے ڈیٹا میں مندرجہ ذیل چیزوں کی ضرورت ہوگی۔

کلاسز دیکھے۔

یہ ڈیٹا کلاسز پر مشتمل ہے جو پہلے ماڈل کو تربیت دینے کے لیے استعمال ہوتی رہی ہیں۔

اندیکھی کلاسز

یہ ڈیٹا کلاسز پر مشتمل ہے جو کسی ماڈل کو تربیت دینے کے لیے استعمال نہیں کی گئی ہیں اور نیا زیرو شاٹ لرننگ ماڈل کو عام کیا جائے گا۔

معاون معلومات

چونکہ غیب کلاسوں کے ڈیٹا پر لیبل نہیں لگایا گیا ہے، اس لیے صفر شاٹ لرننگ کو سیکھنے، اور ارتباط، روابط اور خصوصیات تلاش کرنے کے لیے معاون معلومات کی ضرورت ہوگی۔ یہ لفظ سرایت، وضاحت، اور معنوی معلومات کی شکل میں ہو سکتا ہے۔

زیرو شاٹ سیکھنے کے طریقے

زیرو شاٹ لرننگ عام طور پر اس میں استعمال ہوتی ہے:

درجہ بندی پر مبنی طریقے
مثال پر مبنی طریقے

انٹرنشپ

زیرو شاٹ لرننگ کا استعمال ان کلاسوں کے لیے ماڈل بنانے کے لیے کیا جاتا ہے جو لیبل والے ڈیٹا کا استعمال کرتے ہوئے تربیت نہیں دیتے، اس لیے اس کے لیے ان دو مراحل کی ضرورت ہوتی ہے:

1. تربیت

تربیت کا مرحلہ سیکھنے کے طریقہ کار کا عمل ہے جس میں ڈیٹا کی خصوصیات کے بارے میں زیادہ سے زیادہ معلومات حاصل کرنے کی کوشش کی جاتی ہے۔ ہم اسے سیکھنے کے مرحلے کے طور پر دیکھ سکتے ہیں۔

2. اندازہ

تخمینہ کے مرحلے کے دوران، تربیتی مرحلے سے سیکھے گئے تمام علم کا اطلاق کیا جاتا ہے اور مثالوں کو کلاسوں کے ایک نئے سیٹ میں درجہ بندی کرنے کے لیے استعمال کیا جاتا ہے۔ ہم اسے پیشین گوئی کے مرحلے کے طور پر دیکھ سکتے ہیں۔

یہ کس طرح کام کرتا ہے؟

دیکھی گئی کلاسوں سے علم کو ایک اعلیٰ جہتی ویکٹر اسپیس میں غیب کلاسوں میں منتقل کیا جائے گا۔ اسے سیمنٹک اسپیس کہتے ہیں۔ مثال کے طور پر، تصویر کی درجہ بندی میں تصویر کے ساتھ معنوی جگہ دو مراحل سے گزرے گی:

1. مشترکہ سرایت کرنے کی جگہ

یہ وہ جگہ ہے جہاں سیمنٹک ویکٹر اور بصری خصوصیت کے ویکٹر کو پیش کیا جاتا ہے۔

2. سب سے زیادہ مماثلت

یہ وہ جگہ ہے جہاں خصوصیات ایک غیر دیکھے ہوئے طبقے کے مقابلے میں ملتی ہیں۔

دو مراحل (تربیت اور تخمینہ) کے ساتھ عمل کو سمجھنے میں مدد کے لیے، آئیے تصویر کی درجہ بندی کے استعمال میں ان کا اطلاق کرتے ہیں۔

ٹریننگ

زیرو شاٹ لرننگ، وضاحت کی گئی۔
Jari Hytönen Unsplash کے ذریعے

ایک انسان کے طور پر، اگر آپ اوپر دی گئی تصویر میں دائیں طرف کا متن پڑھتے ہیں، تو آپ فوری طور پر فرض کر لیں گے کہ ایک بھوری ٹوکری میں 4 بلی کے بچے ہیں۔ لیکن ہم کہتے ہیں کہ آپ کو اندازہ نہیں ہے کہ 'بلی کا بچہ' کیا ہے۔ آپ فرض کریں گے کہ ایک بھوری رنگ کی ٹوکری ہے جس کے اندر 4 چیزیں ہیں، جنہیں 'بلی کے بچے' کہتے ہیں۔ ایک بار جب آپ کو مزید تصاویر مل جائیں جن میں 'بلی کے بچے' کی طرح نظر آنے والی کوئی چیز ہوتی ہے، تو آپ 'بلی کے بچے' کو دوسرے جانوروں سے ممتاز کر سکیں گے۔

جب آپ استعمال کرتے ہیں تو ایسا ہوتا ہے۔ متضاد زبان کی تصویری تربیت تصویر کی درجہ بندی میں زیرو شاٹ لرننگ کے لیے OpenAI کے ذریعے (CLIP)۔ اسے معاون معلومات کے نام سے جانا جاتا ہے۔

آپ سوچ رہے ہوں گے، 'اچھا یہ صرف ڈیٹا کا لیبل لگا ہوا ہے'۔ میں سمجھتا ہوں کہ آپ ایسا کیوں سوچیں گے، لیکن وہ نہیں ہیں۔ معاون معلومات ڈیٹا کے لیبل نہیں ہیں، یہ تربیت کے مرحلے کے دوران ماڈل کو سیکھنے میں مدد کرنے کے لیے نگرانی کی ایک شکل ہیں۔

جب زیرو شاٹ لرننگ ماڈل کافی مقدار میں امیج ٹیکسٹ پیئرنگ کو دیکھتا ہے، تو یہ جملے کو فرق کرنے اور سمجھنے کے قابل ہو جائے گا اور یہ کہ وہ تصویروں کے مخصوص نمونوں کے ساتھ کیسے تعلق رکھتے ہیں۔ CLIP تکنیک 'متضاد لرننگ' کا استعمال کرتے ہوئے، زیرو شاٹ لرننگ ماڈل درجہ بندی کے کاموں کے بارے میں پیشین گوئیاں کرنے کے قابل ہونے کے لیے ایک اچھا علمی بنیاد جمع کرنے میں کامیاب رہا ہے۔

یہ CLIP اپروچ کا خلاصہ ہے جہاں وہ ایک تصویری انکوڈر اور ایک ٹیکسٹ انکوڈر کو ایک ساتھ تربیت دیتے ہیں تاکہ (تصویر، متن) تربیتی مثالوں کے بیچ کی صحیح جوڑی کی پیشن گوئی کی جا سکے۔ براہ کرم ذیل کی تصویر دیکھیں:

زیرو شاٹ لرننگ، وضاحت کی گئی۔
قدرتی زبان کی نگرانی سے قابل منتقلی بصری ماڈل سیکھنا

ارادہ

ایک بار جب ماڈل تربیتی مرحلے سے گزر جاتا ہے، تو اس کے پاس امیج ٹیکسٹ جوڑا بنانے کا ایک اچھا علمی مرکز ہوتا ہے اور اب اسے پیشین گوئیاں کرنے کے لیے استعمال کیا جا سکتا ہے۔ لیکن اس سے پہلے کہ ہم صحیح پیشین گوئیاں کر سکیں، ہمیں ان تمام ممکنہ لیبلز کی فہرست بنا کر درجہ بندی کا کام ترتیب دینے کی ضرورت ہے جنہیں ماڈل آؤٹ پٹ کر سکتا ہے۔

مثال کے طور پر، جانوروں کی پرجاتیوں پر تصویر کی درجہ بندی کے کام کو برقرار رکھتے ہوئے، ہمیں جانوروں کی تمام اقسام کی فہرست درکار ہوگی۔ ان میں سے ہر ایک لیبل کو انکوڈ کیا جائے گا، T؟ ٹی کو؟ تربیت کے مرحلے میں پیش آنے والے پہلے سے تربیت یافتہ ٹیکسٹ انکوڈر کا استعمال کرنا۔

ایک بار لیبلز کو انکوڈ کرنے کے بعد، ہم پہلے سے تربیت یافتہ امیج انکوڈر کے ذریعے تصاویر داخل کر سکتے ہیں۔ ہم تصویر کی انکوڈنگ اور ہر ٹیکسٹ لیبل انکوڈنگ کے درمیان مماثلتوں کا حساب لگانے کے لیے فاصلہ میٹرک کوزائن مماثلت کا استعمال کریں گے۔

تصویر کی درجہ بندی تصویر کے ساتھ سب سے زیادہ مماثلت کے ساتھ لیبل کی بنیاد پر کی جاتی ہے۔ اور اس طرح صفر شاٹ لرننگ حاصل کی جاتی ہے، خاص طور پر تصویر کی درجہ بندی میں۔

ڈیٹا کی کمی

جیسا کہ پہلے ذکر کیا گیا ہے، اعلیٰ مقدار اور معیاری ڈیٹا آپ کے ہاتھ میں لینا مشکل ہے۔ ان انسانوں کے برعکس جو پہلے سے ہی زیرو شاٹ سیکھنے کی صلاحیت رکھتے ہیں، مشینوں کو سیکھنے کے لیے ان پٹ لیبل والے ڈیٹا کی ضرورت ہوتی ہے اور پھر قدرتی طور پر ہونے والے تغیرات کو اپنانے کے قابل ہوتی ہے۔

اگر ہم جانوروں کی پرجاتیوں کی مثال پر نظر ڈالیں تو بہت سارے تھے۔ اور جیسے جیسے مختلف ڈومینز میں زمرہ جات کی تعداد میں اضافہ ہوتا جا رہا ہے، تشریح شدہ ڈیٹا اکٹھا کرنے کے لیے اسے بہت زیادہ کام کرنا پڑے گا۔

اس کی وجہ سے، زیرو شاٹ لرننگ ہمارے لیے زیادہ قیمتی ہو گئی ہے۔ زیادہ سے زیادہ محققین دستیاب ڈیٹا کی کمی کو پورا کرنے کے لیے خودکار وصف کی شناخت میں دلچسپی رکھتے ہیں۔

ڈیٹا لیبلنگ۔

زیرو شاٹ لرننگ کا ایک اور فائدہ اس کی ڈیٹا لیبلنگ کی خصوصیات ہیں۔ ڈیٹا لیبلنگ بہت محنت طلب اور بہت تکلیف دہ ہوسکتی ہے، اور اس کی وجہ سے، اس عمل کے دوران غلطیاں پیدا ہوسکتی ہیں۔ ڈیٹا لیبلنگ کے لیے ماہرین کی ضرورت ہوتی ہے، جیسا کہ طبی پیشہ ور افراد جو بائیو میڈیکل ڈیٹاسیٹ پر کام کر رہے ہیں، جو کہ بہت مہنگا اور وقت طلب ہے۔

ڈیٹا کی مندرجہ بالا حدود کی وجہ سے زیرو شاٹ لرننگ زیادہ مقبول ہو رہی ہے۔ اگر آپ اس کی صلاحیتوں میں دلچسپی رکھتے ہیں تو میں آپ کو پڑھنے کی سفارش کروں گا کچھ کاغذات ہیں:

نشا آریہ ڈیٹا سائنٹسٹ اور فری لانس ٹیکنیکل رائٹر ہیں۔ وہ خاص طور پر ڈیٹا سائنس کیریئر کے مشورے یا سبق اور ڈیٹا سائنس کے بارے میں تھیوری پر مبنی علم فراہم کرنے میں دلچسپی رکھتی ہے۔ وہ مختلف طریقوں کو بھی دریافت کرنا چاہتی ہیں جن سے مصنوعی ذہانت انسانی زندگی کی لمبی عمر کو فائدہ پہنچا سکتی ہے۔ ایک شوقین سیکھنے والا، اپنے تکنیکی علم اور تحریری مہارتوں کو وسیع کرنے کی کوشش کر رہا ہے، جبکہ دوسروں کی رہنمائی میں مدد کرتا ہے۔