2023 میں پڑھنے کے لیے ٹاپ مشین لرننگ پیپرز

2023 میں پڑھنے کے لیے ٹاپ مشین لرننگ پیپرز

ماخذ نوڈ: 2016455

2023 میں پڑھنے کے لیے ٹاپ مشین لرننگ پیپرز
تصویر کی طرف سے پی سی ویکٹر on Freepik
 

مشین لرننگ ایک بڑا شعبہ ہے جس میں نئی ​​تحقیق کثرت سے سامنے آتی ہے۔ یہ ایک گرم میدان ہے جہاں ماہرین تعلیم اور صنعت ہماری روزمرہ کی زندگی کو بہتر بنانے کے لیے نئی چیزوں کے ساتھ تجربات کرتے رہتے ہیں۔

حالیہ برسوں میں، مشین لرننگ کے اطلاق کی وجہ سے جنریٹو AI دنیا کو بدل رہا ہے۔ مثال کے طور پر، ChatGPT اور مستحکم بازی۔ یہاں تک کہ 2023 میں جنریٹو AI کا غلبہ ہے، ہمیں مشین لرننگ کی بہت سی کامیابیوں سے آگاہ ہونا چاہیے۔

2023 میں پڑھنے کے لیے یہاں سرفہرست مشین لرننگ پیپرز ہیں تاکہ آپ آنے والے رجحانات سے محروم نہ ہوں۔

1) گانوں میں خوبصورتی سیکھنا: نیورل سنگنگ وائس بیوٹیفائر

سنگنگ وائس بیوٹیفائنگ (SVB) تخلیقی AI میں ایک نیا کام ہے جس کا مقصد شوقیہ گانے کی آواز کو خوبصورت بنانا ہے۔ یہ بالکل تحقیق کا مقصد ہے۔ لیو اور ایل. (2022) جب انہوں نے نیورل سنگنگ وائس بیوٹیفائر (NSVB) کے نام سے ایک نیا جنریٹو ماڈل تجویز کیا۔ 

NSVB ایک نیم زیر نگرانی سیکھنے کا ماڈل ہے جو ایک لیٹنٹ میپنگ الگورتھم کا استعمال کرتا ہے جو پچ درست کرنے والے کے طور پر کام کرتا ہے اور آواز کے لہجے کو بہتر بناتا ہے۔ کام میوزیکل انڈسٹری کو بہتر بنانے کا وعدہ کرتا ہے اور یہ دیکھنے کے قابل ہے۔

2) اصلاحی الگورتھم کی علامتی دریافت

گہرے اعصابی نیٹ ورک کے ماڈل پہلے سے کہیں زیادہ بڑے ہو گئے ہیں، اور تربیت کے عمل کو آسان بنانے کے لیے بہت زیادہ تحقیق کی گئی ہے۔ گوگل ٹیم کی حالیہ تحقیق (چن وغیرہ۔ (2023)) نے نیورل نیٹ ورک کے لیے شیر (EvoLved Sign Momentum) نامی ایک نئی اصلاح کی تجویز پیش کی ہے۔ طریقہ یہ ظاہر کرتا ہے کہ الگورتھم زیادہ یادداشت کے قابل ہے اور اسے ایڈم سے کم سیکھنے کی شرح کی ضرورت ہے۔ یہ بہت اچھی تحقیق ہے جو بہت سے وعدوں کو ظاہر کرتی ہے جن سے آپ کو محروم نہیں ہونا چاہیے۔

3) ٹائمز نیٹ: عمومی ٹائم سیریز تجزیہ کے لیے عارضی 2D- تغیر ماڈلنگ

ٹائم سیریز کا تجزیہ بہت سے کاروباروں میں عام استعمال کا معاملہ ہے۔ مثال کے طور پر، قیمت کی پیشن گوئی، بے ضابطگی کا پتہ لگانا، وغیرہ۔ تاہم، صرف موجودہ ڈیٹا (1D ڈیٹا) کی بنیاد پر عارضی ڈیٹا کا تجزیہ کرنے میں بہت سے چیلنجز ہیں۔ یہی وجہ ہے وو وغیرہ۔ (2023) 1D ڈیٹا کو 2D ڈیٹا میں تبدیل کرنے کے لیے TimesNet کے نام سے ایک نیا طریقہ تجویز کریں، جو تجربے میں بہترین کارکردگی حاصل کرتا ہے۔ اس نئے طریقہ کار کو بہتر طور پر سمجھنے کے لیے آپ کو پیپر پڑھنا چاہیے کیونکہ اس سے مستقبل کے وقت کی سیریز کے تجزیہ میں بہت مدد ملے گی۔

4) OPT: پہلے سے تربیت یافتہ ٹرانسفارمر لینگویج ماڈلز کھولیں۔

فی الحال، ہم ایک تخلیقی AI دور میں ہیں جہاں کمپنیوں کے ذریعہ بہت سے بڑے زبان کے ماڈلز کو تیار کیا گیا تھا۔ زیادہ تر اس قسم کی تحقیق ان کے ماڈل کو جاری نہیں کرے گی یا صرف تجارتی طور پر دستیاب ہوگی۔ تاہم، میٹا اے آئی ریسرچ گروپ (ژانگ ایٹ ایل. (2022)) اوپن پری ٹرینڈ ٹرانسفارمرز (OPT) ماڈل کو عوامی طور پر جاری کرکے اس کے برعکس کرنے کی کوشش کرتا ہے جو GPT-3 کے ساتھ موازنہ کیا جاسکتا ہے۔ پیپر OPT ماڈل اور تحقیقی تفصیل کو سمجھنے کے لیے ایک بہترین آغاز ہے، کیونکہ گروپ کاغذ میں تمام تفصیلات کو لاگ کرتا ہے۔

5) REaLTabFormer: ٹرانسفارمرز کا استعمال کرتے ہوئے حقیقت پسندانہ رشتہ دار اور ٹیبلر ڈیٹا تیار کرنا

جنریٹو ماڈل صرف متن یا تصویریں بنانے تک محدود نہیں ہے بلکہ ٹیبلولر ڈیٹا بھی ہے۔ اس تیار کردہ ڈیٹا کو اکثر مصنوعی ڈیٹا کہا جاتا ہے۔ مصنوعی ٹیبلر ڈیٹا تیار کرنے کے لیے بہت سے ماڈلز تیار کیے گئے تھے، لیکن رشتہ دار ٹیبلر مصنوعی ڈیٹا تیار کرنے کے لیے تقریباً کوئی ماڈل نہیں تھا۔ بالکل یہی مقصد ہے۔ سولیٹریو اور ڈوپریز (2023) تحقیق مصنوعی رشتہ دار ڈیٹا کے لیے REaLTabFormer نامی ایک ماڈل بنانا۔ تجربے سے معلوم ہوا ہے کہ نتیجہ موجودہ مصنوعی ماڈل کے بالکل قریب ہے، جسے کئی ایپلی کیشنز تک بڑھایا جا سکتا ہے۔

6) کیا نیچرل لینگویج پروسیسنگ کے لیے کمک سیکھنا (نہیں) ہے؟: فطری زبان کی پالیسی کی اصلاح کے لیے بینچ مارکس، بیس لائنز، اور بلڈنگ بلاکس

نیچرل لینگویج پروسیسنگ کے کام کے لیے تصوراتی طور پر کمک سیکھنا ایک بہترین انتخاب ہے، لیکن کیا یہ سچ ہے؟ یہ ایک سوال ہے کہ رام مورتی وغیرہ۔ (2022) جواب دینے کی کوشش کریں. محقق نے مختلف لائبریری اور الگورتھم کو متعارف کرایا ہے جو یہ ظاہر کرتا ہے کہ NLP کاموں میں زیر نگرانی طریقہ کے مقابلے میں کمک سیکھنے کی تکنیک کو کہاں برتری حاصل ہے۔ اگر آپ اپنے سکل سیٹ کے لیے کوئی متبادل چاہتے ہیں تو اسے پڑھنے کے لیے ایک تجویز کردہ کاغذ ہے۔

7) ٹیون-اے-ویڈیو: ٹیکسٹ ٹو ویڈیو جنریشن کے لیے امیج ڈفیوژن ماڈلز کی ون شاٹ ٹیوننگ

ٹیکسٹ ٹو امیج جنریشن 2022 میں بڑی تھی، اور 2023 کو ٹیکسٹ ٹو ویڈیو (T2V) کی صلاحیت پر پیش کیا جائے گا۔ کی طرف سے تحقیق وو وغیرہ۔ (2022) دکھاتا ہے کہ کس طرح T2V کو کئی طریقوں سے بڑھایا جا سکتا ہے۔ تحقیق میں ایک نیا ٹیون-اے-ویڈیو طریقہ تجویز کیا گیا ہے جو T2V کاموں جیسے کہ موضوع اور آبجیکٹ کی تبدیلی، طرز کی منتقلی، انتساب میں ترمیم وغیرہ کو سپورٹ کرتا ہے۔ اگر آپ ٹیکسٹ ٹو ویڈیو ریسرچ میں دلچسپی رکھتے ہیں تو یہ پڑھنے کے لیے ایک بہترین پیپر ہے۔

8) پائی گلوو: کوڈ کے طور پر ایم ایل آئیڈیاز کا مؤثر طریقے سے تبادلہ

موثر تعاون کسی بھی ٹیم کی کامیابی کی کلید ہے، خاص طور پر مشین لرننگ کے شعبوں میں بڑھتی ہوئی پیچیدگی کے ساتھ۔ کارکردگی کو فروغ دینے کے لیے، پینگ وغیرہ۔ (2023) ایم ایل آئیڈیاز کو آسانی سے شیئر کرنے کے لیے ایک PyGlove لائبریری پیش کریں۔ PyGlove کا تصور ML تحقیق کے عمل کو پیچ کرنے والے قواعد کی فہرست کے ذریعے حاصل کرنا ہے۔ اس کے بعد فہرست کو کسی بھی تجرباتی منظر میں دوبارہ استعمال کیا جا سکتا ہے، جس سے ٹیم کی کارکردگی بہتر ہوتی ہے۔ یہ تحقیق ہے جو مشین لرننگ کے مسئلے کو حل کرنے کی کوشش کرتی ہے جو بہت سے لوگوں نے ابھی تک نہیں کی ہے، لہذا یہ پڑھنے کے قابل ہے۔

8) چیٹ جی پی ٹی انسانی ماہرین سے کتنا قریب ہے؟ موازنہ کارپس، تشخیص، اور کھوج

ChatGPT نے دنیا کو بہت بدل دیا ہے۔ یہ کہنا محفوظ ہے کہ یہاں سے رجحان اوپر کی طرف جائے گا کیونکہ عوام پہلے ہی ChatGPT استعمال کرنے کے حق میں ہے۔ تاہم، انسانی ماہرین کے مقابلے میں چیٹ جی پی ٹی کا موجودہ نتیجہ کیسا ہے؟ یہ بالکل ایک سوال ہے۔ گو ایٹ ال (2023) جواب دینے کی کوشش کریں. ٹیم نے ماہرین سے ڈیٹا اکٹھا کرنے کی کوشش کی اور چیٹ جی پی ٹی کے فوری نتائج، جس کا انہوں نے موازنہ کیا۔ نتیجہ ظاہر کرتا ہے کہ ChatGPT اور ماہرین کے درمیان واضح اختلافات موجود تھے۔ تحقیق ایک ایسی چیز ہے جس کے بارے میں مجھے لگتا ہے کہ مستقبل میں پوچھا جائے گا کیونکہ تخلیقی AI ماڈل وقت کے ساتھ ساتھ بڑھتا رہے گا، لہذا یہ پڑھنے کے قابل ہے۔

2023 مشین لرننگ ریسرچ کے لیے ایک بہترین سال ہے جو موجودہ رجحان سے ظاہر ہوتا ہے، خاص طور پر جنریٹو AI جیسے ChatGPT اور Stable Diffusion۔ بہت زیادہ امید افزا تحقیق ہے جو مجھے لگتا ہے کہ ہمیں اس سے محروم نہیں ہونا چاہئے کیونکہ اس نے امید افزا نتائج دکھائے ہیں جو موجودہ معیار کو تبدیل کر سکتے ہیں۔ اس آرٹیکل میں، میں نے آپ کو پڑھنے کے لیے 9 سرفہرست ML پیپرز دکھائے ہیں، جن میں جنریٹو ماڈل، ٹائم سیریز ماڈل سے لے کر ورک فلو کی کارکردگی شامل ہیں۔ مجھے امید ہے کہ اس سے مدد ملتی ہے۔
 
 
کارنیلیس یودھا وجایا ڈیٹا سائنس اسسٹنٹ مینیجر اور ڈیٹا رائٹر ہے۔ Allianz Indonesia میں کل وقتی کام کرتے ہوئے، وہ سوشل میڈیا اور تحریری میڈیا کے ذریعے Python اور Data ٹپس کا اشتراک کرنا پسند کرتا ہے۔
 

ٹائم اسٹیمپ:

سے زیادہ KDnuggets