افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

20 مشین لرننگ پراجیکٹس جو آپ کو ملازمت حاصل کریں گے۔

اگر آپ مشین لرننگ اور ڈیٹا سائنس جاب مارکیٹ میں جانا چاہتے ہیں، تو آپ کو اپنی مہارتوں کی مہارت کا مظاہرہ کرنے کی ضرورت ہوگی، خاص طور پر اگر آپ آن لائن کورسز اور بوٹ کیمپس کے ذریعے خود سکھائے جاتے ہیں۔ ایک پراجیکٹ پورٹ فولیو آپ کے نئے دستکاری پر عمل کرنے اور اس بات کا قائل ثبوت پیش کرنے کا ایک بہترین طریقہ ہے کہ ایک ملازم کو آپ کو مقابلے پر ملازمت پر رکھنا چاہیے۔

تبصروں

By خوشبو شاہ، پروجیکٹ پرو میں مواد مینیجر.

اے آئی اور مشین لرننگ انڈسٹری عروج پر ہے جیسا کہ پہلے کبھی نہیں تھا۔ 2021 تک، کاروباروں میں AI کے استعمال میں اضافے سے 2.9 ٹریلین ڈالر کی کاروباری قدر پیدا ہوگی۔ AI نے پوری دنیا میں بہت سی صنعتوں کو خودکار بنایا ہے اور ان کے کام کرنے کا طریقہ بدل دیا ہے۔ زیادہ تر بڑی کمپنیاں اپنے کام کے بہاؤ میں پیداواری صلاحیت کو زیادہ سے زیادہ بنانے کے لیے AI کو شامل کرتی ہیں، اور مارکیٹنگ اور صحت کی دیکھ بھال جیسی صنعتوں میں AI کے استحکام کی وجہ سے ایک مثالی تبدیلی آئی ہے۔

تصویر کے ماخذ: Unsplash سے

اس کی وجہ سے، پچھلے کچھ سالوں میں AI پیشہ ور افراد کی مانگ میں اضافہ ہوا ہے۔ 100 سے 2015 تک AI اور مشین لرننگ سے متعلق ملازمتوں کی پوسٹنگ میں تقریباً 2018% اضافہ ہوا ہے۔ یہ تعداد اس کے بعد سے بڑھی ہے اور 2021 میں اس میں اضافہ متوقع ہے۔

اگر آپ مشین لرننگ کی صنعت میں قدم رکھنا چاہتے ہیں تو اچھی خبر یہ ہے کہ دستیاب ملازمتوں کی کوئی کمی نہیں ہے۔ کمپنیوں کو ایک باصلاحیت افرادی قوت کی ضرورت ہے جو مشین لرننگ میں تبدیلی کی راہ ہموار کرنے کے قابل ہو۔ تاہم، جاب مارکیٹ میں ان لوگوں کی دراندازی ہوتی ہے جو ڈیٹا انڈسٹری میں جانا چاہتے ہیں۔ چونکہ مشین لرننگ سیکھنے کے خواہشمند طلباء کے لیے کوئی مخصوص ڈگری پروگرام نہیں بنایا گیا، اس لیے بہت سے خواہشمند ایم ایل پریکٹیشنرز خود سکھائے جاتے ہیں۔

اینڈریو این جی کے مشین لرننگ آن لائن کورس میں 4 ملین سے زیادہ طلباء کا اندراج ہے۔

بدقسمتی سے، آن لائن کورسز میں داخلہ لینے یا مشین لرننگ Bootcamp لینے سے آپ کو نظریاتی تصورات سیکھنے میں مدد ملتی ہے لیکن یہ آپ کو صنعت میں ملازمت کے لیے تیار نہیں کرتا ہے۔ تھیوری کو سیکھنے کے بعد، ابھی بہت زیادہ کام کرنا باقی ہے۔ ہم کہتے ہیں کہ آپ مشین لرننگ الگورتھم کی بنیادی باتیں جانتے ہیں — آپ سمجھتے ہیں کہ رجعت اور درجہ بندی کے ماڈل کیسے کام کرتے ہیں، اور آپ مختلف قسم کے کلسٹرنگ طریقوں کو جانتے ہیں۔

آپ حقیقی زندگی کے مسئلے کو حل کرنے کے لیے سیکھی ہوئی مہارتوں پر عمل کیسے کریں گے؟ سادہ جواب ہے: مشق، مشق، اور مشق متنوع مشین سیکھنے کے منصوبے.

نظریاتی تصورات سیکھنے کے بعد، آپ کو AI اور مشین لرننگ پروجیکٹس پر کام کرنا شروع کر دینا چاہیے۔ یہ پروجیکٹ آپ کو فیلڈ میں اپنی صلاحیتوں کو نکھارنے کے لیے ضروری مشق فراہم کریں گے، اور اس کے ساتھ ساتھ، آپ کے مشین لرننگ پورٹ فولیو میں ایک بہت بڑا اضافہ ہے۔

زیادہ اڈو کے بغیر، آئیے کچھ ML پروجیکٹ آئیڈیاز دریافت کریں جو نہ صرف آپ کے پورٹ فولیو کو اچھا بنائیں گے بلکہ آپ کی مشین لرننگ کی مہارتوں کو بھی نمایاں طور پر بہتر بنائیں گے۔ یہ طلباء، مشین لرننگ کے خواہشمند پریکٹیشنرز، اور غیر تکنیکی ڈومینز سے تعلق رکھنے والے افراد کے لیے مشین لرننگ کے کچھ بہترین پروجیکٹس کی مرتب کردہ فہرست ہے۔ آپ اپنے پس منظر سے قطع نظر ان منصوبوں پر کام کر سکتے ہیں، جب تک کہ آپ کے پاس کچھ کوڈنگ اور مشین سیکھنے کی مہارت کا علم ہو۔ یہ ابتدائی اور اعلی درجے کے مشین لرننگ پروجیکٹس کی فہرست ہے۔

اگر آپ ڈیٹا انڈسٹری میں نئے ہیں اور حقیقی زندگی کے پراجیکٹس کے بارے میں بہت کم تجربہ رکھتے ہیں، تو زیادہ چیلنجنگ پراجیکٹس پر جانے سے پہلے ابتدائی سطح کے ML پروجیکٹس کے ساتھ شروعات کریں۔

مبتدی کے لیے مشین لرننگ پروجیکٹس

1. کاگل ٹائٹینک کی پیشن گوئی

اس فہرست میں پہلا پراجیکٹ سب سے سیدھا سادہ ایم ایل پروجیکٹس میں سے ایک ہے جسے آپ لے سکتے ہیں۔ ڈیٹا انڈسٹری میں ابتدائی افراد کو مکمل کرنے کے لیے اس پروجیکٹ کی سفارش کی جاتی ہے۔ ٹائٹینک ڈیٹاسیٹ Kaggle پر دستیاب ہے، اور اسے ڈاؤن لوڈ کرنے کا لنک نیچے دیا گیا ہے۔

یہ ڈیٹا سیٹ ان مسافروں کا ہے جنہوں نے ٹائٹینک پر سفر کیا۔ اس میں مسافر کی عمر، ٹکٹ کا کرایہ، کیبن اور جنس جیسی تفصیلات ہیں۔ اس معلومات کی بنیاد پر، آپ کو یہ اندازہ لگانا ہوگا کہ آیا یہ مسافر بچ گئے یا نہیں۔

یہ ایک سادہ بائنری درجہ بندی کا مسئلہ ہے، اور آپ کو صرف یہ پیشین گوئی کرنی ہے کہ آیا کوئی خاص مسافر بچ گیا ہے۔ اس ڈیٹاسیٹ کے بارے میں سب سے اچھی بات یہ ہے کہ تمام پری پروسیسنگ آپ کے لیے کی گئی ہے۔ آپ کے پاس اپنے مشین لرننگ ماڈل کو تربیت دینے کے لیے ایک اچھا، صاف ڈیٹا سیٹ ہے۔

چونکہ یہ درجہ بندی کا مسئلہ ہے، اس لیے آپ پیش گوئی کرنے والے ماڈل کو بنانے کے لیے الگورتھم جیسے لاجسٹک ریگریشن، فیصلہ کے درخت، اور بے ترتیب جنگلات استعمال کرنے کا انتخاب کر سکتے ہیں۔ بہتر نتائج حاصل کرنے کے لیے آپ اس ابتدائی سطح کے مشین لرننگ پروجیکٹ کے لیے XGBoost کلاسیفائر جیسے گریڈینٹ بوسٹنگ ماڈلز کا بھی انتخاب کر سکتے ہیں۔

ڈیٹا سیٹ: کاگل ٹائٹینک ڈیٹاسیٹ

2. مکان کی قیمت کی پیشن گوئی

اگر آپ مشین لرننگ میں ابتدائی ہیں تو گھر کی قیمتوں کا ڈیٹا بھی شروع کرنے کے لیے بہت اچھا ہے۔ یہ پروجیکٹ Kaggle پر دستیاب گھر کی قیمتوں کا ڈیٹا سیٹ استعمال کرے گا۔ اس ڈیٹاسیٹ میں ہدف متغیر کسی خاص گھر کی قیمت ہے، جس کی آپ کو معلومات کا استعمال کرتے ہوئے پیش گوئی کرنے کی ضرورت ہوگی جیسے گھر کا رقبہ، بیڈ رومز کی تعداد، باتھ رومز کی تعداد، اور یوٹیلیٹیز۔

یہ رجعت کا مسئلہ ہے، اور آپ ماڈل بنانے کے لیے لکیری رجعت جیسی تکنیک استعمال کر سکتے ہیں۔ آپ ایک زیادہ جدید طریقہ بھی اختیار کر سکتے ہیں اور مکان کی قیمتوں کا اندازہ لگانے کے لیے ایک بے ترتیب فاریسٹ ریگریسر یا گریڈینٹ بوسٹنگ کا استعمال کر سکتے ہیں۔

اس ڈیٹاسیٹ میں 80 کالم ہیں، ہدف متغیر کو چھوڑ کر۔ آپ کو خصوصیات کو ہاتھ سے چننے کے لیے کچھ جہتی کمی کی تکنیکوں کو استعمال کرنے کی ضرورت ہوگی کیونکہ بہت زیادہ متغیرات شامل کرنے سے آپ کے ماڈل کی کارکردگی خراب ہو سکتی ہے۔

ڈیٹاسیٹ میں بہت سے واضح متغیرات بھی ہیں، لہذا آپ کو ون ہاٹ انکوڈنگ یا لیبل انکوڈنگ جیسی تکنیکوں کا استعمال کرتے ہوئے ان سے مناسب طریقے سے نمٹنے کی ضرورت ہے۔

اپنا ماڈل بنانے کے بعد، آپ Kaggle میں گھر کی قیمتوں کے مقابلے میں اپنی پیشین گوئیاں جمع کرا سکتے ہیں، کیونکہ یہ ابھی تک کھلا ہے۔ حریفوں کے ذریعہ حاصل کردہ بہترین RMSE 0 ہے، اور بہت سے لوگوں نے رجعت اور گریڈینٹ بوسٹنگ تکنیک کی مدد سے 0.15 جیسے اچھے نتائج حاصل کیے ہیں۔

ڈیٹا سیٹ: کاگل ہاؤس کی قیمت کی پیشن گوئی ڈیٹا سیٹ

3. شراب کے معیار کی پیشن گوئی

وائن کے معیار کی پیشن گوئی ڈیٹاسیٹ ڈیٹا انڈسٹری کے ابتدائی افراد میں بھی بہت مقبول ہے۔ اس پروجیکٹ میں، آپ ریڈ وائن کے معیار کا اندازہ لگانے کے لیے فکسڈ تیزابیت، غیر مستحکم تیزابیت، الکحل اور کثافت کا استعمال کریں گے۔

اسے درجہ بندی یا رجعت کا مسئلہ سمجھا جا سکتا ہے۔ دی شراب کا معیار متغیر جس کی آپ کو ڈیٹاسیٹ کی حدود میں 0-10 کے درمیان پیش گوئی کرنے کی ضرورت ہے، تاکہ آپ پیشین گوئی کرنے کے لیے ایک ریگریشن ماڈل بناسکیں۔ ایک اور طریقہ جو آپ اختیار کر سکتے ہیں وہ ہے قدروں کو (0–10 سے) مجرد وقفوں میں توڑنا اور انہیں واضح متغیرات میں تبدیل کرنا۔ آپ تین قسمیں بنا سکتے ہیں، مثال کے طور پر۔ کم، درمیانے، اور اعلی.

اس کے بعد آپ پیشین گوئی کرنے کے لیے فیصلہ سازی کا درجہ بندی کرنے والا یا کوئی درجہ بندی ماڈل بنا سکتے ہیں۔ یہ آپ کے رجعت اور درجہ بندی کی مشین سیکھنے کی مہارتوں پر عمل کرنے کے لیے نسبتاً صاف اور سیدھا ڈیٹا سیٹ ہے۔

ڈیٹا سیٹ: کیگل ریڈ وائن کوالٹی ڈیٹاسیٹ

4. دل کی بیماری کی پیشن گوئی

اگر آپ صحت کی دیکھ بھال کی صنعت میں ڈیٹاسیٹ کو تلاش کرنا چاہتے ہیں، تو یہ شروع کرنے کے لیے ایک بہترین ابتدائی سطح کا ڈیٹاسیٹ ہے۔ یہ ڈیٹا سیٹ CHD (کورونری دل کی بیماری) کے 10 سالہ خطرے کی پیش گوئی کرنے کے لیے استعمال کیا جاتا ہے۔ اس ڈیٹاسیٹ میں منحصر متغیرات دل کی بیماری کے خطرے والے عوامل ہیں، بشمول ذیابیطس، تمباکو نوشی، ہائی بلڈ پریشر، اور ہائی کولیسٹرول کی سطح۔

آزاد متغیر CHD کا 10 سالہ خطرہ ہے۔ یہ ایک بائنری درجہ بندی کا مسئلہ ہے، اور ہدف متغیر یا تو 0 یا 1–0 ان مریضوں کے لیے ہے جنہیں کبھی دل کی بیماری نہیں ہوئی اور 1 ان مریضوں کے لیے جنہوں نے کیا تھا۔ آپ اس ڈیٹاسیٹ پر کچھ فیچر سلیکشن انجام دے سکتے ہیں تاکہ ان خصوصیات کی نشاندہی کی جا سکے جو دل کے خطرے میں سب سے زیادہ حصہ ڈالتی ہیں۔ پھر، آپ درجہ بندی کے ماڈل کو آزاد متغیرات پر فٹ کر سکتے ہیں۔

یہ ڈیٹاسیٹ انتہائی غیر متوازن ہے کیونکہ اس ڈیٹاسیٹ کے بہت سے مریضوں نے ایسا کیا۔ نوٹ دل کی بیماری کی ترقی. ایک غیر متوازن ڈیٹاسیٹ کو صحیح فیچر انجینئرنگ تکنیکوں جیسے اوور سیمپلنگ، ویٹ ٹیوننگ، یا انڈر سیمپلنگ کا استعمال کرتے ہوئے ہینڈل کرنے کی ضرورت ہے۔ اگر مناسب طریقے سے نمٹا نہیں جاتا ہے، تو آپ ایک ایسے ماڈل کے ساتھ ختم ہو جائیں گے جو ہر ڈیٹا پوائنٹ کے لیے صرف اکثریتی طبقے کی پیش گوئی کرتا ہے اور ان مریضوں کی شناخت نہیں کر سکتا جو کیا دل کی بیماری کی ترقی. یہ آپ کے لیے اپنی فیچر انجینئرنگ اور مشین لرننگ کی مہارتوں پر عمل کرنے کے لیے ایک بہترین ڈیٹا سیٹ ہے۔

ڈیٹا سیٹ: کیگل دل کی بیماری کا ڈیٹاسیٹ

5. MNIST ہندسوں کی درجہ بندی

۔ MNIST ڈیٹاسیٹ گہری سیکھنے کے میدان میں آپ کا قدم ہے۔ یہ ڈیٹا سیٹ 0 سے 9 تک ہاتھ سے لکھے ہندسوں کی گرے اسکیل امیجز پر مشتمل ہے۔ آپ کا کام ڈیپ لرننگ الگورتھم کا استعمال کرتے ہوئے ہندسوں کی شناخت کرنا ہوگا۔ یہ دس ممکنہ آؤٹ پٹ کلاسز کے ساتھ ملٹی کلاس درجہ بندی کا مسئلہ ہے۔ اس درجہ بندی کو انجام دینے کے لیے آپ CNN (Convolutional Neural Network) استعمال کر سکتے ہیں۔

MNIST ڈیٹاسیٹ Python میں Keras لائبریری کے اندر بنایا گیا ہے۔ آپ کو بس Keras انسٹال کرنے، لائبریری کو درآمد کرنے اور ڈیٹاسیٹ کو لوڈ کرنے کی ضرورت ہے۔ اس ڈیٹاسیٹ میں تقریباً 60,000 تصاویر ہیں تاکہ آپ ان تصاویر میں سے تقریباً 80% کو تربیت کے لیے اور دیگر 20% کو جانچ کے لیے استعمال کر سکیں۔

ڈیٹا سیٹ: Kaggle Digit Recognizer Dataset

6. ٹویٹر ڈیٹا کا جذباتی تجزیہ

Kaggle پر بہت سے ٹویٹر جذباتی تجزیہ ڈیٹا سیٹس دستیاب ہیں۔ سب سے زیادہ مقبول ڈیٹا سیٹس میں سے ایک Sentiment140 کہلاتا ہے، جس میں 1.6 ملین پہلے سے پروسیس شدہ ٹویٹس ہیں۔ اگر آپ جذباتی تجزیہ میں نئے ہیں تو یہ شروع کرنے کے لیے ایک بہترین ڈیٹاسیٹ ہے۔

ان ٹویٹس پر تشریح کی گئی ہے، اور ہدف متغیر جذبات ہے۔ اس کالم میں منفرد قدریں 0 (منفی)، 2 (غیر جانبدار) اور 4 (مثبت) ہیں۔

ان ٹویٹس کو پہلے سے پروسیس کرنے اور انہیں ویکٹر میں تبدیل کرنے کے بعد، آپ ان کو ان کے متعلقہ جذبات کے ساتھ تربیت دینے کے لیے درجہ بندی کا ماڈل استعمال کر سکتے ہیں۔ آپ اس کام کے لیے الگورتھم جیسے لاجسٹک ریگریشن، ڈیسیکشن ٹری کلاسیفائر، یا XGBoost کلاسیفائر استعمال کر سکتے ہیں۔

ایک اور متبادل جذبات کی پیشین گوئی کے ساتھ آنے کے لیے LSTM جیسے گہرے سیکھنے کے ماڈل کا استعمال کرنا ہے۔ تاہم، یہ قدرے زیادہ چیلنجنگ طریقہ ہے اور جدید پروجیکٹ کے زمرے میں آتا ہے۔

آپ اس لیبل والے ڈیٹاسیٹ کو مستقبل کے جذباتی تجزیہ کے کاموں کے لیے ایک بنیاد کے طور پر بھی استعمال کر سکتے ہیں۔

اگر آپ کے پاس کوئی ایسی ٹویٹس ہیں جس پر آپ جذباتی تجزیہ جمع کرنا اور انجام دینا چاہتے ہیں، تو آپ مستقبل کی پیشین گوئیاں کرنے کے لیے ایک ایسا ماڈل استعمال کر سکتے ہیں جو پہلے سے جذباتی 140 پر تربیت یافتہ ہو۔

ڈیٹا سیٹ: Kaggle Sentiment140 ڈیٹاسیٹ

7. پیما انڈین ذیابیطس کی پیشن گوئی

Pima Indian Diabetes Dataset کا استعمال تشخیصی پیمائش کی بنیاد پر یہ اندازہ لگانے کے لیے کیا جاتا ہے کہ آیا مریض کو ذیابیطس ہے یا نہیں۔

BMI، عمر، اور انسولین جیسے متغیرات کی بنیاد پر، ماڈل مریضوں میں ذیابیطس کی پیش گوئی کرے گا۔ اس ڈیٹاسیٹ میں نو متغیر ہیں — آٹھ آزاد متغیر اور ایک ہدف متغیر۔

ہدف متغیر ہے 'ذیابیطس'، لہذا آپ ذیابیطس کی موجودگی کے لئے 1 یا ذیابیطس کی عدم موجودگی کے لئے 0 کی پیش گوئی کریں گے۔

لاجسٹک ریگریشن، ڈیسیکشن ٹری کلاسیفائر، یا رینڈم فارسٹ کلاسیفائر جیسے ماڈلز کے ساتھ تجربہ کرنے کے لیے یہ درجہ بندی کا مسئلہ ہے۔

اس ڈیٹاسیٹ میں تمام آزاد متغیرات عددی ہیں، لہذا اگر آپ کے پاس کم سے کم فیچر انجینئرنگ کا تجربہ ہے تو یہ شروع کرنے کے لیے ایک بہترین ڈیٹاسیٹ ہے۔

یہ ایک Kaggle ڈیٹاسیٹ ہے جو ابتدائی افراد کے لیے کھلا ہے۔ بہت سارے ٹیوٹوریل آن لائن ہیں جو آپ کو Python اور R میں حل کوڈنگ کے ذریعے لے جاتے ہیں۔ یہ نوٹ بک ٹیوٹوریلز سیکھنے اور اپنے ہاتھوں کو گندا کرنے کا ایک بہترین طریقہ ہیں تاکہ آپ مزید پیچیدہ پروجیکٹس کی طرف بڑھ سکیں۔

ڈیٹا سیٹ: کاگل پیما انڈین ذیابیطس ڈیٹاسیٹ

8. چھاتی کے کینسر کی درجہ بندی

Kaggle پر چھاتی کے کینسر کی درجہ بندی کا ڈیٹاسیٹ آپ کی مشین لرننگ اور AI مہارتوں کی مشق کرنے کا ایک اور بہترین طریقہ ہے۔

حقیقی دنیا میں سب سے زیادہ زیر نگرانی مشین لرننگ مسائل اس طرح کی درجہ بندی کے مسائل ہیں۔ چھاتی کے کینسر کی شناخت میں ایک اہم چیلنج سومی (غیر کینسر والے) اور مہلک (کینسر والے) ٹیومر کے درمیان فرق کرنے میں ناکامی ہے۔ ڈیٹاسیٹ میں ٹیومر کے "ریڈیس_مین" اور "علاقہ_میان" جیسے متغیرات ہیں، اور آپ کو ان خصوصیات کی بنیاد پر درجہ بندی کرنے کی ضرورت ہوگی اگر ٹیومر کینسر کا ہے یا نہیں۔ اس ڈیٹاسیٹ کے ساتھ کام کرنا نسبتاً آسان ہے کیونکہ کوئی اہم ڈیٹا پری پروسیسنگ کرنے کی ضرورت نہیں ہے۔ یہ ایک متوازن ڈیٹاسیٹ بھی ہے، جو آپ کے کام کو مزید قابل انتظام بناتا ہے کیونکہ آپ کو زیادہ فیچر انجینئرنگ کرنے کی ضرورت نہیں ہے۔

اس ڈیٹاسیٹ پر ایک سادہ لوجسٹک ریگریشن کلاسیفائر کو تربیت دینے سے آپ کو 0.90 تک درستگی مل سکتی ہے۔

ڈیٹا سیٹ: Kaggle چھاتی کے کینسر کی درجہ بندی ڈیٹاسیٹ

9. TMDB باکس آفس کی پیشن گوئی

یہ Kaggle ڈیٹاسیٹ آپ کی رجعت کی مہارتوں پر عمل کرنے کا ایک بہترین طریقہ ہے۔ یہ تقریباً 7000 فلموں پر مشتمل ہے، اور آپ کو مووی کی آمدنی کا اندازہ لگانے کے لیے موجود متغیرات کو استعمال کرنے کی ضرورت ہوگی۔

موجود ڈیٹا پوائنٹس میں کاسٹ، عملہ، بجٹ، زبانیں، اور ریلیز کی تاریخیں شامل ہیں۔ ڈیٹاسیٹ میں 23 متغیرات ہیں، جن میں سے ایک ہدف متغیر ہے۔

ایک بنیادی لکیری ریگریشن ماڈل آپ کو 0.60 سے زیادہ کا R-squared دے سکتا ہے، لہذا آپ اسے اپنے بنیادی پیشین گوئی ماڈل کے طور پر استعمال کر سکتے ہیں۔ XGBoost regression یا Light GBM جیسی تکنیکوں کا استعمال کرتے ہوئے اس سکور کو ہرانے کی کوشش کریں۔

یہ ڈیٹاسیٹ پچھلے ایک سے تھوڑا زیادہ پیچیدہ ہے کیونکہ کچھ کالموں میں نیسٹڈ لغات میں ڈیٹا موجود ہوتا ہے۔ آپ کو اس ڈیٹا کو قابل استعمال فارمیٹ میں نکالنے کے لیے کچھ اضافی پری پروسیسنگ کرنے کی ضرورت ہے تاکہ اس پر ماڈل کو تربیت دی جا سکے۔

آمدنی کی پیشن گوئی آپ کے پورٹ فولیو پر ظاہر کرنے کے لیے ایک بہترین پروجیکٹ ہے، کیونکہ یہ فلم انڈسٹری سے باہر مختلف ڈومینز کو کاروباری قدر فراہم کرتا ہے۔

ڈیٹا سیٹ: Kaggle TMDB باکس آفس کی پیشن گوئی ڈیٹا سیٹ

10. Python میں گاہک کی تقسیم

Kaggle پر کسٹمر سیگمنٹیشن ڈیٹاسیٹ غیر زیر نگرانی مشین لرننگ کے ساتھ شروع کرنے کا ایک بہترین طریقہ ہے۔ یہ ڈیٹا سیٹ کسٹمر کی تفصیلات پر مشتمل ہوتا ہے جیسے ان کی عمر، جنس، سالانہ آمدنی، اور اخراجات کا سکور۔

آپ کو ان متغیرات کو کسٹمر سیگمنٹس بنانے کے لیے استعمال کرنے کی ضرورت ہے۔ ایک جیسے صارفین کو ایک جیسے کلسٹرز میں گروپ کیا جانا چاہیے۔ آپ اس کام کے لیے K-Means کلسٹرنگ یا ہائرارکیکل کلسٹرنگ جیسے الگورتھم استعمال کر سکتے ہیں۔ کسٹمر سیگمنٹیشن ماڈل کاروباری قدر فراہم کر سکتے ہیں۔

کمپنیاں اکثر اپنے صارفین کو الگ کرنا چاہتی ہیں تاکہ ہر گاہک کی قسم کے لیے مختلف مارکیٹنگ تکنیکیں سامنے آئیں۔

اس ڈیٹاسیٹ کے اہم مقاصد میں شامل ہیں:

مشین لرننگ تکنیک کا استعمال کرتے ہوئے گاہک کی تقسیم کو حاصل کرنا
مختلف مارکیٹنگ کی حکمت عملیوں کے لیے اپنے ہدف والے صارفین کی شناخت کریں۔
سمجھیں کہ حقیقی دنیا میں مارکیٹنگ کی حکمت عملی کیسے کام کرتی ہے۔

اس کام کے لیے کلسٹرنگ ماڈل بنانے سے آپ کے پورٹ فولیو کو نمایاں کرنے میں مدد مل سکتی ہے، اور اگر آپ مارکیٹنگ کی صنعت میں AI سے متعلق نوکری حاصل کرنے کے خواہاں ہیں تو تقسیم کرنا ایک بہترین مہارت ہے۔

ڈیٹا سیٹ: کاگل مال کسٹمر سیگمنٹیشن ڈیٹاسیٹ

آپ کے ریزیومے کے لیے انٹرمیڈیٹ/ایڈوانسڈ لیول مشین لرننگ پروجیکٹس

ایک بار جب آپ نے اوپر دیے گئے سادہ مشین لرننگ پروجیکٹس پر کام مکمل کرلیا، تو آپ مزید چیلنجنگ پروجیکٹس کی طرف بڑھ سکتے ہیں۔

1. فروخت کی پیشن گوئی

ٹائم سیریز کی پیشن گوئی ایک مشین لرننگ تکنیک ہے جو صنعت میں اکثر استعمال ہوتی ہے۔ مستقبل کی فروخت کی پیشن گوئی کرنے کے لیے ماضی کے ڈیٹا کے استعمال میں کاروباری استعمال کے معاملات کی ایک بڑی تعداد ہے۔ کاگل ڈیمانڈ فورکاسٹنگ ڈیٹاسیٹ اس پروجیکٹ پر عمل کرنے کے لیے استعمال کیا جا سکتا ہے۔

اس ڈیٹاسیٹ میں سیلز کا 5 سال کا ڈیٹا ہے، اور آپ کو اگلے تین مہینوں کے لیے سیلز کی پیشین گوئی کرنی ہوگی۔ ڈیٹا سیٹ میں دس مختلف اسٹورز درج ہیں، اور ہر اسٹور پر 50 آئٹمز ہیں۔

فروخت کی پیشن گوئی کرنے کے لیے، آپ مختلف طریقے آزما سکتے ہیں — ARIMA، Vector Autoregression، یا گہری سیکھنے۔ ایک طریقہ جو آپ اس پروجیکٹ کے لیے استعمال کر سکتے ہیں وہ ہے ہر مہینے کی فروخت میں اضافے کی پیمائش کرنا اور اسے ریکارڈ کرنا۔ پھر، پچھلے مہینے اور موجودہ مہینے کی فروخت کے درمیان فرق پر ماڈل بنائیں۔ تعطیلات اور موسمی عوامل کو مدنظر رکھنا آپ کے مشین لرننگ ماڈل کی کارکردگی کو بہتر بنا سکتا ہے۔

ڈیٹا سیٹ: Kaggle سٹور آئٹم کی مانگ کی پیشن گوئی

2. کسٹمر سروس چیٹ بوٹ

کسٹمر سروس چیٹ بوٹ انسانی نمائندے کا کردار ادا کرتے ہوئے صارفین کو جواب دینے کے لیے AI اور مشین لرننگ تکنیک کا استعمال کرتا ہے۔ ایک چیٹ بوٹ کو صارفین کی ضروریات کو پورا کرنے کے لیے آسان سوالات کے جوابات دینے کے قابل ہونا چاہیے۔

اس وقت تین قسم کے چیٹ بوٹس ہیں جو آپ بنا سکتے ہیں:

اصول پر مبنی چیٹ بوٹس - یہ چیٹ بوٹس ذہین نہیں ہیں۔ انہیں پہلے سے طے شدہ قواعد کا ایک سیٹ کھلایا جاتا ہے اور صرف ان اصولوں کی بنیاد پر صارفین کو جواب دیا جاتا ہے۔ کچھ چیٹ بوٹس کو پہلے سے طے شدہ سوالات اور جوابات کا سیٹ بھی فراہم کیا جاتا ہے اور اس ڈومین سے باہر آنے والے سوالات کا جواب نہیں دے سکتے۔
آزاد چیٹ بوٹس - آزاد چیٹ بوٹس صارف کی درخواست پر کارروائی اور تجزیہ کرنے اور اس کے مطابق جوابات فراہم کرنے کے لیے مشین لرننگ کا استعمال کرتے ہیں۔
NLP چیٹ بوٹس - یہ چیٹ بوٹس الفاظ کے نمونوں کو سمجھ سکتے ہیں اور مختلف الفاظ کے امتزاج میں فرق کر سکتے ہیں۔ وہ تینوں چیٹ بوٹ اقسام میں سب سے زیادہ جدید ہیں، کیونکہ وہ اس بات کے بارے میں سوچ سکتے ہیں کہ ان الفاظ کے نمونوں کی بنیاد پر آگے کیا کہنا ہے جن پر انہیں تربیت دی گئی تھی۔

این ایل پی چیٹ بوٹ ایک دلچسپ مشین لرننگ پروجیکٹ آئیڈیا ہے۔ آپ کو اپنے ماڈل کو تربیت دینے کے لیے موجودہ الفاظ کی ضرورت ہوگی، اور ایسا کرنے کے لیے آپ آسانی سے ازگر کی لائبریریاں تلاش کر سکتے ہیں۔ آپ سوال و جواب کے جوڑوں کی فہرست کے ساتھ پہلے سے طے شدہ لغت بھی رکھ سکتے ہیں جسے آپ اپنے ماڈل کو تربیت دینا چاہتے ہیں۔

3. وائلڈ لائف آبجیکٹ کا پتہ لگانے کا نظام

اگر آپ کسی ایسے علاقے میں رہتے ہیں جہاں جنگلی جانور اکثر نظر آتے ہیں، تو آپ کے علاقے میں ان کی موجودگی کی نشاندہی کرنے کے لیے آبجیکٹ کا پتہ لگانے کے نظام کو نافذ کرنا مددگار ہے۔ اس طرح کا نظام بنانے کے لیے ان اقدامات پر عمل کریں:

اس علاقے میں کیمرے لگائیں جس کی آپ نگرانی کرنا چاہتے ہیں۔
تمام ویڈیو فوٹیج ڈاؤن لوڈ کریں اور انہیں محفوظ کریں۔
آنے والی تصاویر کا تجزیہ کرنے اور جنگلی جانوروں کی شناخت کے لیے ازگر کی ایپلی کیشن بنائیں۔

مائیکروسافٹ نے وائلڈ لائف کیمروں سے جمع کردہ ڈیٹا کا استعمال کرتے ہوئے ایک امیج ریکگنیشن API بنایا ہے۔ انہوں نے اس مقصد کے لیے ایک اوپن سورس پری ٹرینڈ ماڈل جاری کیا جسے MegaDetector کہتے ہیں۔

آپ اس پہلے سے تربیت یافتہ ماڈل کو اپنی Python ایپلی کیشن میں استعمال کر سکتے ہیں تاکہ جمع کی گئی تصاویر سے جنگلی جانوروں کی شناخت کی جا سکے۔ یہ اب تک ذکر کیے گئے سب سے دلچسپ ML پروجیکٹوں میں سے ایک ہے اور اس مقصد کے لیے پہلے سے تربیت یافتہ ماڈل کی دستیابی کی وجہ سے اس پر عمل درآمد کرنا کافی آسان ہے۔

APIs: میگا ڈیٹیکٹر

4. اسپاٹائف میوزک ریکمنڈر سسٹم

Spotify اپنے صارفین کو موسیقی تجویز کرنے کے لیے AI کا استعمال کرتا ہے۔ آپ Spotify پر عوامی طور پر دستیاب ڈیٹا کی بنیاد پر ایک تجویز کنندہ سسٹم بنانے کی کوشش کر سکتے ہیں۔

Spotify میں ایک API ہے جسے آپ آڈیو ڈیٹا بازیافت کرنے کے لیے استعمال کر سکتے ہیں — آپ ریلیز کا سال، کلید، مقبولیت اور فنکار جیسی خصوصیات تلاش کر سکتے ہیں۔ Python میں اس API تک رسائی کے لیے، آپ Spotipy نامی لائبریری استعمال کر سکتے ہیں۔

آپ Kaggle پر Spotify ڈیٹاسیٹ بھی استعمال کر سکتے ہیں جس میں لگ بھگ 600K قطاریں ہیں۔ ان ڈیٹا سیٹس کا استعمال کرتے ہوئے، آپ ہر صارف کے پسندیدہ موسیقار کے لیے بہترین متبادل تجویز کر سکتے ہیں۔ آپ ہر صارف کی طرف سے ترجیحی مواد اور صنف کی بنیاد پر گانے کی سفارشات بھی لے سکتے ہیں۔

یہ تجویز کنندہ نظام K-Means کلسٹرنگ کا استعمال کرتے ہوئے بنایا جا سکتا ہے — اسی طرح کے ڈیٹا پوائنٹس کو گروپ کیا جائے گا۔ آپ اختتامی صارف کو ان کے درمیان کم سے کم انٹرا کلسٹر فاصلے کے ساتھ گانے تجویز کر سکتے ہیں۔

ایک بار جب آپ تجویز کنندہ سسٹم بنا لیتے ہیں، تو آپ اسے ایک سادہ Python ایپ میں بھی تبدیل کر سکتے ہیں اور اسے تعینات کر سکتے ہیں۔ آپ Spotify پر صارفین کو ان کے پسندیدہ گانے درج کرنے کے لیے حاصل کر سکتے ہیں، پھر اپنی ماڈل کی سفارشات کو اسکرین پر ڈسپلے کر سکتے ہیں جو ان گانوں سے سب سے زیادہ مماثلت رکھتی ہیں جن کا انہوں نے لطف اٹھایا۔

ڈیٹا سیٹ: Kaggle Spotify ڈیٹاسیٹ

5. مارکیٹ ٹوکری تجزیہ

مارکیٹ باسکٹ تجزیہ ایک مشہور تکنیک ہے جو خوردہ فروشوں کے ذریعہ ان اشیاء کی شناخت کے لئے استعمال کی جاتی ہے جو ایک ساتھ فروخت کی جاسکتی ہیں۔

مثال کے طور پر:

کچھ سال پہلے، ایک تحقیقی تجزیہ کار نے بیئر اور ڈائپر کی فروخت کے درمیان تعلق کی نشاندہی کی۔ زیادہ تر وقت، جب بھی کوئی گاہک بیئر خریدنے کے لیے سٹور میں جاتا تھا، تو وہ ایک ساتھ ڈائپر بھی خریدتے تھے۔

اس کی وجہ سے، دکانوں نے فروخت کو بڑھانے کے لیے مارکیٹنگ کی حکمت عملی کے طور پر ایک ہی گلیارے پر ایک ساتھ بیئر اور ڈائپر فروخت کرنا شروع کر دیا۔ اور اس نے کام کیا۔

یہ فرض کیا گیا تھا کہ بیئر اور لنگوٹ کا ایک اعلی تعلق ہے کیونکہ مرد اکثر انہیں ایک ساتھ خریدتے ہیں۔ مرد اپنے خاندان کے لیے کئی دیگر گھریلو اشیاء کے ساتھ بیئر خریدنے کے لیے اسٹور میں جاتے تھے (بشمول لنگوٹ)۔ یہ ایک بہت ہی ناممکن ارتباط کی طرح لگتا ہے، لیکن یہ ہوا.

مارکیٹ باسکٹ کا تجزیہ کمپنیوں کو ان اشیاء کے درمیان پوشیدہ ارتباط کی نشاندہی کرنے میں مدد کر سکتا ہے جو اکثر ایک ساتھ خریدی جاتی ہیں۔ اس کے بعد یہ اسٹورز اپنی اشیاء کو اس طریقے سے پوزیشن میں رکھ سکتے ہیں جس سے لوگ انہیں آسانی سے تلاش کر سکیں۔

آپ اپنے ماڈل کو بنانے اور تربیت دینے کے لیے Kaggle پر Market Basket Optimization ڈیٹاسیٹ استعمال کر سکتے ہیں۔ مارکیٹ باسکٹ تجزیہ کرنے کے لیے سب سے زیادہ استعمال ہونے والا الگورتھم Apriori الگورتھم ہے۔

ڈیٹا سیٹ: کاگل مارکیٹ باسکٹ آپٹیمائزیشن ڈیٹاسیٹ

6. NYC ٹیکسی کے سفر کا دورانیہ

ڈیٹاسیٹ میں متغیرات ہوتے ہیں جن میں ٹیکسی کے سفر کے آغاز اور اختتامی نقاط، وقت اور مسافروں کی تعداد شامل ہوتی ہے۔ اس ایم ایل پروجیکٹ کا مقصد ان تمام متغیرات کے ساتھ سفر کے دورانیے کی پیش گوئی کرنا ہے۔ یہ رجعت کا مسئلہ ہے۔

وقت اور نقاط جیسے متغیرات کو مناسب طریقے سے پہلے سے پروسیس کرنے اور قابل فہم شکل میں تبدیل کرنے کی ضرورت ہے۔ یہ پروجیکٹ اتنا سیدھا نہیں جتنا لگتا ہے۔ اس ڈیٹاسیٹ میں کچھ آؤٹ لیرز بھی ہیں جو پیشین گوئی کو زیادہ پیچیدہ بناتے ہیں، لہذا آپ کو فیچر انجینئرنگ تکنیک کے ساتھ اسے سنبھالنے کی ضرورت ہوگی۔

اس NYC ٹیکسی ٹرپ کیگل مقابلے کے لیے تشخیص کا معیار RMSLE یا روٹ مین اسکوائرڈ لاگ ایرر ہے۔ Kaggle پر سب سے اوپر جمع کرانے کو 0.29 کا RMSLE اسکور ملا، اور Kaggle کے بیس لائن ماڈل کا RMSLE 0.89 ہے۔

آپ اس Kaggle پروجیکٹ کو حل کرنے کے لیے کوئی بھی ریگریشن الگورتھم استعمال کر سکتے ہیں، لیکن اس چیلنج کے سب سے زیادہ کارکردگی کا مظاہرہ کرنے والے حریفوں نے یا تو گریڈینٹ بوسٹنگ ماڈلز یا گہری سیکھنے کی تکنیک کا استعمال کیا ہے۔

ڈیٹا سیٹ: Kaggle NYC ٹیکسی ٹرپ کا دورانیہ ڈیٹا سیٹ

7. ریئل ٹائم سپیم کا پتہ لگانا

اس پروجیکٹ میں، آپ سپیم (ناجائز) اور ہیم (جائز) پیغامات کے درمیان فرق کرنے کے لیے مشین لرننگ تکنیک استعمال کر سکتے ہیں۔

اس کو حاصل کرنے کے لیے، آپ Kaggle SMS سپیم کلیکشن ڈیٹاسیٹ استعمال کر سکتے ہیں۔ اس ڈیٹاسیٹ میں تقریباً 5K پیغامات کا ایک سیٹ ہے جن پر اسپام یا ہیم کا لیبل لگا ہوا ہے۔

آپ ریئل ٹائم سپیم کا پتہ لگانے کا نظام بنانے کے لیے درج ذیل اقدامات کر سکتے ہیں:

مشین لرننگ ماڈل کو تربیت دینے کے لیے Kaggle کے SMS سپیم کلیکشن ڈیٹاسیٹ کا استعمال کریں۔
Python میں ایک سادہ چیٹ روم سرور بنائیں۔
مشین لرننگ ماڈل کو اپنے چیٹ روم سرور پر لگائیں اور اس بات کو یقینی بنائیں کہ آنے والی تمام ٹریفک ماڈل سے گزرے۔
پیغامات کو صرف اس صورت میں جانے کی اجازت دیں جب ان کی درجہ بندی ہیم کے طور پر کی گئی ہو۔ اگر وہ اسپام ہیں تو اس کے بجائے غلطی کا پیغام واپس کریں۔

مشین لرننگ ماڈل بنانے کے لیے، آپ کو پہلے کاگل کے ایس ایم ایس اسپام کلیکشن ڈیٹاسیٹ میں موجود ٹیکسٹ میسجز کو پہلے سے پروسیس کرنے کی ضرورت ہے۔ پھر، ان پیغامات کو الفاظ کے تھیلے میں تبدیل کریں تاکہ وہ پیشین گوئی کے لیے آپ کے درجہ بندی کے ماڈل میں آسانی سے منتقل ہو سکیں۔

ڈیٹا سیٹ: Kaggle SMS سپیم کلیکشن ڈیٹاسیٹ

8. Myers-Briggs Personality Prediction App

آپ صارف کے کہنے کی بنیاد پر اس کی شخصیت کی قسم کا اندازہ لگانے کے لیے ایک ایپ بنا سکتے ہیں۔

Myers-Briggs ٹائپ انڈیکیٹر افراد کو شخصیت کی 16 مختلف اقسام میں درجہ بندی کرتا ہے۔ یہ دنیا کے مشہور ترین پرسنلٹی ٹیسٹوں میں سے ایک ہے۔

اگر آپ انٹرنیٹ پر اپنی شخصیت کی قسم تلاش کرنے کی کوشش کریں تو آپ کو بہت سے آن لائن کوئزز ملیں گے۔ تقریباً 20-30 سوالات کے جوابات دینے کے بعد، آپ کو شخصیت کی قسم کے لیے تفویض کیا جائے گا۔

تاہم، اس پروجیکٹ میں، آپ صرف ایک جملے کی بنیاد پر کسی کی شخصیت کی قسم کا اندازہ لگانے کے لیے مشین لرننگ کا استعمال کر سکتے ہیں۔

یہاں وہ اقدامات ہیں جو آپ اسے حاصل کرنے کے لیے اٹھا سکتے ہیں:

ایک ملٹی کلاس درجہ بندی ماڈل بنائیں اور اسے Kaggle پر Myers-Briggs ڈیٹاسیٹ پر تربیت دیں۔ اس میں ڈیٹا پری پروسیسنگ (اسٹاپ ورڈز اور غیر ضروری حروف کو ہٹانا) اور کچھ فیچر انجینئرنگ شامل ہے۔ آپ اس مقصد کے لیے ایک اتلی لرننگ ماڈل جیسے لاجسٹک ریگریشن یا ڈیپ لرننگ ماڈل جیسے LSTM استعمال کر سکتے ہیں۔
آپ ایک ایسی ایپلی کیشن بنا سکتے ہیں جو صارفین کو اپنی پسند کا کوئی بھی جملہ درج کرنے کی اجازت دیتی ہے۔
اپنے مشین لرننگ ماڈل کے وزن کو محفوظ کریں اور ماڈل کو اپنی ایپ کے ساتھ مربوط کریں۔ اختتامی صارف کے لفظ داخل کرنے کے بعد، ماڈل کے پیشین گوئی کرنے کے بعد اسکرین پر ان کی شخصیت کی قسم دکھائیں۔

ڈیٹا سیٹ: Kaggle MBTI قسم ڈیٹاسیٹ

9. موڈ ریکگنیشن سسٹم + ریکمنڈر سسٹم

کیا آپ کبھی اداس ہوئے ہیں اور محسوس کیا ہے کہ آپ کو خوش کرنے کے لیے کچھ مضحکہ خیز دیکھنے کی ضرورت ہے؟ یا کیا آپ نے کبھی اتنا مایوس محسوس کیا ہے کہ آپ کو آرام کرنے اور کچھ آرام دہ دیکھنے کی ضرورت ہے؟

یہ منصوبہ دو چھوٹے منصوبوں کا مجموعہ ہے۔

آپ ایک ایسی ایپ بنا سکتے ہیں جو لائیو ویب فوٹیج کی بنیاد پر صارف کے موڈ کو پہچانے اور صارف کے تاثرات پر مبنی فلم کی تجویز۔

اسے بنانے کے لیے، آپ درج ذیل اقدامات کر سکتے ہیں:

ایک ایسی ایپ بنائیں جو لائیو ویڈیو فیڈ لے سکے۔
ویڈیو فیڈ میں موجود اشیاء پر چہروں اور جذبات کا پتہ لگانے کے لیے Python's face recognition API استعمال کریں۔
ان جذبات کو مختلف زمروں میں درجہ بندی کرنے کے بعد، سفارشی نظام کی تعمیر شروع کریں۔ یہ ہر جذبات کے لیے ہارڈ کوڈ شدہ اقدار کا ایک سیٹ ہو سکتا ہے، جس کا مطلب ہے کہ آپ کو سفارشات کے لیے مشین لرننگ کو شامل کرنے کی ضرورت نہیں ہے۔
ایپ بنانے کے بعد، آپ اسے ہیروکو، ڈیش، یا ویب سرور پر تعینات کر سکتے ہیں۔

APIs: چہرے کی شناخت API

10. یوٹیوب تبصرہ جذبات کا تجزیہ

اس پروجیکٹ میں، آپ مقبول YouTubers کے مجموعی جذبات کا تجزیہ کرنے والا ڈیش بورڈ بنا سکتے ہیں۔

2 بلین سے زیادہ صارفین مہینے میں کم از کم ایک بار YouTube ویڈیوز دیکھتے ہیں۔ مقبول YouTubers اپنے مواد کے ساتھ سینکڑوں ارب ملاحظات حاصل کرتے ہیں۔ تاہم، ان میں سے بہت سے متاثر کن ماضی میں تنازعات کی وجہ سے آگ کی زد میں آ چکے ہیں، اور عوامی تاثر مسلسل تبدیل ہو رہا ہے۔

آپ جذباتی تجزیہ کا ماڈل بنا سکتے ہیں اور وقت کے ساتھ مشہور شخصیات کے ارد گرد جذبات کو دیکھنے کے لیے ڈیش بورڈ بنا سکتے ہیں۔

اسے بنانے کے لیے، آپ درج ذیل اقدامات کر سکتے ہیں:

YouTubers کے ویڈیوز کے تبصروں کو ختم کریں جن کا آپ تجزیہ کرنا چاہتے ہیں۔
ہر تبصرے پر پیشین گوئیاں کرنے کے لیے پہلے سے تربیت یافتہ جذباتی تجزیہ کا ماڈل استعمال کریں۔
ڈیش بورڈ پر ماڈل کی پیشین گوئیوں کا تصور کریں۔ یہاں تک کہ آپ Dash (Python) یا Shiny (R) جیسی لائبریریوں کا استعمال کرتے ہوئے ڈیش بورڈ ایپ بھی بنا سکتے ہیں۔
آپ صارفین کو ٹائم فریم، YouTuber کے نام اور ویڈیو کی صنف کے ذریعے جذبات کو فلٹر کرنے کی اجازت دے کر ڈیش بورڈ کو انٹرایکٹو بنا سکتے ہیں۔

APIs: یوٹیوب تبصرہ سکریپر

خلاصہ

مشین لرننگ انڈسٹری بڑی اور مواقع سے بھری ہوئی ہے۔ اگر آپ کسی رسمی تعلیمی پس منظر کے بغیر انڈسٹری میں جانا چاہتے ہیں، تو یہ ظاہر کرنے کا بہترین طریقہ ہے کہ آپ کے پاس کام کرنے کے لیے ضروری مہارتیں ہیں پروجیکٹس کے ذریعے۔

اوپر دیے گئے زیادہ تر پروجیکٹس کا مشین لرننگ پہلو بہت آسان ہے۔ مشین لرننگ کو جمہوری بنانے کی وجہ سے، ماڈل بنانے کا عمل پہلے سے تربیت یافتہ ماڈلز اور APIs کے ذریعے آسانی سے حاصل کیا جا سکتا ہے۔

اوپن سورس مصنوعی ذہانت کے منصوبوں جیسے Keras اور FastAI نے بھی ماڈل بنانے کے عمل کو تیز کرنے میں مدد کی ہے۔ ان مشین لرننگ کا مشکل حصہ اور ڈیٹا سائنس کے منصوبے ڈیٹا اکٹھا کرنا، پری پروسیسنگ، اور تعیناتی ہے۔ اگر آپ مشین لرننگ میں ملازمت کرتے ہیں، تو زیادہ تر الگورتھم بنانا بہت آسان ہوگا۔ فروخت کی پیشن گوئی کا ماڈل بنانے میں صرف ایک یا دو دن لگیں گے۔ آپ اپنا زیادہ تر وقت ڈیٹا کے مناسب ذرائع تلاش کرنے اور کاروباری قدر حاصل کرنے کے لیے اپنے ماڈلز کو پروڈکشن میں لگانے میں صرف کریں گے۔

حقیقی. اجازت کے ساتھ دوبارہ پوسٹ کیا۔

متعلقہ: