20 মেশিন লার্নিং প্রকল্প যা আপনাকে নিয়োগ দেবে
আপনি যদি মেশিন লার্নিং এবং ডেটা সায়েন্স চাকরির বাজারে প্রবেশ করতে চান, তাহলে আপনাকে আপনার দক্ষতার দক্ষতা প্রদর্শন করতে হবে, বিশেষ করে যদি আপনি অনলাইন কোর্স এবং বুটক্যাম্পের মাধ্যমে স্ব-শিক্ষিত হন। একটি প্রকল্প পোর্টফোলিও আপনার নতুন নৈপুণ্য অনুশীলন করার একটি দুর্দান্ত উপায় এবং দৃঢ়প্রত্যয়ী প্রমাণ সরবরাহ করে যে একজন কর্মচারী আপনাকে প্রতিযোগিতায় নিয়োগ করা উচিত।
By খুশবু শাহ, ProjectPro এ বিষয়বস্তু ব্যবস্থাপক.
এআই এবং মেশিন লার্নিং ইন্ডাস্ট্রি এমনভাবে বিকশিত হচ্ছে যা আগে কখনো হয়নি। 2021 সালের হিসাবে, ব্যবসা জুড়ে AI ব্যবহারের বৃদ্ধি $2.9 ট্রিলিয়ন ব্যবসায়িক মূল্য তৈরি করবে। AI বিশ্বজুড়ে অনেক শিল্পকে স্বয়ংক্রিয় করেছে এবং তাদের পরিচালনার পদ্ধতি পরিবর্তন করেছে। বেশিরভাগ বড় কোম্পানি তাদের কর্মপ্রবাহে উৎপাদনশীলতা বাড়াতে AI অন্তর্ভুক্ত করে এবং বিপণন এবং স্বাস্থ্যসেবার মতো শিল্পগুলি AI এর একীকরণের কারণে একটি দৃষ্টান্ত পরিবর্তনের মধ্য দিয়ে গেছে।
চিত্র উত্স: Unsplash
এই কারণে, এআই পেশাদারদের জন্য গত কয়েক বছরে ক্রমবর্ধমান চাহিদা রয়েছে। 100 থেকে 2015 সাল পর্যন্ত এআই এবং মেশিন লার্নিং-সম্পর্কিত চাকরির পোস্টিং প্রায় 2018% বৃদ্ধি পেয়েছে। এই সংখ্যাটি বেড়েছে এবং 2021 সালে বাড়বে বলে অনুমান করা হচ্ছে।
আপনি যদি মেশিন লার্নিং শিল্পে প্রবেশ করতে চান তবে সুসংবাদটি হল যে এখানে চাকরির অভাব নেই। কোম্পানিগুলির একটি প্রতিভাবান কর্মীবাহিনী প্রয়োজন যা মেশিন লার্নিং-এ স্থানান্তরিত করতে অগ্রণী ভূমিকা পালন করতে সক্ষম। যাইহোক, চাকরির বাজার এমন লোকদের দ্বারা অনুপ্রবেশ করে যারা ডেটা শিল্পে প্রবেশ করতে চায়। যেহেতু মেশিন লার্নিং শিখতে চায় এমন শিক্ষার্থীদের জন্য কোনো নির্দিষ্ট ডিগ্রি প্রোগ্রাম সরবরাহ করা হয়নি, তাই অনেক উচ্চাকাঙ্ক্ষী এমএল অনুশীলনকারীরা স্ব-শিক্ষিত।
অ্যান্ড্রু এনজি'র মেশিন লার্নিং অনলাইন কোর্সে 4 মিলিয়নেরও বেশি শিক্ষার্থী নথিভুক্ত হয়েছে।
দুর্ভাগ্যবশত, অনলাইন কোর্সে নথিভুক্ত করা বা মেশিন লার্নিং বুটক্যাম্প নেওয়া আপনাকে তাত্ত্বিক ধারণাগুলি শিখতে সাহায্য করে কিন্তু শিল্পে চাকরির জন্য আপনাকে প্রস্তুত করে না। তত্ত্বটি শিখে নেওয়ার জন্য আরও অনেক কাজ করতে হবে। ধরা যাক আপনি মেশিন লার্নিং অ্যালগরিদমের মূল বিষয়গুলি জানেন — আপনি বুঝতে পারেন কীভাবে রিগ্রেশন এবং শ্রেণীবিভাগ মডেলগুলি কাজ করে এবং আপনি বিভিন্ন ধরণের ক্লাস্টারিং পদ্ধতি জানেন৷
বাস্তব জীবনের সমস্যা সমাধানের জন্য আপনি যে দক্ষতাগুলি শিখেছেন তা আপনি কীভাবে অনুশীলন করবেন? সহজ উত্তর হল: অনুশীলন, অনুশীলন, এবং অনুশীলন বিভিন্ন মেশিন লার্নিং প্রকল্প.
একবার আপনি তাত্ত্বিক ধারণাগুলি শেখার পরে, আপনার এআই এবং মেশিন লার্নিং প্রকল্পগুলিতে কাজ শুরু করা উচিত। এই প্রকল্পগুলি আপনাকে এই ক্ষেত্রে আপনার দক্ষতা বাড়াতে প্রয়োজনীয় অনুশীলন দেবে, এবং একই সাথে, আপনার মেশিন লার্নিং পোর্টফোলিওতে একটি দুর্দান্ত মূল্য সংযোজন।
খুব বেশি আড্ডা ছাড়াই, আসুন কিছু ML প্রোজেক্ট আইডিয়া অন্বেষণ করি যা শুধু আপনার পোর্টফোলিওকে সুন্দর দেখাবে না বরং আপনার মেশিন লার্নিং দক্ষতাকে উল্লেখযোগ্যভাবে উন্নত করবে। এটি শিক্ষার্থীদের, উচ্চাকাঙ্ক্ষী মেশিন লার্নিং অনুশীলনকারীদের এবং অ-প্রযুক্তিগত ডোমেনের ব্যক্তিদের জন্য সেরা মেশিন লার্নিং প্রকল্পগুলির একটি সংকলিত তালিকা। আপনার পটভূমি নির্বিশেষে আপনি এই প্রকল্পগুলিতে কাজ করতে পারেন, যতক্ষণ না আপনার কাছে কিছু কোডিং এবং মেশিন লার্নিং দক্ষতা রয়েছে। এটি শিক্ষানবিস- এবং উন্নত-স্তরের মেশিন লার্নিং প্রকল্পগুলির একটি তালিকা।
আপনি যদি ডেটা শিল্পে নতুন হন এবং বাস্তব-জীবনের প্রকল্পগুলির সাথে সামান্য অভিজ্ঞতা থাকে তবে আরও চ্যালেঞ্জিংগুলির দিকে যাওয়ার আগে শিক্ষানবিস-স্তরের ML প্রকল্পগুলি দিয়ে শুরু করুন৷
নতুনদের জন্য মেশিন লার্নিং প্রকল্প
1. কাগল টাইটানিকের ভবিষ্যদ্বাণী
এই তালিকার প্রথম প্রকল্পটি সবচেয়ে সহজবোধ্য এমএল প্রকল্পগুলির মধ্যে একটি যা আপনি নিতে পারেন। এই প্রকল্পটি ডেটা শিল্পে নতুনদের সম্পূর্ণ করার জন্য সুপারিশ করা হয়। টাইটানিক ডেটাসেট Kaggle এ উপলব্ধ, এবং এটি ডাউনলোড করার লিঙ্ক নীচে দেওয়া আছে.
এই ডেটাসেট টাইটানিক ভ্রমণকারী যাত্রীদের। এতে যাত্রীর বয়স, টিকিটের ভাড়া, কেবিন এবং লিঙ্গের মতো বিবরণ রয়েছে। এই তথ্যের উপর ভিত্তি করে, আপনাকে এই যাত্রীরা বেঁচে আছে কি না তা ভবিষ্যদ্বাণী করতে হবে।
এটি একটি সাধারণ বাইনারি শ্রেণিবিন্যাস সমস্যা, এবং আপনাকে যা করতে হবে তা হল ভবিষ্যদ্বাণী করা যে কোনো নির্দিষ্ট যাত্রী বেঁচে থাকলে। এই ডেটাসেট সম্পর্কে সবচেয়ে ভাল জিনিস হল যে সমস্ত প্রাক-প্রক্রিয়াকরণ আপনার জন্য করা হয়েছে। আপনার মেশিন লার্নিং মডেলকে প্রশিক্ষণ দেওয়ার জন্য আপনার কাছে একটি সুন্দর, পরিষ্কার ডেটাসেট আছে।
যেহেতু এটি একটি শ্রেণিবিন্যাস সমস্যা, আপনি ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে লজিস্টিক রিগ্রেশন, সিদ্ধান্ত গাছ এবং এলোমেলো বনের মতো অ্যালগরিদম ব্যবহার করতে পারেন। আপনি আরও ভাল ফলাফল পেতে এই শিক্ষানবিস-স্তরের মেশিন লার্নিং প্রকল্পের জন্য একটি XGBoost ক্লাসিফায়ারের মতো গ্রেডিয়েন্ট বুস্টিং মডেলগুলিও বেছে নিতে পারেন।
ডেটাসেট: কাগল টাইটানিক ডেটাসেট
2. বাড়ির দামের পূর্বাভাস
আপনি যদি মেশিন লার্নিংয়ে একজন শিক্ষানবিস হন তাহলে বাড়ির দামের ডেটা দিয়ে শুরু করাও দারুণ। এই প্রকল্পটি Kaggle-এ উপলব্ধ বাড়ির দামের ডেটাসেট ব্যবহার করবে। এই ডেটাসেটের লক্ষ্য পরিবর্তনশীল হল একটি নির্দিষ্ট বাড়ির দাম, যা আপনাকে বাড়ির এলাকা, বেডরুমের সংখ্যা, বাথরুমের সংখ্যা এবং ইউটিলিটিগুলির মতো তথ্য ব্যবহার করে ভবিষ্যদ্বাণী করতে হবে।
এটি একটি রিগ্রেশন সমস্যা, এবং আপনি মডেলটি তৈরি করতে লিনিয়ার রিগ্রেশনের মতো কৌশলগুলি ব্যবহার করতে পারেন। এছাড়াও আপনি আরও উন্নত পদ্ধতি গ্রহণ করতে পারেন এবং বাড়ির দামের পূর্বাভাস দিতে একটি র্যান্ডম ফরেস্ট রিগ্রেসার বা গ্রেডিয়েন্ট বুস্টিং ব্যবহার করতে পারেন।
এই ডেটাসেটে টার্গেট ভেরিয়েবল বাদ দিয়ে 80টি কলাম রয়েছে। অনেকগুলি ভেরিয়েবল যোগ করার ফলে আপনার মডেলের কার্যকারিতা খারাপ হতে পারে বলে আপনাকে বৈশিষ্ট্যগুলি হ্যান্ড-পিক করার জন্য কিছু মাত্রিকতা হ্রাস কৌশল নিয়োগ করতে হবে।
এছাড়াও ডেটাসেটে অনেক শ্রেণীগত ভেরিয়েবল রয়েছে, তাই আপনাকে ওয়ান-হট এনকোডিং বা লেবেল-এনকোডিংয়ের মতো কৌশলগুলি ব্যবহার করে সঠিকভাবে তাদের সাথে মোকাবিলা করতে হবে।
আপনার মডেল তৈরি করার পরে, আপনি আপনার ভবিষ্যদ্বাণীগুলি কাগলের বাড়ির মূল্য নির্ধারণ প্রতিযোগিতায় জমা দিতে পারেন, কারণ এটি এখনও খোলা রয়েছে৷ প্রতিযোগীদের দ্বারা অর্জিত সেরা RMSE হল 0, এবং অনেক লোক রিগ্রেশন এবং গ্রেডিয়েন্ট বুস্টিং কৌশলগুলির সাহায্যে 0.15 এর মতো ভাল ফলাফল অর্জন করেছে।
ডেটাসেট: কাগল হাউস মূল্য পূর্বাভাস ডেটাসেট
3. ওয়াইন মানের পূর্বাভাস
ওয়াইন মানের ভবিষ্যদ্বাণী ডেটাসেট ডেটা শিল্পের নতুনদের মধ্যেও খুব জনপ্রিয়। এই প্রজেক্টে, আপনি রেড ওয়াইনের গুণমানের পূর্বাভাস দিতে স্থির অম্লতা, উদ্বায়ী অম্লতা, অ্যালকোহল এবং ঘনত্ব ব্যবহার করবেন।
এটি একটি শ্রেণীবিভাগ বা রিগ্রেশন সমস্যা হিসাবে বিবেচিত হতে পারে। দ্য ওয়াইন মানের ভেরিয়েবলের জন্য আপনাকে ডেটাসেট রেঞ্জে 0-10 পর্যন্ত ভবিষ্যদ্বাণী করতে হবে, যাতে আপনি ভবিষ্যদ্বাণী করার জন্য একটি রিগ্রেশন মডেল তৈরি করতে পারেন। আরেকটি পদ্ধতি যা আপনি নিতে পারেন তা হল মানগুলিকে (0-10 থেকে) বিচ্ছিন্ন ব্যবধানে ভেঙ্গে দেওয়া এবং তাদের শ্রেণীগত ভেরিয়েবলে রূপান্তর করা। আপনি তিনটি বিভাগ তৈরি করতে পারেন, উদাহরণস্বরূপ - নিম্ন, মাঝারি, এবং উচ্চ.
আপনি তারপর ভবিষ্যদ্বাণী করার জন্য একটি সিদ্ধান্ত গাছ শ্রেণীবিভাগ বা কোনো শ্রেণীবিভাগ মডেল তৈরি করতে পারেন। আপনার রিগ্রেশন এবং ক্লাসিফিকেশন মেশিন লার্নিং দক্ষতা অনুশীলন করার জন্য এটি একটি তুলনামূলকভাবে পরিষ্কার এবং সহজবোধ্য ডেটাসেট।
ডেটাসেট: কাগল রেড ওয়াইন কোয়ালিটি ডেটাসেট
4. হৃদরোগের পূর্বাভাস
আপনি যদি স্বাস্থ্যসেবা শিল্পে একটি ডেটাসেট অন্বেষণ করতে চান তবে এটি শুরু করার জন্য একটি দুর্দান্ত শিক্ষানবিস-স্তরের ডেটাসেট। এই ডেটাসেটটি CHD (করোনারি হার্ট ডিজিজ) এর 10 বছরের ঝুঁকির পূর্বাভাস দিতে ব্যবহৃত হয়। এই ডেটাসেটে নির্ভরশীল ভেরিয়েবলগুলি হ'ল ডায়াবেটিস, ধূমপান, উচ্চ রক্তচাপ এবং উচ্চ কোলেস্টেরলের মাত্রা সহ হৃদরোগের ঝুঁকির কারণ৷
স্বাধীন পরিবর্তনশীল হল CHD এর 10 বছরের ঝুঁকি। এটি একটি বাইনারি শ্রেণীবিন্যাস সমস্যা, এবং লক্ষ্য পরিবর্তনশীল হয় 0 বা 1-0 রোগীদের জন্য যারা কখনও হৃদরোগ তৈরি করেননি এবং 1 রোগীদের জন্য। আপনি এই ডেটাসেটে কিছু বৈশিষ্ট্য নির্বাচন করতে পারেন যাতে বৈশিষ্ট্যগুলি সনাক্ত করতে পারে যা হার্টের ঝুঁকিতে সবচেয়ে বেশি অবদান রাখে। তারপর, আপনি স্বাধীন ভেরিয়েবলের সাথে একটি শ্রেণীবিভাগ মডেল ফিট করতে পারেন।
এই ডেটাসেটটি অত্যন্ত ভারসাম্যহীন কারণ এই ডেটাসেটের অনেক রোগীই করেছেন না হৃদরোগ বিকাশ। একটি ভারসাম্যহীন ডেটাসেট ওভারস্যাম্পলিং, ওয়েট-টিউনিং বা আন্ডারস্যাম্পলিং এর মতো সঠিক বৈশিষ্ট্য প্রকৌশল কৌশলগুলি ব্যবহার করে পরিচালনা করা দরকার। যদি সঠিকভাবে মোকাবিলা না করা হয়, তাহলে আপনি একটি মডেলের সাথে শেষ হবে যা প্রতিটি ডেটা পয়েন্টের জন্য সংখ্যাগরিষ্ঠ শ্রেণীর ভবিষ্যদ্বাণী করে এবং রোগীদের সনাক্ত করতে পারে না করেছিল হৃদরোগ বিকাশ। আপনার ফিচার ইঞ্জিনিয়ারিং এবং মেশিন লার্নিং দক্ষতা অনুশীলন করার জন্য এটি আপনার জন্য একটি চমৎকার ডেটাসেট।
ডেটাসেট: কাগল হার্ট ডিজিজ ডেটাসেট
5. MNIST ডিজিট শ্রেণীবিভাগ
সার্জারির এমএনআইএসটি ডেটাসেট হল গভীর শিক্ষার ক্ষেত্রে আপনার সোপান। এই ডেটাসেটে 0 থেকে 9 পর্যন্ত হাতে লেখা অঙ্কের গ্রেস্কেল চিত্র রয়েছে। আপনার কাজ হবে একটি গভীর শিক্ষার অ্যালগরিদম ব্যবহার করে অঙ্কটি সনাক্ত করা। এটি দশটি সম্ভাব্য আউটপুট ক্লাস সহ একটি মাল্টি-ক্লাস শ্রেণীবিভাগ সমস্যা। আপনি এই শ্রেণীবিভাগ সম্পাদন করতে একটি CNN (Convolutional Neural Network) ব্যবহার করতে পারেন।
MNIST ডেটাসেট পাইথনের কেরাস লাইব্রেরির মধ্যে তৈরি করা হয়েছে। আপনাকে যা করতে হবে তা হল কেরাস ইনস্টল করা, লাইব্রেরি আমদানি করা এবং ডেটাসেট লোড করা। এই ডেটাসেটে প্রায় 60,000 ছবি রয়েছে যাতে আপনি এই চিত্রগুলির প্রায় 80% প্রশিক্ষণের জন্য এবং আরও 20% পরীক্ষার জন্য ব্যবহার করতে পারেন।
ডেটাসেট: কাগল ডিজিট রিকগনিজার ডেটাসেট
6. টুইটার ডেটার সেন্টিমেন্ট বিশ্লেষণ
কাগল-এ অনেক টুইটার সেন্টিমেন্ট বিশ্লেষণ ডেটাসেট পাওয়া যায়। সবচেয়ে জনপ্রিয় ডেটাসেটগুলির মধ্যে একটিকে সেন্টিমেন্ট140 বলা হয়, এতে 1.6 মিলিয়ন প্রাক-প্রক্রিয়াকৃত টুইট রয়েছে। আপনি যদি অনুভূতি বিশ্লেষণে নতুন হন তবে এটি শুরু করার জন্য এটি একটি দুর্দান্ত ডেটাসেট।
এই টুইটগুলি টীকা করা হয়েছে, এবং লক্ষ্য পরিবর্তনশীল হল সেন্টিমেন্ট। এই কলামের অনন্য মানগুলি হল 0 (নেতিবাচক), 2 (নিরপেক্ষ), এবং 4 (ধনাত্মক)।
এই টুইটগুলিকে প্রি-প্রসেস করার পরে এবং সেগুলিকে ভেক্টরে রূপান্তর করার পরে, আপনি তাদের সম্পর্কিত অনুভূতির সাথে প্রশিক্ষণ দেওয়ার জন্য একটি শ্রেণীবিভাগ মডেল ব্যবহার করতে পারেন৷ আপনি এই কাজের জন্য লজিস্টিক রিগ্রেশন, ডিসিশন ট্রি ক্লাসিফায়ার বা XGBoost ক্লাসিফায়ারের মতো অ্যালগরিদম ব্যবহার করতে পারেন।
আরেকটি বিকল্প হল অনুভূতির ভবিষ্যদ্বাণী নিয়ে আসতে LSTM-এর মতো গভীর শিক্ষার মডেল ব্যবহার করা। যাইহোক, এটি একটি সামান্য বেশি চ্যালেঞ্জিং পদ্ধতি এবং উন্নত প্রকল্প বিভাগে পড়ে।
আপনি এই লেবেলযুক্ত ডেটাসেটটিকে ভবিষ্যতের অনুভূতি বিশ্লেষণের কাজগুলির জন্য একটি ভিত্তি হিসাবে ব্যবহার করতে পারেন।
আপনার যদি এমন কোনো টুইট থাকে যা আপনি সংগ্রহ করতে চান এবং সেন্টিমেন্ট বিশ্লেষণ করতে চান, তাহলে ভবিষ্যতের ভবিষ্যদ্বাণী করার জন্য আপনি সেন্টিমেন্ট140-এ আগে প্রশিক্ষিত একটি মডেল ব্যবহার করতে পারেন।
ডেটাসেট: কাগল সেন্টিমেন্ট140 ডেটাসেট
7. পিমা ভারতীয় ডায়াবেটিস পূর্বাভাস
Pima ইন্ডিয়ান ডায়াবেটিস ডেটাসেট ডায়াবেটিক পরিমাপের ভিত্তিতে রোগীর ডায়াবেটিস আছে কিনা তা ভবিষ্যদ্বাণী করতে ব্যবহৃত হয়।
বিএমআই, বয়স এবং ইনসুলিনের মত পরিবর্তনের উপর ভিত্তি করে মডেলটি রোগীদের ডায়াবেটিসের পূর্বাভাস দেবে। এই ডেটাসেটের নয়টি ভেরিয়েবল রয়েছে — আটটি স্বাধীন ভেরিয়েবল এবং একটি লক্ষ্য পরিবর্তনশীল।
লক্ষ্য পরিবর্তনশীল হল 'ডায়াবেটিস', সুতরাং আপনি ডায়াবেটিসের উপস্থিতির জন্য 1 বা ডায়াবেটিসের অনুপস্থিতির জন্য 0 ভবিষ্যদ্বাণী করবেন।
লজিস্টিক রিগ্রেশন, ডিসিশন ট্রি ক্লাসিফায়ার, বা র্যান্ডম ফরেস্ট ক্লাসিফায়ারের মতো মডেল নিয়ে পরীক্ষা করার জন্য এটি একটি শ্রেণীবিভাগ সমস্যা।
এই ডেটাসেটের সমস্ত স্বাধীন ভেরিয়েবল সাংখ্যিক, তাই আপনার ন্যূনতম বৈশিষ্ট্য প্রকৌশল অভিজ্ঞতা থাকলে এটি দিয়ে শুরু করার জন্য এটি একটি দুর্দান্ত ডেটাসেট।
এটি নতুনদের জন্য খোলা একটি Kaggle ডেটাসেট। অনলাইনে এমন অনেক টিউটোরিয়াল রয়েছে যা আপনাকে পাইথন এবং আর-এ সমাধান কোডিংয়ের মাধ্যমে নিয়ে যায়। এই নোটবুক টিউটোরিয়ালগুলি শিখতে এবং আপনার হাত নোংরা করার একটি দুর্দান্ত উপায় যাতে আপনি আরও জটিল প্রকল্পে যেতে পারেন।
ডেটাসেট: কাগল পিমা ইন্ডিয়ান ডায়াবেটিস ডেটাসেট
8. স্তন ক্যান্সার শ্রেণীবিভাগ
Kaggle-এ স্তন ক্যান্সারের শ্রেণীবিভাগ ডেটাসেট হল আপনার মেশিন লার্নিং এবং AI দক্ষতা অনুশীলন করার আরেকটি চমৎকার উপায়।
বাস্তব জগতে বেশিরভাগ তত্ত্বাবধানে মেশিন লার্নিং সমস্যা হল এই ধরনের শ্রেণীবিন্যাস সমস্যা। স্তন ক্যান্সার সনাক্তকরণে একটি মূল চ্যালেঞ্জ হল সৌম্য (ক্যান্সারবিহীন) এবং ম্যালিগন্যান্ট (ক্যান্সারযুক্ত) টিউমারের মধ্যে পার্থক্য করতে না পারা। ডেটাসেটে টিউমারের "ব্যাসার্ধ_মান" এবং "ক্ষেত্র_মান" এর মত ভেরিয়েবল রয়েছে এবং টিউমার ক্যান্সারযুক্ত কিনা বা না হলে এই বৈশিষ্ট্যগুলির উপর ভিত্তি করে আপনাকে শ্রেণীবদ্ধ করতে হবে। এই ডেটাসেটের সাথে কাজ করা তুলনামূলকভাবে সহজ কারণ কোনও উল্লেখযোগ্য ডেটা প্রাক-প্রসেসিং করার প্রয়োজন নেই। এটি একটি সু-ভারসাম্যযুক্ত ডেটাসেট, যা আপনার কাজকে আরও পরিচালনাযোগ্য করে তোলে কারণ আপনাকে বেশি বৈশিষ্ট্য প্রকৌশল করার প্রয়োজন নেই।
এই ডেটাসেটে একটি সাধারণ লজিস্টিক রিগ্রেশন ক্লাসিফায়ারকে প্রশিক্ষণ দেওয়া আপনাকে 0.90 পর্যন্ত নির্ভুলতা দিতে পারে।
ডেটাসেট: Kaggle স্তন ক্যান্সার শ্রেণীবিভাগ ডেটাসেট
9. TMDB বক্স অফিস পূর্বাভাস
এই কাগল ডেটাসেট আপনার রিগ্রেশন দক্ষতা অনুশীলন করার একটি দুর্দান্ত উপায়। এটি প্রায় 7000টি চলচ্চিত্র নিয়ে গঠিত এবং চলচ্চিত্রের আয়ের পূর্বাভাস দিতে আপনাকে উপস্থিত ভেরিয়েবল ব্যবহার করতে হবে।
উপস্থিত ডেটা পয়েন্টগুলির মধ্যে রয়েছে কাস্ট, ক্রু, বাজেট, ভাষা এবং প্রকাশের তারিখ। ডেটাসেটে 23টি ভেরিয়েবল রয়েছে, যার মধ্যে একটি হল লক্ষ্য পরিবর্তনশীল।
একটি মৌলিক রৈখিক রিগ্রেশন মডেল আপনাকে 0.60 এর বেশি একটি R-স্কোয়ার দিতে পারে, তাই আপনি এটিকে আপনার বেসলাইন ভবিষ্যদ্বাণী মডেল হিসাবে ব্যবহার করতে পারেন। XGBoost রিগ্রেশন বা হালকা GBM এর মত কৌশল ব্যবহার করে এই স্কোরকে হারানোর চেষ্টা করুন।
এই ডেটাসেটটি আগেরটির তুলনায় কিছুটা জটিল কারণ কিছু কলামে নেস্টেড অভিধানে ডেটা রয়েছে৷ একটি মডেলকে প্রশিক্ষণের জন্য একটি ব্যবহারযোগ্য বিন্যাসে এই ডেটা বের করার জন্য আপনাকে কিছু অতিরিক্ত প্রাক-প্রক্রিয়াকরণ করতে হবে।
রাজস্ব পূর্বাভাস আপনার পোর্টফোলিওতে প্রদর্শন করার জন্য একটি দুর্দান্ত প্রকল্প, কারণ এটি চলচ্চিত্র শিল্পের বাইরে বিভিন্ন ডোমেনে ব্যবসায়িক মূল্য প্রদান করে।
ডেটাসেট: Kaggle TMDB বক্স অফিস ভবিষ্যদ্বাণী ডেটাসেট
10. পাইথনে গ্রাহক বিভাজন
Kaggle-এ গ্রাহক সেগমেন্টেশন ডেটাসেট হল তত্ত্বাবধানহীন মেশিন লার্নিং শুরু করার একটি দুর্দান্ত উপায়। এই ডেটাসেটে গ্রাহকের বয়স, লিঙ্গ, বার্ষিক আয় এবং খরচের স্কোরের মতো বিবরণ থাকে।
গ্রাহক বিভাগ তৈরি করতে আপনাকে এই ভেরিয়েবলগুলি ব্যবহার করতে হবে। একই রকমের গ্রাহকদের একই ক্লাস্টারে গোষ্ঠীভুক্ত করা উচিত। আপনি এই কাজের জন্য K-Means ক্লাস্টারিং বা হায়ারার্কিকাল ক্লাস্টারিংয়ের মতো অ্যালগরিদম ব্যবহার করতে পারেন। গ্রাহক বিভাজন মডেল ব্যবসার মান প্রদান করতে পারে।
কোম্পানিগুলি প্রায়ই তাদের গ্রাহকদের আলাদা করতে চায় প্রতিটি গ্রাহকের ধরণের জন্য বিভিন্ন বিপণন কৌশল নিয়ে আসতে।
এই ডেটাসেটের প্রধান লক্ষ্যগুলির মধ্যে রয়েছে:
- মেশিন লার্নিং কৌশল ব্যবহার করে গ্রাহক বিভাজন অর্জন
- বিভিন্ন বিপণন কৌশলের জন্য আপনার লক্ষ্য গ্রাহকদের সনাক্ত করুন
- বাস্তব জগতে বিপণন কৌশল কিভাবে কাজ করে তা বুঝুন
এই কাজের জন্য একটি ক্লাস্টারিং মডেল তৈরি করা আপনার পোর্টফোলিওকে আলাদা করতে সাহায্য করতে পারে এবং আপনি যদি মার্কেটিং শিল্পে AI-সম্পর্কিত চাকরি পেতে চান তবে সেগমেন্টেশন একটি দুর্দান্ত দক্ষতা।
ডেটাসেট: কাগল মল গ্রাহক সেগমেন্টেশন ডেটাসেট
আপনার জীবনবৃত্তান্তের জন্য মধ্যবর্তী/উন্নত স্তরের মেশিন লার্নিং প্রকল্প
একবার আপনি উপরে তালিকাভুক্তগুলির মতো সাধারণ মেশিন লার্নিং প্রকল্পগুলিতে কাজ করা শেষ করলে, আপনি আরও চ্যালেঞ্জিং প্রকল্পগুলিতে যেতে পারেন।
1. বিক্রয় পূর্বাভাস
সময়-সিরিজের পূর্বাভাস হল একটি মেশিন লার্নিং কৌশল যা শিল্পে প্রায়শই ব্যবহৃত হয়। ভবিষ্যত বিক্রয়ের পূর্বাভাস দেওয়ার জন্য অতীতের ডেটা ব্যবহারে প্রচুর সংখ্যক ব্যবসায়িক ব্যবহারের ক্ষেত্রে রয়েছে। কাগল ডিমান্ড ফোরকাস্টিং ডেটাসেটটি এই প্রকল্পের অনুশীলন করতে ব্যবহার করা যেতে পারে।
এই ডেটাসেটে 5 বছরের বিক্রয় ডেটা রয়েছে এবং আপনাকে পরবর্তী তিন মাসের জন্য বিক্রয়ের পূর্বাভাস দিতে হবে। ডেটাসেটে তালিকাভুক্ত দশটি ভিন্ন দোকান রয়েছে এবং প্রতিটি দোকানে 50টি আইটেম রয়েছে।
বিক্রয়ের পূর্বাভাস দিতে, আপনি বিভিন্ন পদ্ধতি চেষ্টা করতে পারেন — ARIMA, ভেক্টর অটোরিগ্রেশন বা গভীর শিক্ষা। এই প্রকল্পের জন্য আপনি একটি পদ্ধতি ব্যবহার করতে পারেন তা হল প্রতি মাসে বিক্রয় বৃদ্ধি পরিমাপ করা এবং তা রেকর্ড করা। তারপরে, আগের মাসের এবং বর্তমান মাসের বিক্রয়ের মধ্যে পার্থক্যের উপর মডেলটি তৈরি করুন। ছুটির দিন এবং ঋতুর মতো বিষয়গুলি বিবেচনায় নেওয়া আপনার মেশিন লার্নিং মডেলের কার্যকারিতা উন্নত করতে পারে।
ডেটাসেট: Kaggle দোকান আইটেম চাহিদা পূর্বাভাস
2. গ্রাহক পরিষেবা চ্যাটবট
একটি গ্রাহক পরিষেবা চ্যাটবট গ্রাহকদের উত্তর দিতে AI এবং মেশিন লার্নিং কৌশল ব্যবহার করে, একজন মানব প্রতিনিধির ভূমিকা গ্রহণ করে। একটি চ্যাটবট গ্রাহকের চাহিদা মেটাতে সহজ প্রশ্নের উত্তর দিতে সক্ষম হওয়া উচিত।
বর্তমানে তিন ধরণের চ্যাটবট রয়েছে যা আপনি তৈরি করতে পারেন:
- নিয়ম-ভিত্তিক চ্যাটবট - এই চ্যাটবটগুলি বুদ্ধিমান নয়। তাদের পূর্ব-নির্ধারিত নিয়মের একটি সেট খাওয়ানো হয় এবং শুধুমাত্র এই নিয়মগুলির উপর ভিত্তি করে ব্যবহারকারীদের উত্তর দেওয়া হয়। কিছু চ্যাটবটকে পূর্বনির্ধারিত প্রশ্ন ও উত্তরের সেটও দেওয়া হয় এবং এই ডোমেনের বাইরে থাকা প্রশ্নের উত্তর দিতে পারে না।
- স্বাধীন চ্যাটবট - স্বাধীন চ্যাটবটগুলি ব্যবহারকারীর অনুরোধ প্রক্রিয়া ও বিশ্লেষণ করতে এবং সেই অনুযায়ী প্রতিক্রিয়া প্রদান করতে মেশিন লার্নিং ব্যবহার করে।
- NLP চ্যাটবটস — এই চ্যাটবটগুলি শব্দের প্যাটার্ন বুঝতে পারে এবং বিভিন্ন শব্দ সংমিশ্রণের মধ্যে পার্থক্য করতে পারে। তারা তিনটি চ্যাটবট প্রকারের মধ্যে সবচেয়ে উন্নত, কারণ তারা প্রশিক্ষিত শব্দ প্যাটার্নের উপর ভিত্তি করে পরবর্তীতে কী বলবে তা নিয়ে আসতে পারে।
একটি এনএলপি চ্যাটবট একটি আকর্ষণীয় মেশিন লার্নিং প্রকল্প ধারণা। আপনার মডেলকে প্রশিক্ষিত করার জন্য আপনার একটি বিদ্যমান শব্দ সংগ্রহের প্রয়োজন হবে এবং আপনি এটি করার জন্য সহজেই পাইথন লাইব্রেরিগুলি খুঁজে পেতে পারেন। আপনি আপনার মডেলকে প্রশিক্ষণ দিতে চান এমন প্রশ্ন এবং উত্তর জোড়ার তালিকা সহ আপনার একটি পূর্ব-সংজ্ঞায়িত অভিধান থাকতে পারে।
3. ওয়াইল্ডলাইফ অবজেক্ট ডিটেকশন সিস্টেম
আপনি যদি ঘন ঘন বন্য-প্রাণী দেখা যায় এমন একটি এলাকায় বাস করেন, তাহলে আপনার এলাকায় তাদের উপস্থিতি শনাক্ত করার জন্য একটি বস্তু সনাক্তকরণ ব্যবস্থা প্রয়োগ করা সহায়ক। এই ধরনের একটি সিস্টেম তৈরি করতে এই পদক্ষেপগুলি অনুসরণ করুন:
- আপনি যে এলাকায় নিরীক্ষণ করতে চান সেখানে ক্যামেরা ইনস্টল করুন।
- সমস্ত ভিডিও ফুটেজ ডাউনলোড করুন এবং সেগুলি সংরক্ষণ করুন।
- ইনকামিং ইমেজ বিশ্লেষণ এবং বন্য প্রাণী সনাক্ত করার জন্য একটি পাইথন অ্যাপ্লিকেশন তৈরি করুন।
মাইক্রোসফট বন্যপ্রাণী ক্যামেরা থেকে সংগৃহীত ডেটা ব্যবহার করে একটি ইমেজ রিকগনিশন API তৈরি করেছে। তারা এই উদ্দেশ্যে একটি ওপেন সোর্স প্রাক-প্রশিক্ষিত মডেল প্রকাশ করেছে যাকে মেগাডিটেক্টর বলা হয়।
সংগৃহীত ছবি থেকে বন্য প্রাণী শনাক্ত করতে আপনি আপনার পাইথন অ্যাপ্লিকেশনে এই প্রাক-প্রশিক্ষিত মডেলটি ব্যবহার করতে পারেন। এটি এখন পর্যন্ত উল্লিখিত সবচেয়ে উত্তেজনাপূর্ণ এমএল প্রকল্পগুলির মধ্যে একটি এবং এই উদ্দেশ্যে একটি প্রাক-প্রশিক্ষিত মডেলের উপলব্ধতার কারণে এটি বাস্তবায়ন করা বেশ সহজ।
এপিআই: মেগাডিটেক্টর
4. Spotify সঙ্গীত সুপারিশকারী সিস্টেম
Spotify তার ব্যবহারকারীদের সঙ্গীত সুপারিশ করতে AI ব্যবহার করে। আপনি Spotify-এ সর্বজনীনভাবে উপলব্ধ ডেটার উপর ভিত্তি করে একটি সুপারিশকারী সিস্টেম তৈরি করার চেষ্টা করতে পারেন।
Spotify-এর একটি API রয়েছে যা আপনি অডিও ডেটা পুনরুদ্ধার করতে ব্যবহার করতে পারেন — আপনি মুক্তির বছর, কী, জনপ্রিয়তা এবং শিল্পীর মতো বৈশিষ্ট্যগুলি খুঁজে পেতে পারেন। পাইথনে এই API অ্যাক্সেস করতে, আপনি Spotipy নামে একটি লাইব্রেরি ব্যবহার করতে পারেন।
আপনি Kaggle-এ Spotify ডেটাসেট ব্যবহার করতে পারেন যাতে প্রায় 600K সারি রয়েছে। এই ডেটাসেটগুলি ব্যবহার করে, আপনি প্রতিটি ব্যবহারকারীর প্রিয় সঙ্গীতশিল্পীর জন্য সেরা বিকল্পের পরামর্শ দিতে পারেন৷ এছাড়াও আপনি প্রতিটি ব্যবহারকারীর পছন্দের বিষয়বস্তু এবং জেনারের উপর ভিত্তি করে গানের সুপারিশ নিয়ে আসতে পারেন।
এই সুপারিশকারী সিস্টেম কে-মিনস ক্লাস্টারিং ব্যবহার করে তৈরি করা যেতে পারে — অনুরূপ ডেটা পয়েন্টগুলিকে গোষ্ঠীভুক্ত করা হবে। আপনি শেষ-ব্যবহারকারীর কাছে তাদের মধ্যে একটি ন্যূনতম ইন্ট্রা-ক্লাস্টার দূরত্ব সহ গানগুলি সুপারিশ করতে পারেন৷
একবার আপনি সুপারিশকারী সিস্টেম তৈরি করার পরে, আপনি এটিকে একটি সাধারণ পাইথন অ্যাপে পরিণত করতে এবং এটি স্থাপন করতে পারেন। আপনি Spotify-এ ব্যবহারকারীদের তাদের পছন্দের গানগুলি লিখতে পারেন, তারপরে স্ক্রিনে আপনার মডেল সুপারিশগুলি প্রদর্শন করতে পারেন যা তাদের উপভোগ করা গানগুলির সাথে সর্বোচ্চ মিল রয়েছে৷
ডেটাসেট: Kaggle Spotify ডেটাসেট
5. বাজারের ঝুড়ি বিশ্লেষণ
মার্কেট বাস্কেট অ্যানালাইসিস হল একটি জনপ্রিয় কৌশল যা খুচরা বিক্রেতাদের দ্বারা ব্যবহৃত আইটেমগুলিকে সনাক্ত করতে ব্যবহৃত হয় যা একসাথে বিক্রি করা যেতে পারে।
উদাহরণ স্বরূপ:
কয়েক বছর আগে, একজন গবেষণা বিশ্লেষক বিয়ার এবং ডায়াপার বিক্রির মধ্যে একটি সম্পর্ক চিহ্নিত করেছিলেন। বেশিরভাগ সময়, যখনই কোনও গ্রাহক বিয়ার কিনতে দোকানে যেতেন, তারা একসাথে ডায়াপারও কিনেছিলেন।
এই কারণে, বিক্রয় বাড়ানোর বিপণন কৌশল হিসাবে দোকানগুলি একই আইলে বিয়ার এবং ডায়াপার একসাথে বিক্রি করা শুরু করে। এবং এটা কাজ করে.
এটা ধরে নেওয়া হয়েছিল যে বিয়ার এবং ডায়াপারগুলির মধ্যে একটি উচ্চ সম্পর্ক রয়েছে কারণ পুরুষরা প্রায়শই সেগুলি একসাথে কিনেছিল। পুরুষরা তাদের পরিবারের জন্য (ডাইপার সহ) অন্যান্য গৃহস্থালির আইটেম সহ একটি বিয়ার কিনতে দোকানে হাঁটতেন। এটি একটি অসম্ভব পারস্পরিক সম্পর্ক বলে মনে হচ্ছে, কিন্তু এটি ঘটেছে।
মার্কেট বাস্কেট বিশ্লেষণ কোম্পানিগুলিকে প্রায়শই একসাথে কেনা আইটেমগুলির মধ্যে লুকানো সম্পর্ক সনাক্ত করতে সাহায্য করতে পারে। এই স্টোরগুলি তাদের আইটেমগুলিকে এমনভাবে অবস্থান করতে পারে যা লোকেদের তাদের সহজে খুঁজে পেতে দেয়।
আপনি আপনার মডেল তৈরি এবং প্রশিক্ষণের জন্য Kaggle-এ মার্কেট বাস্কেট অপ্টিমাইজেশন ডেটাসেট ব্যবহার করতে পারেন। মার্কেট বাস্কেট বিশ্লেষণ করার জন্য সবচেয়ে বেশি ব্যবহৃত অ্যালগরিদম হল অ্যাপরিওরি অ্যালগরিদম।
ডেটাসেট: কাগল মার্কেট বাস্কেট অপ্টিমাইজেশান ডেটাসেট
6. NYC ট্যাক্সি ট্রিপের সময়কাল
ডেটাসেটের ভেরিয়েবল রয়েছে যাতে ট্যাক্সি ট্রিপের শুরু এবং শেষ স্থানাঙ্ক, সময় এবং যাত্রীর সংখ্যা অন্তর্ভুক্ত থাকে। এই ML প্রকল্পের লক্ষ্য হল এই সমস্ত ভেরিয়েবলের সাহায্যে ভ্রমণের সময়কালের পূর্বাভাস দেওয়া। এটি একটি রিগ্রেশন সমস্যা।
সময় এবং স্থানাঙ্কের মতো ভেরিয়েবলগুলিকে যথাযথভাবে প্রাক-প্রক্রিয়াজাত করা এবং একটি বোধগম্য বিন্যাসে রূপান্তরিত করা দরকার। এই প্রকল্পটি মনে হয় হিসাবে সহজবোধ্য নয়. এই ডেটাসেটে কিছু আউটলায়ার রয়েছে যা ভবিষ্যদ্বাণীকে আরও জটিল করে তোলে, তাই আপনাকে বৈশিষ্ট্য প্রকৌশল কৌশলগুলির সাথে এটি পরিচালনা করতে হবে।
এই NYC ট্যাক্সি ট্রিপ কাগল প্রতিযোগিতার মূল্যায়নের মানদণ্ড হল RMSLE বা রুট মিন স্কোয়ার্ড লগ ত্রুটি৷ Kaggle-এ শীর্ষ জমাটি 0.29 এর একটি RMSLE স্কোর পেয়েছে, এবং Kaggle-এর বেসলাইন মডেলের একটি RMSLE 0.89 রয়েছে।
আপনি এই Kaggle প্রকল্পের সমাধান করার জন্য যেকোনো রিগ্রেশন অ্যালগরিদম ব্যবহার করতে পারেন, কিন্তু এই চ্যালেঞ্জের সর্বোচ্চ পারফরম্যান্সকারী প্রতিযোগীরা হয় গ্রেডিয়েন্ট বুস্টিং মডেল বা গভীর শিক্ষার কৌশল ব্যবহার করেছেন।
ডেটাসেট: Kaggle NYC ট্যাক্সি ট্রিপ সময়কাল ডেটাসেট
7. রিয়েল-টাইম স্প্যাম সনাক্তকরণ
এই প্রকল্পে, আপনি স্প্যাম (অবৈধ) এবং হ্যাম (বৈধ) বার্তাগুলির মধ্যে পার্থক্য করতে মেশিন লার্নিং কৌশলগুলি ব্যবহার করতে পারেন৷
এটি অর্জন করতে, আপনি Kaggle SMS স্প্যাম সংগ্রহ ডেটাসেট ব্যবহার করতে পারেন৷ এই ডেটাসেটে আনুমানিক 5K বার্তাগুলির একটি সেট রয়েছে যেগুলিকে স্প্যাম বা হ্যাম হিসাবে লেবেল করা হয়েছে৷
আপনি একটি রিয়েল-টাইম স্প্যাম সনাক্তকরণ সিস্টেম তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি নিতে পারেন:
- একটি মেশিন লার্নিং মডেল প্রশিক্ষণের জন্য Kaggle এর SMS স্প্যাম সংগ্রহ ডেটাসেট ব্যবহার করুন৷
- পাইথনে একটি সাধারণ চ্যাট-রুম সার্ভার তৈরি করুন।
- আপনার চ্যাট-রুম সার্ভারে মেশিন লার্নিং মডেলটি স্থাপন করুন এবং নিশ্চিত করুন যে সমস্ত আগত ট্র্যাফিক মডেলের মধ্য দিয়ে যায়।
- শুধুমাত্র হ্যাম হিসাবে শ্রেণীবদ্ধ করা হলেই বার্তাগুলিকে যেতে দিন৷ সেগুলি স্প্যাম হলে, পরিবর্তে একটি ত্রুটি বার্তা ফেরত দিন৷
মেশিন লার্নিং মডেল তৈরি করতে, আপনাকে প্রথমে কাগলের এসএমএস স্প্যাম সংগ্রহ ডেটাসেটে উপস্থিত পাঠ্য বার্তাগুলিকে প্রাক-প্রক্রিয়া করতে হবে। তারপর, এই বার্তাগুলিকে শব্দের ব্যাগে রূপান্তর করুন যাতে সেগুলি ভবিষ্যদ্বাণীর জন্য আপনার শ্রেণিবিন্যাস মডেলে সহজেই পাস করা যায়।
ডেটাসেট: কাগল এসএমএস স্প্যাম সংগ্রহ ডেটাসেট
8. Myers-Briggs পার্সোনালিটি প্রেডিকশন অ্যাপ
আপনি ব্যবহারকারীর ব্যক্তিত্বের ধরণ সম্পর্কে পূর্বাভাস দিতে একটি অ্যাপ তৈরি করতে পারেন যা তারা বলে।
Myers-Briggs টাইপ নির্দেশক ব্যক্তিদের 16টি ভিন্ন ব্যক্তিত্বের প্রকারে শ্রেণীবদ্ধ করে। এটি বিশ্বের অন্যতম জনপ্রিয় ব্যক্তিত্ব পরীক্ষা।
আপনি যদি ইন্টারনেটে আপনার ব্যক্তিত্বের ধরন খুঁজে বের করার চেষ্টা করেন তবে আপনি অনেক অনলাইন কুইজ পাবেন। প্রায় 20-30টি প্রশ্নের উত্তর দেওয়ার পরে, আপনাকে একটি ব্যক্তিত্বের ধরণে নিয়োগ করা হবে।
যাইহোক, এই প্রজেক্টে, আপনি মেশিন লার্নিং ব্যবহার করে শুধুমাত্র একটি বাক্যের উপর ভিত্তি করে যে কারো ব্যক্তিত্বের ধরণ অনুমান করতে পারেন।
এটি অর্জন করতে আপনি যে পদক্ষেপগুলি নিতে পারেন তা এখানে রয়েছে:
- একটি মাল্টি-ক্লাস ক্লাসিফিকেশন মডেল তৈরি করুন এবং কাগলের Myers-Briggs ডেটাসেটে প্রশিক্ষণ দিন। এতে ডেটা প্রাক-প্রক্রিয়াকরণ (স্টপ-শব্দ এবং অপ্রয়োজনীয় অক্ষর অপসারণ) এবং কিছু বৈশিষ্ট্য প্রকৌশল জড়িত। আপনি এই উদ্দেশ্যে লজিস্টিক রিগ্রেশনের মতো একটি অগভীর শিক্ষার মডেল বা LSTM-এর মতো একটি গভীর শিক্ষার মডেল ব্যবহার করতে পারেন।
- আপনি একটি অ্যাপ্লিকেশন তৈরি করতে পারেন যা ব্যবহারকারীদের তাদের পছন্দের যেকোনো বাক্য লিখতে দেয়।
- আপনার মেশিন লার্নিং মডেলের ওজন সংরক্ষণ করুন এবং আপনার অ্যাপের সাথে মডেলটিকে একীভূত করুন। শেষ-ব্যবহারকারী একটি শব্দ প্রবেশ করার পরে, মডেল একটি ভবিষ্যদ্বাণী করার পরে পর্দায় তাদের ব্যক্তিত্বের ধরন প্রদর্শন করুন৷
ডেটাসেট: কাগল এমবিটিআই টাইপ ডেটাসেট
9. মুড রিকগনিশন সিস্টেম + সুপারিশকারী সিস্টেম
আপনি কি কখনও দুঃখ পেয়েছেন এবং অনুভব করেছেন যে আপনাকে উত্সাহিত করার জন্য আপনাকে মজার কিছু দেখতে হবে? অথবা আপনি কি কখনও এতটা হতাশ বোধ করেছেন যে আপনার শান্ত হওয়া এবং আরামদায়ক কিছু দেখার প্রয়োজন?
এই প্রকল্পটি দুটি ছোট প্রকল্পের সংমিশ্রণ।
আপনি একটি অ্যাপ তৈরি করতে পারেন যা লাইভ ওয়েব ফুটেজ এবং ব্যবহারকারীর অভিব্যক্তির উপর ভিত্তি করে একটি চলচ্চিত্রের পরামর্শের উপর ভিত্তি করে ব্যবহারকারীর মেজাজ সনাক্ত করে।
এটি তৈরি করতে, আপনি নিম্নলিখিত পদক্ষেপগুলি নিতে পারেন:
- এমন একটি অ্যাপ তৈরি করুন যা একটি লাইভ ভিডিও ফিড নিতে পারে।
- ভিডিও ফিডে মুখ এবং আবেগ সনাক্ত করতে পাইথনের মুখ শনাক্তকরণ API ব্যবহার করুন৷
- এই আবেগগুলিকে বিভিন্ন বিভাগে শ্রেণীবদ্ধ করার পরে, সুপারিশকারী সিস্টেম তৈরি করা শুরু করুন। এটি প্রতিটি আবেগের জন্য হার্ডকোড করা মানগুলির একটি সেট হতে পারে, যার অর্থ আপনাকে সুপারিশের জন্য মেশিন লার্নিং জড়িত করার দরকার নেই৷
- একবার আপনি অ্যাপটি তৈরি করা হয়ে গেলে, আপনি এটিকে হেরোকু, ড্যাশ বা একটি ওয়েব সার্ভারে স্থাপন করতে পারেন।
এপিআই: ফেস রিকগনিশন API
10. YouTube মন্তব্য অনুভূতি বিশ্লেষণ
এই প্রকল্পে, আপনি জনপ্রিয় YouTubers এর সামগ্রিক অনুভূতি বিশ্লেষণ করে একটি ড্যাশবোর্ড তৈরি করতে পারেন।
2 বিলিয়নেরও বেশি ব্যবহারকারী মাসে অন্তত একবার YouTube ভিডিও দেখেন। জনপ্রিয় YouTubers তাদের বিষয়বস্তু দিয়ে কয়েক বিলিয়ন ভিউ অর্জন করে। যাইহোক, এই প্রভাবশালীদের অনেকেই অতীতে বিতর্কের কারণে আগুনের মুখে পড়েছেন এবং জনসাধারণের ধারণা ক্রমাগত পরিবর্তিত হচ্ছে।
আপনি একটি অনুভূতি বিশ্লেষণ মডেল তৈরি করতে পারেন এবং সময়ের সাথে সেলিব্রিটিদের আশেপাশে অনুভূতিগুলি কল্পনা করার জন্য একটি ড্যাশবোর্ড তৈরি করতে পারেন।
এটি তৈরি করতে, আপনি নিম্নলিখিত পদক্ষেপগুলি নিতে পারেন:
- আপনি বিশ্লেষণ করতে চান এমন YouTubers দ্বারা ভিডিওগুলির মন্তব্যগুলি স্ক্র্যাপ করুন৷
- প্রতিটি মন্তব্যে ভবিষ্যদ্বাণী করতে একটি প্রাক-প্রশিক্ষিত অনুভূতি বিশ্লেষণ মডেল ব্যবহার করুন।
- একটি ড্যাশবোর্ডে মডেলের ভবিষ্যদ্বাণীগুলি কল্পনা করুন৷ এমনকি আপনি ড্যাশ (পাইথন) বা চকচকে (আর) এর মতো লাইব্রেরি ব্যবহার করে একটি ড্যাশবোর্ড অ্যাপ তৈরি করতে পারেন।
- আপনি ব্যবহারকারীদের সময় ফ্রেম, YouTuber এর নাম এবং ভিডিও জেনার দ্বারা অনুভূতি ফিল্টার করার অনুমতি দিয়ে ড্যাশবোর্ডটিকে ইন্টারেক্টিভ করতে পারেন।
এপিআই: YouTube মন্তব্য স্ক্র্যাপার
সারাংশ
মেশিন লার্নিং শিল্প বড় এবং সুযোগ পূর্ণ। আপনি যদি কোনও আনুষ্ঠানিক শিক্ষাগত পটভূমি ছাড়াই শিল্পে প্রবেশ করতে চান, তবে কাজটি করার জন্য আপনার প্রয়োজনীয় দক্ষতা রয়েছে তা দেখানোর সর্বোত্তম উপায় হল প্রকল্পগুলির মাধ্যমে।
উপরে তালিকাভুক্ত বেশিরভাগ প্রকল্পের মেশিন লার্নিং দিকটি বেশ সহজ। মেশিন লার্নিং এর গণতন্ত্রীকরণের কারণে, মডেল বিল্ডিং প্রক্রিয়াটি প্রাক-প্রশিক্ষিত মডেল এবং API-এর মাধ্যমে সহজেই অর্জন করা যেতে পারে।
কেরাস এবং ফাস্টএআই-এর মতো ওপেন সোর্স কৃত্রিম বুদ্ধিমত্তা প্রকল্পগুলিও মডেল তৈরির প্রক্রিয়াটিকে গতিশীল করতে সাহায্য করেছে। এই মেশিন লার্নিং এর চতুর অংশ এবং তথ্য বিজ্ঞান প্রকল্প ডেটা সংগ্রহ, প্রাক-প্রক্রিয়াকরণ এবং স্থাপনা। আপনি যদি মেশিন লার্নিংয়ে চাকরি করেন, তবে বেশিরভাগ অ্যালগরিদম তৈরি করা বেশ সহজ হবে। একটি বিক্রয় পূর্বাভাস মডেল তৈরি করতে মাত্র এক বা দুই দিন সময় লাগবে। আপনি আপনার বেশিরভাগ সময় ব্যয় করবেন উপযুক্ত ডেটা উত্সগুলি খুঁজে পেতে এবং ব্যবসায়িক মূল্য অর্জনের জন্য আপনার মডেলগুলিকে উত্পাদন করতে।
মূল। অনুমতি নিয়ে পোস্ট করা।
সম্পর্কিত:
সূত্র: https://www.kdnuggets.com/2021/09/20-machine-learning-projects-hired.html
- "
- &
- 000
- 2021
- 9
- প্রবেশ
- হিসাব
- অতিরিক্ত
- AI
- এলকোহল
- অ্যালগরিদম
- আলগোরিদিম
- সব
- অনুমতি
- বিশ্লেষণ
- বিশ্লেষক
- প্রাণী
- API
- API গুলি
- অ্যাপ্লিকেশন
- আবেদন
- অ্যাপস
- এলাকায়
- কাছাকাছি
- কৃত্রিম বুদ্ধিমত্তা
- শিল্পী
- অডিও
- অটোমেটেড
- উপস্থিতি
- শব্দ ব্যাগ
- বেসলাইন
- মূলতত্ব
- বিয়ার
- সর্বোত্তম
- বিলিয়ন
- রক্ত
- boosting
- বক্স
- বক্স অফিস
- স্তন ক্যান্সার
- নির্মাণ করা
- ভবন
- ব্যবসায়
- ব্যবসা
- কেনা
- ক্যামেরা
- কর্কটরাশি
- মামলা
- সেলিব্রিটি
- চ্যালেঞ্জ
- chatbot
- chatbots
- শ্রেণীবিন্যাস
- সিএনএন
- কোডিং
- স্তম্ভ
- মন্তব্য
- কোম্পানি
- প্রতিযোগিতা
- প্রতিযোগীদের
- একত্রীকরণের
- বিষয়বস্তু
- কনভোলশনাল নিউরাল নেটওয়ার্ক
- দম্পতি
- গ্রাহক সেবা
- গ্রাহকদের
- হানাহানি
- ড্যাশবোর্ড
- উপাত্ত
- তথ্য বিজ্ঞান
- তারিখগুলি
- দিন
- লেনদেন
- সিদ্ধান্ত গাছ
- গভীর জ্ঞানার্জন
- চাহিদা
- চাহিদার পূর্বাভাস
- সনাক্তকরণ
- ডায়াবেটিস
- DID
- অঙ্ক
- ডিজিটের
- রোগ
- দূরত্ব
- ডোমেইনের
- শিক্ষাবিষয়ক
- আবেগ
- প্রকৌশল
- প্রবেশ
- সীমা অতিক্রম করা
- অভিজ্ঞতা
- পরীক্ষা
- মুখ
- মুখ স্বীকৃতি
- মুখ
- পরিবার
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- প্রতিপালিত
- চলচ্চিত্র
- আগুন
- প্রথম
- ফিট
- অনুসরণ করা
- বিন্যাস
- সম্পূর্ণ
- হাস্যকর
- ভবিষ্যৎ
- লিঙ্গ
- গোল
- ভাল
- গ্রেস্কেল
- মহান
- স্বাস্থ্যসেবা
- স্বাস্থ্যসেবা শিল্প
- উচ্চ
- ভাড়া
- ছুটির
- ঘর
- পরিবার
- কিভাবে
- HTTPS দ্বারা
- শত শত
- ধারণা
- শনাক্ত
- সনাক্ত করা
- ভাবমূর্তি
- চিত্র স্বীকৃতি
- সুদ্ধ
- আয়
- বৃদ্ধি
- শিল্প
- শিল্প
- প্রভাব বিস্তারকারী
- তথ্য
- বুদ্ধিমত্তা
- ইন্টারেক্টিভ
- Internet
- IT
- কাজ
- জবস
- keras
- চাবি
- ভাষাসমূহ
- বড়
- শিখতে
- জ্ঞানী
- শিক্ষা
- উচ্চতা
- লাইব্রেরি
- আলো
- LINK
- লিঙ্কডইন
- তালিকা
- বোঝা
- দীর্ঘ
- মেশিন লার্নিং
- যন্ত্র শেখার কৌশল
- সংখ্যাগুরু
- মেকিং
- বাজার
- Marketing
- বিপণন শিল্প
- মাপ
- মধ্যম
- পুরুষদের
- মাইক্রোসফট
- মিলিয়ন
- ML
- মডেল
- মাসের
- মেজাজ
- সবচেয়ে জনপ্রিয়
- পদক্ষেপ
- চলচ্চিত্র
- চলচ্চিত্র
- সঙ্গীত
- সুরকার
- নেটওয়ার্ক
- নিউরাল
- স্নায়বিক নেটওয়ার্ক
- সংবাদ
- NLP
- এনওয়াইসি
- বস্তু সনাক্তকরণ
- অর্পণ
- অনলাইন
- অনলাইন কোর্স
- খোলা
- সুযোগ
- অন্যান্য
- দৃষ্টান্ত
- রোগীদের
- সম্প্রদায়
- কর্মক্ষমতা
- ব্যক্তিত্ব
- জনপ্রিয়
- দফতর
- ভবিষ্যদ্বাণী
- ভবিষ্যতবাণী
- বর্তমান
- চাপ
- মূল্য
- মূল্য পূর্বাভাস
- মূল্য
- উত্পাদনের
- প্রমোদ
- পেশাদার
- কার্যক্রম
- প্রকল্প
- প্রকল্প
- প্রকাশ্য
- পাইথন
- গুণ
- বাস্তব জগতে
- প্রকৃত সময়
- প্রত্যাগতি
- গবেষণা
- ফলাফল
- খুচরা বিক্রেতাদের
- রাজস্ব
- ঝুঁকি
- ঝুঁকির কারণ
- নিয়ম
- বিক্রয়
- বিজ্ঞান
- বিজ্ঞানীরা
- স্ক্রিন
- অনুভূতি
- সেট
- পরিবর্তন
- সহজ
- দক্ষতা
- খুদেবার্তা
- So
- বিক্রীত
- সমাধান
- স্প্যাম
- স্পীড
- ব্যয় করা
- খরচ
- Spotify এর
- শুরু
- শুরু
- দোকান
- দোকান
- খবর
- কৌশল
- পদ্ধতি
- লক্ষ্য
- পরীক্ষামূলক
- পরীক্ষা
- অধিকার
- বিশ্ব
- সময়
- শীর্ষ
- ট্রাফিক
- প্রশিক্ষণ
- টিউটোরিয়াল
- টুইটার
- ব্যবহারকারী
- ইউটিলিটি
- মূল্য
- ভিডিও
- Videos
- ওয়াচ
- ওয়েব
- ওয়েব সার্ভার
- হু
- ওয়াইল্ডলাইফ
- মদ
- মধ্যে
- শব্দ
- হয়া যাই ?
- কর্মপ্রবাহ
- কর্মীসংখ্যার
- বিশ্ব
- X
- বছর
- বছর
- ইউটিউব
- YouTube ব্যবহারকারী