বেসিকগুলিতে ফিরে যান, পার্ট ডস: গ্রেডিয়েন্ট ডিসেন্ট

বেসিকগুলিতে ফিরে যান, পার্ট ডস: গ্রেডিয়েন্ট ডিসেন্ট

উত্স নোড: 2019903

আমাদের দ্বিতীয় পর্বে স্বাগতম প্রাথমিক স্তরে ফিরে আসা সিরিজ মধ্যে অগ্রভাগ, আমরা লিনিয়ার রিগ্রেশন এবং কস্ট ফাংশন ব্যবহার করে আমাদের বাড়ির দামের ডেটার জন্য সেরা-ফিটিং লাইন খুঁজে বের করার জন্য কভার করেছি। যাইহোক, আমরা সেই একাধিক পরীক্ষাও দেখেছি পথিমধ্যে রোধ করা মান ক্লান্তিকর এবং অদক্ষ হতে পারে. এই দ্বিতীয় অংশে, আমরা গ্রেডিয়েন্ট ডিসেন্টের আরও গভীরে অনুসন্ধান করব, একটি শক্তিশালী কৌশল যা আমাদের নিখুঁত খুঁজে পেতে সাহায্য করতে পারে পথিমধ্যে রোধ করা এবং আমাদের মডেল অপ্টিমাইজ করুন। আমরা এর পিছনের গণিতটি অন্বেষণ করব এবং এটি কীভাবে আমাদের লিনিয়ার রিগ্রেশন সমস্যায় প্রয়োগ করা যেতে পারে তা দেখব।

গ্রেডিয়েন্ট ডিসেন্ট হল একটি শক্তিশালী অপ্টিমাইজেশান অ্যালগরিদম দ্রুত এবং দক্ষতার সাথে একটি বক্ররেখার সর্বনিম্ন বিন্দু খুঁজে বের করার লক্ষ্য। এই প্রক্রিয়াটি কল্পনা করার সর্বোত্তম উপায় হল কল্পনা করা যে আপনি একটি পাহাড়ের চূড়ায় দাঁড়িয়ে আছেন, সোনায় ভরা ধনভান্ডারের সাথে উপত্যকায় আপনার জন্য অপেক্ষা করছে।

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

যাইহোক, উপত্যকার সঠিক অবস্থান অজানা কারণ এটি অত্যন্ত অন্ধকার এবং আপনি কিছুই দেখতে পাচ্ছেন না। তদুপরি, আপনি অন্য কেউ করার আগেই উপত্যকায় পৌঁছাতে চান (কারণ আপনি নিজের জন্য সমস্ত ধন চান)। গ্রেডিয়েন্ট ডিসেন্ট আপনাকে ভূখণ্ডে নেভিগেট করতে এবং এটিতে পৌঁছাতে সহায়তা করে অনুকূল বিন্দু দক্ষতার সাথে এবং দ্রুত. প্রতিটি পয়েন্টে এটি আপনাকে বলবে যে কতগুলি পদক্ষেপ নিতে হবে এবং সেগুলি আপনাকে কোন দিকে নিতে হবে৷

একইভাবে, অ্যালগরিদম দ্বারা নির্ধারিত পদক্ষেপগুলি ব্যবহার করে আমাদের লিনিয়ার রিগ্রেশন সমস্যায় গ্রেডিয়েন্ট ডিসেন্ট প্রয়োগ করা যেতে পারে। ন্যূনতম খুঁজে বের করার প্রক্রিয়াটি কল্পনা করতে, এর প্লট করা যাক MSE বক্ররেখা আমরা ইতিমধ্যে জানি যে বক্ররেখার সমীকরণ হল:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
বক্ররেখার সমীকরণ হল MSE গণনা করতে ব্যবহৃত সমীকরণ

 

এবং থেকে আগের প্রবন্ধে, আমরা জানি যে সমীকরণ MSE আমাদের সমস্যা হল:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

আমরা জুম আউট করলে আমরা দেখতে পাব যে একটি MSE বক্ররেখা (যা আমাদের উপত্যকার অনুরূপ) একগুচ্ছ প্রতিস্থাপন করে পাওয়া যেতে পারে পথিমধ্যে রোধ করা উপরের সমীকরণে মান। তাই এর 10,000 মান প্লাগ করা যাক পথিমধ্যে রোধ করা, এই মত দেখায় একটি বক্ররেখা পেতে:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
বাস্তবে, MSE বক্ররেখা কেমন তা আমরা জানি না

 

এর তলানিতে পৌঁছানোই লক্ষ্য MSE বক্ররেখা, যা আমরা এই পদক্ষেপগুলি অনুসরণ করে করতে পারি:

ধাপ 1: ইন্টারসেপ্ট মানের জন্য একটি এলোমেলো প্রাথমিক অনুমান দিয়ে শুরু করুন

এই ক্ষেত্রে, এর জন্য আমাদের প্রাথমিক অনুমান অনুমান করা যাক পথিমধ্যে রোধ করা মান হল 0।

ধাপ 2: এই সময়ে MSE বক্ররেখার গ্রেডিয়েন্ট গণনা করুন

সার্জারির  নতিমাত্রা একটি বিন্দুতে একটি বক্ররেখাটি স্পর্শক রেখা দ্বারা প্রতিনিধিত্ব করা হয় (একটি অভিনব উপায় যে রেখাটি কেবলমাত্র সেই বিন্দুতে বক্ররেখা স্পর্শ করে)। উদাহরণস্বরূপ, পয়েন্ট A এ, নতিমাত্রা এর MSE বক্ররেখা লাল স্পর্শক রেখা দ্বারা উপস্থাপিত হতে পারে, যখন বাধা 0 এর সমান হয়।

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
MSE বক্ররেখার গ্রেডিয়েন্ট যখন ইন্টারসেপ্ট = 0

 

এর মান নির্ধারণ করার জন্য নতিমাত্রা, আমরা ক্যালকুলাস সম্পর্কে আমাদের জ্ঞান প্রয়োগ করি। বিশেষ করে, দ নতিমাত্রা সাপেক্ষে বক্ররেখার ডেরিভেটিভের সমান পথিমধ্যে রোধ করা একটি নির্দিষ্ট সময়ে। এটি হিসাবে চিহ্নিত করা হয়:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

দ্রষ্টব্য: আপনি যদি ডেরিভেটিভের সাথে অপরিচিত হন তবে আমি এটি দেখার পরামর্শ দিই খান একাডেমির ভিডিও যদি আগ্রহী হন. অন্যথায় আপনি পরবর্তী অংশটি দেখতে পারেন এবং এখনও নিবন্ধের বাকি অংশটি অনুসরণ করতে সক্ষম হবেন।

আমরা গণনা MSE বক্ররেখার ডেরিভেটিভ নিম্নরূপ:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

এখন খুঁজে বের করতে A বিন্দুতে গ্রেডিয়েন্ট, আমরা এর মান প্রতিস্থাপন করি পথিমধ্যে রোধ করা উপরের সমীকরণের A বিন্দুতে। থেকে পথিমধ্যে রোধ করা = 0, বিন্দু A-তে ডেরিভেটিভ হল:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

সুতরাং যখন পথিমধ্যে রোধ করা = 0, দ নতিমাত্রা =-190

লক্ষ্য করুন: আমরা যখন সর্বোত্তম মানের কাছে যাই, গ্রেডিয়েন্ট মানগুলি শূন্যের কাছে পৌঁছায়। সর্বোত্তম মানতে, গ্রেডিয়েন্টটি শূন্যের সমান। বিপরীতভাবে, আমরা সর্বোত্তম মান থেকে যত দূরে থাকব, গ্রেডিয়েন্ট তত বড় হবে।

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

এটি থেকে, আমরা অনুমান করতে পারি যে ধাপের আকার এর সাথে সম্পর্কিত হওয়া উচিত নতিমাত্রা, যেহেতু এটি আমাদের বলে যে আমাদের একটি শিশুর পদক্ষেপ নেওয়া উচিত বা একটি বড় পদক্ষেপ নেওয়া উচিত। এর মানে হল যে যখন নতিমাত্রা বক্ররেখা 0 এর কাছাকাছি, তাহলে আমাদের শিশুর পদক্ষেপ নেওয়া উচিত কারণ আমরা সর্বোত্তম মানের কাছাকাছি। এবং যদি নতিমাত্রা আরও বড়, দ্রুত সর্বোত্তম মান পেতে আমাদের আরও বড় পদক্ষেপ নেওয়া উচিত।

লক্ষ্য করুন: যাইহোক, যদি আমরা একটি বিশাল বড় পদক্ষেপ নিই, তাহলে আমরা একটি বড় লাফ দিতে পারি এবং সর্বোত্তম পয়েন্টটি মিস করতে পারি। তাই আমাদের সতর্ক থাকতে হবে।

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

ধাপ 3: গ্রেডিয়েন্ট এবং শেখার হার ব্যবহার করে ধাপের আকার গণনা করুন এবং ইন্টারসেপ্ট মান আপডেট করুন

যেহেতু আমরা দেখতে পাই যে ধাপে আকার এবং নতিমাত্রা একে অপরের সমানুপাতিক হয়, ধাপে আকার গুন দ্বারা নির্ধারিত হয় নতিমাত্রা নামক একটি পূর্ব-নির্ধারিত ধ্রুবক মান দ্বারা শেখার হার:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

সার্জারির  শিক্ষার হার এর মাত্রা নিয়ন্ত্রণ করে ধাপে আকার এবং নিশ্চিত করে যে নেওয়া পদক্ষেপটি খুব বড় বা খুব ছোট নয়।

অনুশীলনে, শেখার হার সাধারণত একটি ছোট ধনাত্মক সংখ্যা হয়? 0.001। কিন্তু আমাদের সমস্যার জন্য এটি 0.1 এ সেট করা যাক।

তাই যখন ইন্টারসেপ্ট 0 হয়, ধাপের আকার = গ্রেডিয়েন্ট x শিক্ষার হার = -190*0.1 = -19।

উপর ভিত্তি করে ধাপে আকার আমরা উপরে গণনা করেছি, আমরা আপডেট করি পথিমধ্যে রোধ করা (ওরফে আমাদের বর্তমান অবস্থান পরিবর্তন করুন) এই সমতুল্য সূত্রগুলির যেকোনো একটি ব্যবহার করে:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

নতুন খোঁজার জন্য পথিমধ্যে রোধ করা এই ধাপে, আমরা প্রাসঙ্গিক মানগুলি প্লাগ ইন করি...

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

…এবং নতুন যে খুঁজে পথিমধ্যে রোধ করা = 19

এখন এই মান প্লাগ করা MSE সমীকরণ, আমরা যে খুঁজে MSE যখন পথিমধ্যে রোধ করা হল 19 = 8064.095। আমরা লক্ষ্য করেছি যে একটি বড় পদক্ষেপে, আমরা আমাদের সর্বোত্তম মানের কাছাকাছি চলে এসেছি এবং কমিয়েছি MSE.

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

এমনকি যদি আমরা আমাদের গ্রাফের দিকে তাকাই, আমরা দেখতে পাই যে আমাদের নতুন লাইনের সাথে কতটা ভাল পথিমধ্যে রোধ করা 19 আমাদের পুরানো লাইনের তুলনায় আমাদের ডেটার সাথে মানানসই পথিমধ্যে রোধ করা 0:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

ধাপ 4: ধাপ 2-3 পুনরাবৃত্তি করুন

আমরা আপডেট ব্যবহার করে ধাপ 2 এবং 3 পুনরাবৃত্তি করি পথিমধ্যে রোধ করা মান।

যেমন নতুন থেকে পথিমধ্যে রোধ করা এই পুনরাবৃত্তির মান হল 19, নিম্নলিখিত ধাপ 2, আমরা এই নতুন পয়েন্টে গ্রেডিয়েন্ট গণনা করব:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

এবং আমরা যে খুঁজে নতিমাত্রা এর MSE 19 এর ইন্টারসেপ্ট মানের বক্ররেখা হল -152 (নীচের চিত্রে লাল স্পর্শক রেখা দ্বারা উপস্থাপিত)।

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

পরবর্তী, অনুযায়ী ধাপ 3, এর গণনা করা যাক ধাপে আকার:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

এবং পরবর্তীকালে, আপডেট করুন পথিমধ্যে রোধ করা মান:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

এখন আমরা আগের লাইনের সাথে তুলনা করতে পারি পথিমধ্যে রোধ করা নতুন ইন্টারসেপ্ট 19 সহ 34.2 থেকে নতুন লাইনে…

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

…এবং আমরা দেখতে পাচ্ছি যে নতুন লাইনটি ডেটার সাথে আরও ভালভাবে ফিট করে।

সামগ্রিকভাবে, MSE ছোট হয়ে আসছে…

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

…এবং আমাদের ধাপের আকার ছোট হচ্ছে:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

আমরা এই প্রক্রিয়াটি পুনরাবৃত্তি করে থাকি যতক্ষণ না আমরা সর্বোত্তম সমাধানের দিকে একত্রিত হই:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

আমরা বক্ররেখার সর্বনিম্ন বিন্দুর দিকে অগ্রসর হওয়ার সাথে সাথে আমরা লক্ষ্য করি যে ধাপে আকার ক্রমশ ছোট হয়ে যায়। 13টি ধাপের পর, গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম অনুমান করে পথিমধ্যে রোধ করা মান 95 হতে হবে। যদি আমাদের একটি ক্রিস্টাল বল থাকে, তাহলে এটি সর্বনিম্ন বিন্দু হিসাবে নিশ্চিত করা হবে MSE বক্ররেখা এবং আমরা যে ব্রুট ফোর্স পদ্ধতিতে দেখেছি তার তুলনায় এই পদ্ধতিটি কীভাবে আরও কার্যকর তা দেখতে পরিষ্কার। আগের প্রবন্ধে.

এখন আমরা আমাদের সর্বোত্তম মান আছে পথিমধ্যে রোধ করা, লিনিয়ার রিগ্রেশন মডেল হল:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

এবং রৈখিক রিগ্রেশন লাইন এই মত দেখায়:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
ইন্টারসেপ্ট = 95 এবং ঢাল = 0.069 সহ সেরা ফিটিং লাইন

 

অবশেষে, আমাদের বন্ধু মার্কের প্রশ্নে ফিরে যাচ্ছি — তার 2400 ফুট² বাড়িটি কী মূল্যে বিক্রি করা উচিত?

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

উপরের সমীকরণে 2400 ফুট² ঘরের আকার প্লাগ ইন করুন...

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

…এবং ভয়েলা। আমরা আমাদের অযথা উদ্বিগ্ন বন্ধু মার্ককে বলতে পারি যে তার আশেপাশের 3টি বাড়ির উপর ভিত্তি করে, তার প্রায় $260,600-এ তার বাড়ি বিক্রি করতে দেখা উচিত।

এখন যেহেতু আমাদের ধারণাগুলির একটি দৃঢ় বোঝাপড়া আছে, চলুন যেকোন দীর্ঘস্থায়ী প্রশ্নের উত্তর দিয়ে একটি দ্রুত প্রশ্নোত্তর সেশ করি।

গ্রেডিয়েন্ট খোঁজা আসলে কাজ করে কেন?

এটি ব্যাখ্যা করার জন্য, একটি দৃশ্যকল্প বিবেচনা করুন যেখানে আমরা বক্ররেখা C এর ন্যূনতম বিন্দুতে পৌঁছানোর চেষ্টা করছি, হিসাবে চিহ্নিত x*. এবং আমরা বর্তমানে A বিন্দুতে আছি x, এর বাম দিকে অবস্থিত x*:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

যদি আমরা সাপেক্ষে A বিন্দুতে বক্ররেখার ডেরিভেটিভ নিই x, হিসাবে উপস্থাপিত dC(x)/dx, আমরা একটি নেতিবাচক মান পাই (এর মানে হল নতিমাত্রা নিচের দিকে ঢালু) আমরা আরও লক্ষ্য করি যে পৌঁছানোর জন্য আমাদের ডানদিকে যেতে হবে x*. এইভাবে, আমাদের বাড়াতে হবে x সর্বনিম্ন পৌঁছাতে এক্স*.

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
লাল রেখা, বা গ্রেডিয়েন্ট, নিচের দিকে ঢালু => একটি নেতিবাচক গ্রেডিয়েন্ট

 
 

থেকে dC(x)/dx নেতিবাচক, x-??*dC(x)/dx থেকে বড় হবে x, এইভাবে দিকে চলন্ত x*.

একইভাবে, যদি আমরা ন্যূনতম বিন্দু x* এর ডানদিকে অবস্থিত A বিন্দুতে থাকি, তাহলে আমরা a পাব ধনাত্মক নতিমাত্রা (নতিমাত্রা উপরের দিকে ঢালু) dC(x)/dx.

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
লাল রেখা, বা গ্রেডিয়েন্ট, উপরের দিকে ঢালু => একটি ধনাত্মক গ্রেডিয়েন্ট

 

So x-??*dC(x)/dx থেকে কম হবে x, এইভাবে দিকে চলন্ত x*.

গ্রেডিয়েন্ট ডিসেন্ট কিভাবে জানে কখন পদক্ষেপ নেওয়া বন্ধ করতে হবে?

গ্রেডিয়েন্ট ডিসেন্ট থামে যখন ধাপে আকার 0 এর খুব কাছাকাছি। পূর্বে আলোচনা করা হয়েছে, সর্বনিম্ন পয়েন্টে নতিমাত্রা হল 0 এবং আমরা ন্যূনতম কাছে যাওয়ার সাথে সাথে, নতিমাত্রা 0 এর কাছাকাছি। অতএব, যখন নতিমাত্রা একটি বিন্দুতে 0 এর কাছাকাছি বা সর্বনিম্ন বিন্দুর কাছাকাছি, ধাপে আকার এছাড়াও 0 এর কাছাকাছি হবে, এটি নির্দেশ করে যে অ্যালগরিদম সর্বোত্তম সমাধানে পৌঁছেছে।

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
যখন আমরা ন্যূনতম বিন্দুর কাছাকাছি থাকি, গ্রেডিয়েন্ট 0-এর কাছাকাছি থাকে এবং পরবর্তীকালে ধাপের আকার 0-এর কাছাকাছি থাকে

অনুশীলনে সর্বনিম্ন ধাপের আকার = 0.001 বা ছোট

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

বলা হচ্ছে, গ্রেডিয়েন্ট ডিসেন্টের মধ্যে একটি সীমাও অন্তর্ভুক্ত রয়েছে যেটি হাল ছেড়ে দেওয়ার আগে এটি গ্রহণ করবে ধাপের সর্বোচ্চ সংখ্যা.

অনুশীলনে, ধাপের সর্বোচ্চ সংখ্যা = 1000 বা তার বেশি

তাই এমনকি যদি ধাপে আকার থেকে বড় ন্যূনতম ধাপের আকার, যদি এর চেয়ে বেশি থাকে ধাপের সর্বোচ্চ সংখ্যা, গ্রেডিয়েন্ট ডিসেন্ট বন্ধ হবে।

যদি ন্যূনতম পয়েন্ট সনাক্ত করা আরও চ্যালেঞ্জিং হয়?

এখন পর্যন্ত, আমরা এমন একটি বক্ররেখা নিয়ে কাজ করছি যেখানে ন্যূনতম বিন্দু চিহ্নিত করা সহজ (এই ধরনের বক্ররেখাকে বলা হয় উত্তল) কিন্তু আমাদের যদি এমন একটি বক্ররেখা থাকে যা ততটা সুন্দর না হয় (প্রযুক্তিগতভাবে ওরফে অ-উত্তল) এবং এই মত দেখায়:

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

এখানে, আমরা দেখতে পাচ্ছি যে পয়েন্ট B হল বিশ্বব্যাপী সর্বনিম্ন (প্রকৃত নূন্যতম), এবং পয়েন্ট A এবং C হল স্থানীয় ন্যূনতম (বিন্দু যা বিভ্রান্ত হতে পারে বিশ্বব্যাপী সর্বনিম্ন কিন্তু নয়) তাই যদি একটি ফাংশন একাধিক আছে স্থানীয় ন্যূনতম এবং একটি বিশ্বব্যাপী সর্বনিম্ন, এটা নিশ্চিত নয় যে গ্রেডিয়েন্ট ডিসেন্ট খুঁজে পাবে বিশ্বব্যাপী সর্বনিম্ন. তদুপরি, কোন স্থানীয় সর্বনিম্ন এটি খুঁজে পায় তা প্রাথমিক অনুমানের অবস্থানের উপর নির্ভর করবে (যেমনটিতে দেখা গেছে ধাপ 1 গ্রেডিয়েন্ট ডিসেন্টের)।

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

উপরের এই অ-উত্তল বক্ররেখাটিকে উদাহরণ হিসাবে নিলে, যদি প্রাথমিক অনুমানটি ব্লক A বা ব্লক C-তে হয়, গ্রেডিয়েন্ট ডিসেন্ট ঘোষণা করবে যে ন্যূনতম বিন্দুটি যথাক্রমে স্থানীয় সর্বনিম্ন A বা C-তে, যখন বাস্তবে এটি B-তে থাকে। শুধুমাত্র যখন প্রাথমিক অনুমান B ব্লকে, অ্যালগরিদম বিশ্বব্যাপী সর্বনিম্ন B খুঁজে পাবে।

এখন প্রশ্ন হল - কিভাবে আমরা একটি ভাল প্রাথমিক অনুমান করতে পারি?

সহজ উত্তর: ট্রায়াল এবং ত্রুটি. ধরনের.

এত সহজ উত্তর নয়: উপরের গ্রাফ থেকে, যদি আমাদের সর্বনিম্ন অনুমান x 0 ছিল যেহেতু এটি ব্লক A-তে রয়েছে, এটি স্থানীয় ন্যূনতম A-তে নিয়ে যাবে। সুতরাং, আপনি দেখতে পাচ্ছেন, বেশিরভাগ ক্ষেত্রে 0 একটি ভাল প্রাথমিক অনুমান নাও হতে পারে। একটি সাধারণ অভ্যাস হল x এর সমস্ত সম্ভাব্য মানের পরিসরে অভিন্ন বন্টনের উপর ভিত্তি করে একটি র্যান্ডম ফাংশন প্রয়োগ করা। উপরন্তু, যদি সম্ভব হয়, বিভিন্ন প্রাথমিক অনুমান সহ অ্যালগরিদম চালানো এবং তাদের ফলাফলের তুলনা করা অনুমানগুলি একে অপরের থেকে উল্লেখযোগ্যভাবে আলাদা কিনা তা অন্তর্দৃষ্টি প্রদান করতে পারে। এটি বিশ্বব্যাপী ন্যূনতমকে আরও দক্ষতার সাথে সনাক্ত করতে সহায়তা করে।

ঠিক আছে, আমরা প্রায় চলে এসেছি। শেষ প্রশ্ন.

যদি আমরা একাধিক সর্বোত্তম মান খুঁজে বের করার চেষ্টা করছি?

এখন পর্যন্ত, আমরা শুধুমাত্র সর্বোত্তম ইন্টারসেপ্ট মান খুঁজে বের করার উপর দৃষ্টি নিবদ্ধ করেছিলাম কারণ আমরা জাদুকরীভাবে জানতাম ঢাল রৈখিক রিগ্রেশনের মান হল 0.069। কিন্তু যদি একটি ক্রিস্টাল বল না থাকে এবং সর্বোত্তম জানি না তাহলে কি হবে ঢাল মান? তারপরে আমাদের ঢাল এবং ইন্টারসেপ্ট মান উভয়কেই অপ্টিমাইজ করতে হবে, যেমন প্রকাশ করা হয়েছে x? এবং x? যথাক্রমে.

এটি করার জন্য, আমাদের অবশ্যই ডেরিভেটিভের পরিবর্তে আংশিক ডেরিভেটিভ ব্যবহার করতে হবে।

দ্রষ্টব্য: আংশিক ডেরিভেটগুলি নিয়মিত পুরানো ডেরিভেটগুলির মতো একইভাবে গণনা করা হয়, তবে আলাদাভাবে চিহ্নিত করা হয় কারণ আমাদের একাধিক পরিবর্তনশীল রয়েছে যার জন্য আমরা অপ্টিমাইজ করার চেষ্টা করছি৷ তাদের সম্পর্কে আরও জানতে, এটি পড়ুন প্রবন্ধ বা এই দেখুন ভিডিও.

যাইহোক, প্রক্রিয়াটি তুলনামূলকভাবে একটি একক মান অপ্টিমাইজ করার মতোই থাকে। খরচ ফাংশন (যেমন MSE) এখনও সংজ্ঞায়িত করা আবশ্যক এবং গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম অবশ্যই প্রয়োগ করতে হবে, তবে উভয় x এর জন্য আংশিক ডেরিভেটিভস খোঁজার যুক্ত পদক্ষেপের সাথে? এবং x?

ধাপ 1: x₀ এবং x₁ এর জন্য প্রাথমিক অনুমান করুন

ধাপ 2: এই বিন্দুতে x₀ এবং x₁ এর সাপেক্ষে আংশিক ডেরিভেটিভ খুঁজুন

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট

 

ধাপ 3: আংশিক ডেরিভেটিভ এবং শেখার হারের উপর ভিত্তি করে একই সাথে x₀ এবং x₁ আপডেট করুন

 

বেসিকগুলিতে ফিরে যান, পার্ট ডস: লিনিয়ার রিগ্রেশন, কস্ট ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট
 

ধাপ 4: ধাপ 2-3 পুনরাবৃত্তি করুন যতক্ষণ না ধাপের সর্বাধিক সংখ্যা না পৌঁছায় বা ধাপের আকার ন্যূনতম ধাপের আকার থেকে কম হয়

এবং আমরা অপ্টিমাইজ করার জন্য এই ধাপগুলিকে 3, 4, এমনকি 100 মানেরও এক্সট্রাপোলেট করতে পারি।

উপসংহারে, গ্রেডিয়েন্ট ডিসেন্ট হল একটি শক্তিশালী অপ্টিমাইজেশান অ্যালগরিদম যা আমাদেরকে দক্ষতার সাথে সর্বোত্তম মান পৌঁছাতে সাহায্য করে। গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম অন্যান্য অনেক অপ্টিমাইজেশান সমস্যার ক্ষেত্রে প্রয়োগ করা যেতে পারে, এটি ডেটা বিজ্ঞানীদের অস্ত্রাগারে থাকা একটি মৌলিক হাতিয়ার করে তোলে। এখন বড় এবং ভাল অ্যালগরিদম সম্মুখের!

 
 
শ্রেয়া রাও সাধারণ মানুষের পদে মেশিন লার্নিং অ্যালগরিদমগুলি চিত্রিত করুন এবং ব্যাখ্যা করুন।

 
মূল। অনুমতি নিয়ে পোস্ট করা।
 

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস