আরও ভালো AI মডেল তৈরি করতে "ব্ল্যাক বক্স" আনপ্যাক করা হচ্ছে

আরও ভালো AI মডেল তৈরি করতে "ব্ল্যাক বক্স" আনপ্যাক করা হচ্ছে

উত্স নোড: 1885922

যখন গভীর শিক্ষার মডেলগুলি বাস্তব জগতে মোতায়েন করা হয়, সম্ভবত ক্রেডিট কার্ড কার্যকলাপ থেকে আর্থিক জালিয়াতি সনাক্ত করতে বা চিকিৎসা চিত্রগুলিতে ক্যান্সার সনাক্ত করতে, তারা প্রায়শই মানুষকে ছাড়িয়ে যেতে সক্ষম হয়।

কিন্তু এই গভীর শিক্ষার মডেলগুলি ঠিক কী শিখছে? ক্লিনিকাল চিত্রগুলিতে ত্বকের ক্যান্সার চিহ্নিত করার জন্য প্রশিক্ষিত একটি মডেল কি, উদাহরণস্বরূপ, ক্যান্সারযুক্ত টিস্যুর রঙ এবং টেক্সচারগুলি শিখতে পারে, নাকি এটি অন্য কিছু বৈশিষ্ট্য বা নিদর্শনগুলিকে পতাকাঙ্কিত করছে?

এই শক্তিশালী মেশিন-লার্নিং মডেলগুলি সাধারণত ভিত্তিক কৃত্রিম নিউরাল নেটওয়ার্ক এতে লক্ষ লক্ষ নোড থাকতে পারে যা ভবিষ্যদ্বাণী করতে ডেটা প্রক্রিয়া করে। তাদের জটিলতার কারণে, গবেষকরা প্রায়শই এই মডেলগুলিকে "ব্ল্যাক বক্স" বলে থাকেন কারণ এমনকি বিজ্ঞানীরা যারা এগুলো তৈরি করেন তারা হুডের নীচে যা চলছে তা বুঝতে পারেন না।

স্টেফানি জেগেলকা সেই "ব্ল্যাক বক্স" ব্যাখ্যায় সন্তুষ্ট নন। ইলেকট্রিক্যাল ইঞ্জিনিয়ারিং অ্যান্ড কম্পিউটার সায়েন্সের এমআইটি বিভাগের একজন সদ্য দায়িত্বপ্রাপ্ত সহযোগী অধ্যাপক, জেগেলকা এই মডেলগুলি কী শিখতে পারে এবং কীভাবে তারা আচরণ করে এবং কীভাবে এই মডেলগুলিতে নির্দিষ্ট পূর্ববর্তী তথ্য তৈরি করা যায় তা বোঝার জন্য গভীর শিক্ষার গভীরে খনন করছেন।

“দিনের শেষে, একটি গভীর-শিক্ষার মডেল কী শিখবে তা অনেকগুলি কারণের উপর নির্ভর করে। কিন্তু অনুশীলনে প্রাসঙ্গিক একটি বোঝাপড়া তৈরি করা আমাদের আরও ভাল মডেল ডিজাইন করতে সাহায্য করবে, এবং তাদের ভিতরে কী চলছে তা বুঝতে সাহায্য করবে যাতে আমরা জানতে পারি কখন আমরা একটি মডেল স্থাপন করতে পারি এবং কখন আমরা পারি না। এটি সমালোচনামূলকভাবে গুরুত্বপূর্ণ,” জেগেলকা বলেছেন, যিনি কম্পিউটার সায়েন্স অ্যান্ড আর্টিফিশিয়াল ইন্টেলিজেন্স ল্যাবরেটরি (সিএসএআইএল) এবং ইনস্টিটিউট ফর ডেটা, সিস্টেমস অ্যান্ড সোসাইটি (আইডিএসএস) এর সদস্যও।

জেগেলকা মেশিন-লার্নিং মডেলগুলিকে অপ্টিমাইজ করতে বিশেষভাবে আগ্রহী যখন ইনপুট ডেটা গ্রাফ আকারে থাকে। গ্রাফ ডেটা নির্দিষ্ট চ্যালেঞ্জ তৈরি করে: উদাহরণ স্বরূপ, ডেটার তথ্যে পৃথক নোড এবং প্রান্ত, সেইসাথে গঠন - কিসের সাথে কী সংযুক্ত তা সম্পর্কে উভয় তথ্যই থাকে। উপরন্তু, গ্রাফগুলির গাণিতিক প্রতিসাম্য রয়েছে যা মেশিন-লার্নিং মডেল দ্বারা সম্মান করা প্রয়োজন যাতে, উদাহরণস্বরূপ, একই গ্রাফ সর্বদা একই ভবিষ্যদ্বাণীর দিকে নিয়ে যায়। একটি মেশিন-লার্নিং মডেলে এই ধরনের প্রতিসাম্য তৈরি করা সাধারণত সহজ নয়।

উদাহরণস্বরূপ, অণু নিন। অণুগুলিকে গ্রাফ হিসাবে উপস্থাপিত করা যেতে পারে, শীর্ষবিন্দুগুলি যা পরমাণুর সাথে সামঞ্জস্যপূর্ণ এবং প্রান্তগুলি যা তাদের মধ্যে রাসায়নিক বন্ধনের সাথে সঙ্গতিপূর্ণ। ওষুধ কোম্পানিগুলি অনেক অণুর বৈশিষ্ট্যগুলি দ্রুত ভবিষ্যদ্বাণী করতে গভীর শিক্ষা ব্যবহার করতে চাইতে পারে, তাদের ল্যাবে শারীরিকভাবে পরীক্ষা করতে হবে এমন সংখ্যা সংকুচিত করে।

জেগেলকা গাণিতিক মেশিন-লার্নিং মডেলগুলি তৈরি করার পদ্ধতিগুলি অধ্যয়ন করে যা কার্যকরভাবে গ্রাফ ডেটাকে ইনপুট হিসাবে গ্রহণ করতে পারে এবং অন্য কিছু আউটপুট করতে পারে, এই ক্ষেত্রে একটি অণুর রাসায়নিক বৈশিষ্ট্যগুলির পূর্বাভাস। এটি বিশেষভাবে চ্যালেঞ্জিং কারণ একটি অণুর বৈশিষ্ট্যগুলি শুধুমাত্র এর মধ্যে থাকা পরমাণু দ্বারা নয়, তাদের মধ্যে সংযোগ দ্বারাও নির্ধারিত হয়।  

গ্রাফে মেশিন লার্নিংয়ের অন্যান্য উদাহরণের মধ্যে রয়েছে ট্রাফিক রাউটিং, চিপ ডিজাইন এবং সুপারিশকারী সিস্টেম।

এই মডেলগুলিকে ডিজাইন করা আরও কঠিন করা হয়েছে এই কারণে যে তাদের প্রশিক্ষণের জন্য ব্যবহৃত ডেটা প্রায়শই মডেলগুলি অনুশীলনে দেখা ডেটা থেকে আলাদা। সম্ভবত মডেলটিকে ছোট আণবিক গ্রাফ বা ট্র্যাফিক নেটওয়ার্ক ব্যবহার করে প্রশিক্ষিত করা হয়েছিল, কিন্তু একবার মোতায়েন করা গ্রাফগুলি বড় বা আরও জটিল।

এই ক্ষেত্রে, গবেষকরা এই মডেলটি শিখতে কী আশা করতে পারেন এবং বাস্তব-বিশ্বের ডেটা ভিন্ন হলে এটি কি এখনও অনুশীলনে কাজ করবে?

"কম্পিউটার বিজ্ঞানে কিছু কঠোরতার সমস্যার কারণে আপনার মডেল সবকিছু শিখতে সক্ষম হবে না, তবে আপনি কী শিখতে পারেন এবং আপনি কী শিখতে পারবেন না তা নির্ভর করে আপনি কীভাবে মডেল সেট আপ করবেন তার উপর," জেগেলকা বলেছেন।

তিনি অ্যালগরিদম এবং বিচ্ছিন্ন গণিতের প্রতি তার আবেগকে মেশিন লার্নিংয়ের জন্য তার উত্তেজনার সাথে একত্রিত করে এই প্রশ্নের কাছে যান।

প্রজাপতি থেকে বায়োইনফরমেটিক্স পর্যন্ত

জেগেলকা জার্মানির একটি ছোট শহরে বেড়ে ওঠেন এবং উচ্চ বিদ্যালয়ের ছাত্র থাকাকালীন বিজ্ঞানের প্রতি আগ্রহী হন; একজন সহায়ক শিক্ষক তাকে একটি আন্তর্জাতিক বিজ্ঞান প্রতিযোগিতায় অংশগ্রহণের জন্য উৎসাহিত করেন। মার্কিন যুক্তরাষ্ট্র এবং সিঙ্গাপুর থেকে তিনি এবং তার সতীর্থরা তিনটি ভাষায় প্রজাপতি সম্পর্কে তৈরি একটি ওয়েবসাইটের জন্য একটি পুরস্কার জিতেছেন৷

“আমাদের প্রকল্পের জন্য, আমরা একটি স্থানীয় ইউনিভার্সিটি অফ ফলিত বিজ্ঞানে স্ক্যানিং ইলেক্ট্রন মাইক্রোস্কোপ দিয়ে ডানার ছবি নিয়েছি। আমি মার্সিডিজ বেঞ্জে একটি উচ্চ-গতির ক্যামেরা ব্যবহার করার সুযোগও পেয়েছি — এই ক্যামেরাটি সাধারণত জ্বলন ইঞ্জিনগুলিকে চিত্রিত করে — যেটি আমি প্রজাপতির ডানার নড়াচড়ার একটি ধীর গতির ভিডিও ধারণ করতে ব্যবহার করি। সেই প্রথমবার আমি সত্যিই বিজ্ঞান এবং অন্বেষণের সংস্পর্শে এসেছি,” সে স্মরণ করে।

জীববিজ্ঞান এবং গণিত উভয় বিষয়ে আগ্রহী হয়ে জেগেলকা টিউবিনজেন বিশ্ববিদ্যালয় এবং অস্টিনের টেক্সাস বিশ্ববিদ্যালয়ে জৈব তথ্যবিজ্ঞান অধ্যয়ন করার সিদ্ধান্ত নেন। জর্জটাউন ইউনিভার্সিটিতে কম্পিউটেশনাল নিউরোসায়েন্সে ইন্টার্নশিপ সহ আন্ডারগ্রাজুয়েট হিসাবে গবেষণা পরিচালনা করার কয়েকটি সুযোগ ছিল, কিন্তু কোন ক্যারিয়ার অনুসরণ করতে হবে তা নিশ্চিত ছিলেন না।

যখন তিনি কলেজের শেষ বর্ষে ফিরে আসেন, জেগেলকা দুই রুমমেটের সাথে চলে আসেন যারা তুবিনজেনের ম্যাক্স প্ল্যাঙ্ক ইনস্টিটিউটে গবেষণা সহকারী হিসেবে কাজ করছিলেন।

"তারা মেশিন লার্নিং নিয়ে কাজ করছিল, এবং এটি আমার কাছে সত্যিই দুর্দান্ত লাগছিল। আমাকে আমার স্নাতক থিসিস লিখতে হয়েছিল, তাই আমি ইনস্টিটিউটে জিজ্ঞাসা করলাম তাদের কাছে আমার জন্য একটি প্রকল্প আছে কিনা। আমি ম্যাক্স প্ল্যাঙ্ক ইনস্টিটিউটে মেশিন লার্নিং নিয়ে কাজ শুরু করি এবং আমি এটা পছন্দ করি। আমি সেখানে অনেক কিছু শিখেছি, এবং এটি গবেষণার জন্য একটি দুর্দান্ত জায়গা ছিল, "সে বলে।

তিনি একটি মাস্টার্স থিসিস সম্পূর্ণ করার জন্য ম্যাক্স প্ল্যাঙ্ক ইনস্টিটিউটে থেকে যান এবং তারপরে ম্যাক্স প্ল্যাঙ্ক ইনস্টিটিউট এবং সুইস ফেডারেল ইনস্টিটিউট অফ টেকনোলজিতে মেশিন লার্নিংয়ে পিএইচডি করেন।.

তার পিএইচডি চলাকালীন, তিনি অন্বেষণ করেছিলেন কীভাবে বিচ্ছিন্ন গণিতের ধারণাগুলি মেশিন-লার্নিং কৌশলগুলিকে উন্নত করতে সহায়তা করতে পারে।

শেখার মডেল শেখানো

জেগেলকা মেশিন লার্নিং সম্পর্কে যত বেশি শিখেছিল, মডেলগুলি কীভাবে আচরণ করে এবং কীভাবে এই আচরণকে পরিচালনা করতে হয় তা বোঝার চ্যালেঞ্জগুলির দ্বারা তিনি তত বেশি আগ্রহী হয়ে ওঠেন।

"আপনি মেশিন লার্নিং দিয়ে অনেক কিছু করতে পারেন, কিন্তু শুধুমাত্র যদি আপনার কাছে সঠিক মডেল এবং ডেটা থাকে। এটি কেবল একটি ব্ল্যাক-বক্স জিনিস নয় যেখানে আপনি এটি ডেটাতে নিক্ষেপ করেন এবং এটি কাজ করে। আপনাকে আসলে এটি সম্পর্কে চিন্তা করতে হবে, এর বৈশিষ্ট্যগুলি এবং আপনি মডেলটি কী শিখতে এবং করতে চান, "সে বলে।

বার্কলেতে ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ে একটি পোস্টডক শেষ করার পরে, জেগেলকা গবেষণায় আবদ্ধ হয়েছিলেন এবং একাডেমিয়ায় ক্যারিয়ার গড়ার সিদ্ধান্ত নেন। তিনি 2015 সালে এমআইটিতে অনুষদে সহকারী অধ্যাপক হিসেবে যোগদান করেন।

"আমি প্রথম থেকেই এমআইটি সম্পর্কে সত্যিই যা পছন্দ করতাম তা হল যে লোকেরা সত্যিই গবেষণা এবং সৃজনশীলতার বিষয়ে গভীরভাবে যত্নশীল। এটিই আমি এমআইটি সম্পর্কে সবচেয়ে বেশি প্রশংসা করি। এখানকার লোকেরা সত্যিই মৌলিকতা এবং গবেষণার গভীরতাকে মূল্য দেয়," সে বলে।

সৃজনশীলতার উপর এই ফোকাস জেগেলকাকে বিস্তৃত বিষয়গুলি অন্বেষণ করতে সক্ষম করেছে।

MIT-এর অন্যান্য অনুষদের সাথে সহযোগিতায়, তিনি জীববিজ্ঞান, ইমেজিং, কম্পিউটার ভিশন এবং পদার্থ বিজ্ঞানে মেশিন-লার্নিং অ্যাপ্লিকেশনগুলি অধ্যয়ন করেন।

কিন্তু জেগেলকা যা সত্যিই চালিত করে তা হল মেশিন লার্নিং এর মৌলিক বিষয়গুলি এবং অতি সম্প্রতি, দৃঢ়তার সমস্যা। প্রায়শই, একটি মডেল প্রশিক্ষণের ডেটাতে ভাল পারফরম্যান্স করে, কিন্তু যখন এটি সামান্য ভিন্ন ডেটাতে স্থাপন করা হয় তখন এর কর্মক্ষমতা খারাপ হয়। একটি মডেলের মধ্যে পূর্বের জ্ঞান তৈরি করা এটিকে আরও নির্ভরযোগ্য করে তুলতে পারে, কিন্তু মডেলটির সফল হওয়ার জন্য কী তথ্য প্রয়োজন এবং কীভাবে এটি তৈরি করা যায় তা বোঝা এত সহজ নয়, তিনি বলেন।

তিনি ইমেজ শ্রেণীবিভাগের জন্য মেশিন-লার্নিং মডেলগুলির কর্মক্ষমতা উন্নত করার পদ্ধতিগুলিও অন্বেষণ করছেন৷

ইমেজ শ্রেণীবিভাগের মডেলগুলি সর্বত্র রয়েছে, মোবাইল ফোনে ফেসিয়াল রিকগনিশন সিস্টেম থেকে শুরু করে সোশ্যাল মিডিয়াতে জাল অ্যাকাউন্ট শনাক্তকারী সরঞ্জামগুলি পর্যন্ত৷ এই মডেলগুলির প্রশিক্ষণের জন্য প্রচুর পরিমাণে ডেটার প্রয়োজন হয়, কিন্তু যেহেতু মানুষের জন্য লক্ষ লক্ষ ছবি হাতে-লেবেল করা ব্যয়বহুল, গবেষকরা প্রায়শই মডেলগুলিকে প্রিট্রিন করার জন্য লেবেলবিহীন ডেটাসেটগুলি ব্যবহার করেন৷

এই মডেলগুলি একটি নির্দিষ্ট কাজের জন্য পরে সূক্ষ্ম সুর করার সময় তারা যে উপস্থাপনা শিখেছে তা পুনরায় ব্যবহার করে।

আদর্শভাবে, গবেষকরা চান যে মডেলটি প্রাক-প্রশিক্ষণের সময় যতটা শিখতে পারে, তাই এটি সেই জ্ঞানকে তার নিম্নধারার কাজে প্রয়োগ করতে পারে। কিন্তু বাস্তবে, এই মডেলগুলি প্রায়শই শুধুমাত্র কয়েকটি সাধারণ সম্পর্ক শিখে - যেমন একটি ছবিতে সূর্যালোক রয়েছে এবং একটিতে ছায়া রয়েছে - এবং চিত্রগুলিকে শ্রেণিবদ্ধ করতে এই "শর্টকাট" ব্যবহার করুন৷

“আমরা দেখিয়েছি যে এটি 'বিপরীত শিক্ষার' একটি সমস্যা, যা তাত্ত্বিক এবং অভিজ্ঞতাগতভাবে প্রাক-প্রশিক্ষণের জন্য একটি আদর্শ কৌশল। কিন্তু আমরা এটাও দেখাই যে মডেলটি যে ধরনের তথ্য উপস্থাপন করতে শিখবে তা আপনি মডেলটি দেখান এমন ডেটার ধরন পরিবর্তন করে প্রভাবিত করতে পারেন। বাস্তবে মডেলগুলি কী করতে চলেছে তা বোঝার দিকে এটি এক ধাপ, "তিনি বলেছেন।

গবেষকরা এখনও গভীর-শিক্ষার মডেলের অভ্যন্তরে যা চলছে তা বুঝতে পারেন না, বা মডেল কী শিখে এবং এটি কীভাবে আচরণ করে তা কীভাবে প্রভাবিত করতে পারে সে সম্পর্কে বিশদ বিবরণ, তবে জেগেলকা এই বিষয়গুলি অন্বেষণ চালিয়ে যাওয়ার জন্য উন্মুখ।

“প্রায়শই মেশিন লার্নিংয়ে, আমরা বাস্তবে কিছু ঘটতে দেখি এবং আমরা তা তত্ত্বগতভাবে বোঝার চেষ্টা করি। এটি একটি বিশাল চ্যালেঞ্জ। আপনি একটি বোঝাপড়া তৈরি করতে চান যা আপনি অনুশীলনে যা দেখেন তার সাথে মেলে, যাতে আপনি আরও ভাল করতে পারেন। আমরা এখনও এটি বোঝার শুরুতে আছি, "সে বলে।

ল্যাবের বাইরে, জেগেলকা সঙ্গীত, শিল্প, ভ্রমণ এবং সাইকেল চালানোর অনুরাগী। কিন্তু আজকাল, তিনি তার প্রাক-স্কুল-বয়সী মেয়ের সাথে তার বেশিরভাগ অবসর সময় কাটাতে উপভোগ করেন।

<!–
->

সময় স্ট্যাম্প:

থেকে আরো ব্লকচেইন পরামর্শদাতা