ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

কেডনুগেটস

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

বড় ডেটাসময় স্ট্যাম্প: 13 জানুয়ারী, 2023 12:00 অপরাহ্ন

উত্স নোড: 1894868

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

নিউরাল নেটওয়ার্কগুলি সংখ্যার মাধ্যমে শেখে, তাই প্রতিটি শব্দকে একটি নির্দিষ্ট শব্দের প্রতিনিধিত্ব করার জন্য ভেক্টরে ম্যাপ করা হবে। এমবেডিং লেয়ারটিকে একটি লুকআপ টেবিল হিসাবে ভাবা যেতে পারে যা শব্দ এম্বেডিং সংরক্ষণ করে এবং সূচক ব্যবহার করে সেগুলি পুনরুদ্ধার করে।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

যে শব্দগুলির একই অর্থ রয়েছে সেগুলি ইউক্লিডিয়ান দূরত্ব/কোসাইন সাদৃশ্যের ক্ষেত্রে কাছাকাছি হবে। উদাহরণস্বরূপ, নীচের শব্দের উপস্থাপনায়, "শনিবার", "রবিবার" এবং "সোমবার" একই ধারণার সাথে যুক্ত, তাই আমরা দেখতে পাচ্ছি যে শব্দগুলি একই রকম।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

শব্দের অবস্থান নির্ণয় করে, শব্দের অবস্থান নির্ণয় করতে হবে কেন? কারণ, ট্রান্সফরমার এনকোডারে পুনরাবৃত্ত নিউরাল নেটওয়ার্কের মতো কোনো পুনরাবৃত্তি নেই, আমাদের অবশ্যই ইনপুট এম্বেডিংয়ের অবস্থান সম্পর্কে কিছু তথ্য যোগ করতে হবে। এটি অবস্থানগত এনকোডিং ব্যবহার করে করা হয়। কাগজের লেখক একটি শব্দের অবস্থান মডেল করতে নিম্নলিখিত ফাংশন ব্যবহার করেছেন।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

আমরা অবস্থানগত এনকোডিং ব্যাখ্যা করার চেষ্টা করব।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

এখানে "pos" অনুক্রমের "শব্দ" এর অবস্থানকে বোঝায়। P0 প্রথম শব্দের অবস্থান এমবেডিং বোঝায়; "d" মানে শব্দ/টোকেন এমবেডিংয়ের আকার। এই উদাহরণে d=5. অবশেষে, "i" এম্বেডিংয়ের 5টি পৃথক মাত্রার প্রতিটিকে বোঝায় (যেমন 0, 1,2,3,4)

উপরের সমীকরণে যদি "i" পরিবর্তিত হয়, আপনি বিভিন্ন ফ্রিকোয়েন্সি সহ একগুচ্ছ বক্ররেখা পাবেন। বিভিন্ন ফ্রিকোয়েন্সির বিপরীতে অবস্থান এমবেডিং মান পড়া বন্ধ করা, P0 এবং P4 এর জন্য বিভিন্ন এমবেডিং মাত্রায় বিভিন্ন মান প্রদান করা।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

এই প্রশ্ন, প্রশ্ন একটি ভেক্টর শব্দ প্রতিনিধিত্ব করে, কী কে বাক্যটির অন্যান্য সমস্ত শব্দ এবং মান V শব্দের ভেক্টর প্রতিনিধিত্ব করে।

মনোযোগের উদ্দেশ্য হল একই ব্যক্তি/বস্তু বা ধারণার সাথে সম্পর্কিত ক্যোয়ারী শব্দের তুলনায় মূল শব্দের গুরুত্ব গণনা করা।

আমাদের ক্ষেত্রে, V সমান Q এর।

মনোযোগ প্রক্রিয়া আমাদের একটি বাক্যে শব্দের গুরুত্ব দেয়।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

যখন আমরা ক্যোয়ারী এবং কী-এর মধ্যে নরমালাইজড ডট প্রোডাক্ট গণনা করি, তখন আমরা একটি টেনসর পাই যা কোয়েরির জন্য একে অপরের শব্দের আপেক্ষিক গুরুত্বকে উপস্থাপন করে।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

Q এবং KT-এর মধ্যে ডট প্রোডাক্ট গণনা করার সময়, আমরা অনুমান করার চেষ্টা করি যে কীভাবে ভেক্টরগুলি (অর্থাৎ ক্যোয়ারী এবং কীগুলির মধ্যে শব্দগুলি) সারিবদ্ধ হয় এবং বাক্যের প্রতিটি শব্দের জন্য একটি ওজন ফেরত দেয়।

তারপর, আমরা d_k-এর বর্গাকার ফলাফলকে স্বাভাবিক করি এবং সফটম্যাক্স ফাংশন পদগুলিকে নিয়মিত করে এবং 0 এবং 1-এর মধ্যে পুনরায় স্কেল করে।

অবশেষে, আমরা ফলাফলকে (অর্থাৎ ওজন) মান দিয়ে গুণ করি (অর্থাৎ সমস্ত শব্দ) অপ্রাসঙ্গিক শব্দের গুরুত্ব কমাতে এবং শুধুমাত্র সবচেয়ে গুরুত্বপূর্ণ শব্দগুলিতে ফোকাস করি।

মাল্টি-হেডেড অ্যাটেনশন আউটপুট ভেক্টর মূল অবস্থানগত ইনপুট এম্বেডিং-এ যোগ করা হয়। একে বলা হয় রেসিডুয়াল কানেকশন/স্কিপ কানেকশন। অবশিষ্ট সংযোগের আউটপুট স্তর স্বাভাবিককরণের মাধ্যমে যায়। স্বাভাবিককৃত অবশিষ্ট আউটপুট আরও প্রক্রিয়াকরণের জন্য একটি পয়েন্টওয়াইজ ফিড-ফরোয়ার্ড নেটওয়ার্কের মাধ্যমে পাস করা হয়।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

মুখোশ হল একটি ম্যাট্রিক্স যা মনোযোগ স্কোরের 0 এবং ঋণাত্মক অসীম মান দিয়ে ভরা একই আকারের।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

মুখোশের কারণ হল যে আপনি একবার মাস্কড স্কোরগুলির সফটম্যাক্স গ্রহণ করলে, নেতিবাচক অসীমতা শূন্য হয়ে যায়, ভবিষ্যতের টোকেনের জন্য শূন্য মনোযোগ স্কোর রেখে যায়।

এটি মডেলকে এই শব্দগুলিতে ফোকাস না করতে বলে৷

সফটম্যাক্স ফাংশনের উদ্দেশ্য হল বাস্তব সংখ্যা (ধনাত্মক এবং ঋণাত্মক) ধরা এবং তাদের ধনাত্মক সংখ্যায় পরিণত করা যার যোগফল 1।

ট্রান্সফরমারে প্রবেশ করার আগে ধারণাগুলি আপনার জানা উচিত

রবিকুমার নাদুভিন PyTorch ব্যবহার করে NLP কাজগুলি তৈরি এবং বুঝতে ব্যস্ত।

মূল। অনুমতি নিয়ে পোস্ট করা।

আরও এই বিষয়

এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
উত্স: https://www.kdnuggets.com/2023/01/concepts-know-getting-transformer.html?utm_source=rss&utm_medium=rss&utm_campaign=concepts-you-should-know-before-getting-into-transformer

সময় স্ট্যাম্প: জানুয়ারী 13, 2023

থেকে আরো কেডনুগেটস

ব্যক্তিগতকৃত এআই সহজ করা: আপনার নো-কোড জিপিটি-কে মানিয়ে নেওয়ার নির্দেশিকা – KDnuggets

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2439695

সময় স্ট্যাম্প: ডিসেম্বর 8, 2023

নতুনদের জন্য ChatGPT

নতুনদের জন্য ChatGPT

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 1939094

সময় স্ট্যাম্প: ফেব্রুয়ারী 3, 2023

ডেটা সায়েন্সে মাস্টার্স করার জন্য 5টি বিনামূল্যে কোর্স - KDnuggets

ডেটা সায়েন্সে মাস্টার্স করার জন্য 5টি বিনামূল্যের কোর্স – KDnuggets

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2381532

সময় স্ট্যাম্প: নভেম্বর 13, 2023

ChatGPT এর GPTs দিয়ে আপনার নিজের GPT তৈরি করুন! - কেডিনাগেটস

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2390353

সময় স্ট্যাম্প: নভেম্বর 15, 2023

ডেটা অ্যানালিটিক্সে চাকরির প্রবণতা: পার্ট 2 – KDnuggets

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2392905

সময় স্ট্যাম্প: নভেম্বর 21, 2023

মিস্ট্রাল 7B-V0.2: ফাইন-টিউনিং মিস্ট্রালের নতুন ওপেন-সোর্স এলএলএম উইথ হ্যাগিং ফেস - কেডিনুগেটস

মিস্ট্রাল 7B-V0.2: ফাইন-টিউনিং মিস্ট্রালের নতুন ওপেন-সোর্স এলএলএম উইথ হ্যাগিং ফেস – কেডিনুগেটস

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2539014

সময় স্ট্যাম্প: এপ্রিল 8, 2024

ডেটা সায়েন্স বিগিনারদের জন্য শীর্ষ 6 YouTube সিরিজ - KDnuggets

ডেটা সায়েন্স বিগিনারদের জন্য শীর্ষ 6 YouTube সিরিজ – KDnuggets

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2500949

সময় স্ট্যাম্প: মার্চ 1, 2024

সেরা সেপ্টেম্বরের গল্প: আপনি কি পাইথনের সাথে এক্সেল ফাইলগুলি পড়েন? একটি 1000x দ্রুত উপায় আছে

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 1181301

সময় স্ট্যাম্প: অক্টোবর 12, 2021

পান্ডাস মেল্ট ফাংশনের জন্য একটি শিক্ষানবিস গাইড

পান্ডাস মেল্ট ফাংশনের জন্য একটি শিক্ষানবিস গাইড

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 1992181

সময় স্ট্যাম্প: মার্চ 3, 2023

ডেটা সায়েন্সের জন্য ক্লাউড কম্পিউটিং-এর ভূমিকা - KDnuggets

ডেটা সায়েন্সের জন্য ক্লাউড কম্পিউটিং-এর ভূমিকা - কেডিনুগেটস

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2297037

সময় স্ট্যাম্প: সেপ্টেম্বর 28, 2023

মেশিন লার্নিং-এ মডেল ব্যাখ্যাযোগ্যতার জন্য SHAP মান ব্যবহার করা - KDnuggets

মেশিন লার্নিং-এ মডেল ব্যাখ্যাযোগ্যতার জন্য SHAP মান ব্যবহার করা - KDnuggets

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 2199144

সময় স্ট্যাম্প: আগস্ট 2, 2023

এআইকে ধ্বংস করা: কৃত্রিম বুদ্ধিমত্তার কুসংস্কার (এবং মানুষ)

উত্স ক্লাস্টার:

কেডনুগেটস

উত্স নোড: 1052496

সময় স্ট্যাম্প: আগস্ট 20, 2021