স্ব-সংগঠিত মানচিত্র ব্যবহার করে বিশৃঙ্খলা সনাক্তকরণের জন্য নতুনদের নির্দেশিকা

উত্স নোড: 1866873

এই নিবন্ধটি একটি অংশ হিসাবে প্রকাশিত হয়েছিল ডেটা সায়েন্স ব্লগাথন

তত্ত্বাবধানহীন শিক্ষা, যেখানে ডেটার জন্য কোনও পূর্বনির্ধারিত লেবেল নেই এবং মডেলটি ডেটাকে প্যাটার্ন অনুমান করে এবং ডেটা থেকে বৈশিষ্ট্যগুলি বের করে গোষ্ঠীগুলিতে ভাগ করে, ডেটা বিজ্ঞানের সমস্যার কেন্দ্রবিন্দুতে রয়েছে। মেশিন লার্নিং জগতে, সেগমেন্টেশন তাদের বৈশিষ্ট্যের উপর ভিত্তি করে ডেটা ক্লাস্টার করতে সাহায্য করে।

সেগমেন্টেশনের মতো, গভীর শিক্ষার ক্ষেত্রে একটি সমান্তরাল কৌশল বিদ্যমান যাকে বলা হয় স্ব-সংগঠিত মানচিত্র। এই প্রবন্ধে, আমরা এই কৌশলটি বিশদভাবে গভীরভাবে আলোচনা করব, স্ব-সংগঠিত মানচিত্র কী, তাদের স্থাপত্য, কীভাবে তারা প্রশিক্ষিত হয়, তাদের অ্যাপ্লিকেশনগুলি কী, এটি কীভাবে K-Means ক্লাস্টারিংয়ের মতো, এবং তারপরে পাইথনে প্রয়োগ করব।

সুচিপত্র

  • স্ব-সংগঠিত মানচিত্র কি?
  • স্ব-সংগঠিত মানচিত্রের আর্কিটেকচার
  • কিভাবে স্ব-সংগঠিত মানচিত্র শিখতে হবে?
  • সেরা ম্যাচিং ইউনিট (BMU)
  • স্ব-সংগঠিত মানচিত্র-এর সাদৃশ্য K- মানে ক্লাস্টারিং
  • পাইথনে স্ব-সংগঠিত মানচিত্র বাস্তবায়ন

স্ব-সংগঠিত মানচিত্র কি?

প্রফেসর টিউভো কোহোনেন দ্বারা উদ্ভাবিত, কোহোনেন কৃত্রিম নিউরাল নেটওয়ার্ক বা কোহোনেন মানচিত্র হল কৃত্রিম নিউরাল নেটওয়ার্কের (ANNs) আরেকটি জাত। সেলফ-অর্গানাইজিং ম্যাপ (এসওএম) নামে বেশি পরিচিত এটি তত্ত্বাবধানহীন শিক্ষার একটি অত্যন্ত বিরল দিক এবং এটি একটি ডেটা ভিজ্যুয়ালাইজেশন কৌশল।

কৌশলটির লক্ষ্য মাত্রা হ্রাস করা এবং বৈশিষ্ট্যগুলি সনাক্ত করা। মানচিত্রগুলি উচ্চ-মাত্রিক ডেটা কল্পনা করতে সহায়তা করে। এটি স্ব-সংগঠিত নিউরাল নেটওয়ার্ক ব্যবহার করে দ্বি-মাত্রিক স্থানে বহুমাত্রিক ডেটা উপস্থাপন করে। কৌশলটি ডেটা মাইনিং, ফেস রিকগনিশন, প্যাটার্ন রিকগনিশন, স্পিচ অ্যানালাইসিস, ইন্ডাস্ট্রিয়াল এবং মেডিক্যাল ডায়াগনস্টিকস, অসঙ্গতি সনাক্তকরণের জন্য ব্যবহৃত হয়।

SOM-এর সৌন্দর্য হল এটি প্রশিক্ষণ ডেটাসেটের (বা ইনপুট) টপোলজিক্যাল সম্পর্ক রক্ষা করে। ইঙ্গিত করে যে ইনপুট ডেটার অন্তর্নিহিত বৈশিষ্ট্যগুলি আকৃতি বা চিত্রের আকারের ক্রমাগত পরিবর্তনের পরেও প্রভাবিত হয় না। SOMs পারস্পরিক সম্পর্ক প্রকাশ করতে সাহায্য করে যা সহজে সনাক্ত করা যায় না।

আসুন দেখি কিভাবে SOM গুলি গঠন করা হয় এবং তাদের স্থাপত্যের সূক্ষ্মতা বোঝা যায় …

আর্কিটেকচার স্ব-সংগঠিত মানচিত্র

স্ব-সংগঠিত মানচিত্র কাঠামো নিউরনের একটি জালি। গ্রিড, X এবং Y স্থানাঙ্কে, প্রতিটি নোডের একটি নির্দিষ্ট টপোলজিক্যাল অবস্থান থাকে এবং ইনপুট ভেরিয়েবলের মতো একই মাত্রার ওজনের ভেক্টর থাকে।

ইনপুট প্রশিক্ষণ ডেটা হল n মাত্রার ভেক্টরের একটি সেট: x1, x2, x3…xn, এবং প্রতিটি নোড n মাত্রার একটি সংশ্লিষ্ট ওজন ভেক্টর W নিয়ে গঠিত: w1, w2, w3… wn

নীচের দৃষ্টান্তে, নোডগুলির মধ্যে লাইনগুলি কেবল সংলগ্নতার একটি উপস্থাপনা এবং অন্যান্য নিউরাল নেটওয়ার্কগুলির মতো কোনও সংযোগকে বোঝায় না।

স্ব-সংগঠিত মানচিত্র

চিত্র 1

স্ব-সংগঠিত মানচিত্র হল নিউরন (বা নোড) এর একটি জালি বা গ্রিড যা ইনপুট সংকেতগুলির একটি সেট গ্রহণ করে এবং প্রতিক্রিয়া জানায়। প্রতিটি নিউরনের একটি অবস্থান রয়েছে এবং যেগুলি একে অপরের কাছাকাছি থাকে সেগুলি অনুরূপ বৈশিষ্ট্য সহ ক্লাস্টার প্রতিনিধিত্ব করে। অতএব, প্রতিটি নিউরন প্রশিক্ষণ থেকে শেখা একটি ক্লাস্টার প্রতিনিধিত্ব করে।

এসওএম-এ, প্রতিক্রিয়াগুলি তুলনা করা হয় এবং জালি থেকে একটি 'জয়ী' নিউরন নির্বাচন করা হয়। এই নির্বাচিত নিউরন আশেপাশের নিউরনের সাথে একসাথে সক্রিয় হয়। SOM গুলি আউটপুট হিসাবে যেকোন সংখ্যক সূচকের জন্য একটি দ্বি-মাত্রিক মানচিত্র প্রদান করে যেখানে আউটপুট নোডগুলির মধ্যে কোনও পার্শ্বীয় সংযোগ নেই।

এখানে আপনার জন্য একটি প্রশ্ন, আপনি কি মনে করেন ক্ষতি ফাংশন যা SOM-এর জন্য গণনা করা প্রয়োজন? ঠিক আছে, যেহেতু এটি একটি তত্ত্বাবধানহীন শেখার কৌশল, এখানে কোন লক্ষ্য পরিবর্তনশীল নেই এবং তাই, আমরা ক্ষতির ফাংশনটিও গণনা করি না এবং তাই SOM-এর জন্য কোন পশ্চাদমুখী প্রচার প্রক্রিয়ারও প্রয়োজন নেই।

কীভাবে স্ব-সংগঠিত মানচিত্র শিখবেন?

এখন, আসুন জেনে নেওয়া যাক স্ব-সংগঠিত মানচিত্র অ্যালগরিদমের শেখার প্রক্রিয়া কী? কিভাবে betas অনুমান করা হয় এবং নেটওয়ার্ক প্রশিক্ষিত হয়?

SOM-এর প্রশিক্ষণ প্রক্রিয়ার অন্তর্নিহিত ধারণা হল প্রতিটি নোড পরীক্ষা করা এবং একটি নোড খুঁজে বের করা যার ওজন সবচেয়ে বেশি ইনপুট ভেক্টরের মতো। প্রশিক্ষণটি কয়েক ধাপে এবং অনেক পুনরাবৃত্তির মাধ্যমে সঞ্চালিত হয়। আসুন নীচে এটি বিস্তারিতভাবে দেখুন:

আমাদের কাছে তিনটি ইনপুট সংকেত আছে x1, x2 এবং x3। এই ইনপুট ভেক্টরটি প্রশিক্ষণ ডেটার একটি সেট থেকে এলোমেলোভাবে বেছে নেওয়া হয় এবং জালিতে উপস্থাপন করা হয়। সুতরাং, আমাদের কাছে একটি 3*3 দ্বি-মাত্রিক বিন্যাসের আকারে নিউরনের একটি জালি রয়েছে যেখানে তিনটি সারি এবং তিনটি কলাম সহ নয়টি নোড রয়েছে যা নীচের মত চিত্রিত হয়েছে:

দৃশ্যমান আউটপুট নোড | স্ব-সংগঠিত মানচিত্র

চিত্র 2

বোঝার উদ্দেশ্যে, উপরের 3*3 ম্যাট্রিক্সকে নিচের মত করে কল্পনা করুন:

দৃশ্যমান ইনপুট নোড

চিত্র 3

প্রতিটি নোডের ওজন হিসাবে কিছু এলোমেলো মান রয়েছে। এই ওজনগুলি নিউরাল নেটওয়ার্কের নয় যেমন দেখানো হয়েছে:

ওজন | স্ব-সংগঠিত মানচিত্র

চিত্র 4

এই ওজনগুলি থেকে, ইউক্লিডীয় দূরত্ব গণনা করতে পারে:

দূরত্ব গণনা করুন | স্ব-সংগঠিত মানচিত্র

চিত্র 5

SOM-এর প্রশিক্ষণ প্রক্রিয়া নিম্নরূপ:

  1. প্রথমত, এলোমেলোভাবে সমস্ত ওজন শুরু করুন।

  2. প্রশিক্ষণ সেট থেকে একটি ইনপুট ভেক্টর x = [x1, x2, x3, … , xn] নির্বাচন করুন।

  3. প্রতিটি নিউরন j এর জন্য ইউক্লিডীয় দূরত্ব গণনা করে ওজন wj এর সাথে x তুলনা করুন। সবচেয়ে কম দূরত্ব সম্পন্ন নিউরনকে বিজয়ী ঘোষণা করা হয়। বিজয়ী নিউরন সেরা ম্যাচিং ইউনিট (BMU) নামে পরিচিত

  4. নিউরনের ওজন আপডেট করুন যাতে বিজয়ী ইনপুট ভেক্টর x এর সাথে সাদৃশ্যপূর্ণ হয়।

  5. প্রতিবেশী নিউরনের ওজনগুলিকে আরও ইনপুট ভেক্টরের মতো করার জন্য সামঞ্জস্য করা হয়। একটি নোড BMU এর যত কাছাকাছি হবে, তার ওজন তত বেশি পরিবর্তিত হবে। সামঞ্জস্যপূর্ণ পরামিতি হল শেখার হার এবং প্রতিবেশী ফাংশন। (প্রতিবেশী ফাংশন নীচে আরও)

  6. প্রদত্ত পুনরাবৃত্তির জন্য মানচিত্রটি একত্রিত না হওয়া পর্যন্ত ধাপ 2 থেকে পুনরাবৃত্তি করুন বা ওজনে কোন পরিবর্তন লক্ষ্য করা যাচ্ছে না।

সেরা ম্যাচিং ইউনিট (BMU)

আমরা উপরে দেখেছি প্রতিটি নোডের দূরত্ব (বা কাঁচা ডেটা পয়েন্ট) সমস্ত আউটপুট নোড থেকে গণনা করা হয়। যে নোড বা নিউরনটি সর্বনিম্ন দূরত্বের সাথে সনাক্ত করা হয় সেটি হল সেরা ম্যাচিং ইউনিট (BMU) বা প্রতিবেশী। এটি নিম্নলিখিত চিত্রে (m) হিসাবে চিত্রিত হয়েছে:

BMU | স্ব-সংগঠিত মানচিত্র

চিত্র 6

এই BMU থেকে, একটি ব্যাসার্ধ (বা সিগমা) সংজ্ঞায়িত করা হয়। BMU এর ব্যাসার্ধে পড়ে থাকা সমস্ত নোডগুলি BMU থেকে তাদের নিজ নিজ দূরত্ব অনুযায়ী আপডেট করা হয়।

সুতরাং, এখন বিষয় হল আউটপুট মানচিত্রের একটি নিউরন বিভিন্ন সেরা ম্যাচিং ইউনিটের ব্যাসার্ধের একটি অংশ হতে পারে। এটি একটি ধ্রুবক ধাক্কার দিকে নিয়ে যায় এবং নিউরনের উপর প্রভাব ফেলে তবে, নিউরনের আচরণ এটির কাছাকাছি সেরা ম্যাচিং ইউনিটের মতো হবে।

প্রতিটি পুনরাবৃত্তির পরে, ব্যাসার্ধ সঙ্কুচিত হয় এবং BMU কম নোডগুলিকে টেনে নেয় যাতে প্রক্রিয়াটি আরও বেশি সঠিক হয় এবং এটি আশেপাশের অঞ্চলকে সঙ্কুচিত করে যা সেই নির্দিষ্ট অংশের সেই ডেটা পয়েন্টগুলির সেগমেন্টগুলির ম্যাপিংকে হ্রাস করে। এটি মানচিত্রটিকে আরও বেশি নির্দিষ্ট করে তোলে এবং শেষ পর্যন্ত এটি রূপান্তরিত হতে শুরু করে এবং প্রশিক্ষণের ডেটা (বা ইনপুট) এর মতো হয়ে যায়।

থলোথলো

চিত্র 7

উপরের চিত্রে, সেরা ম্যাচিং ইউনিট (BMU) এর আশেপাশের ব্যাসার্ধ গণনা করা হয়েছে। এটি এমন একটি মান যা প্যানেলের ডান দিকের মতো বড় আকারে শুরু হয়, সাধারণত জালির ব্যাসার্ধে সেট করা হয় কিন্তু প্রতিবার ধাপে হ্রাস পায়। এই ব্যাসার্ধের মধ্যে পাওয়া যেকোন নোডগুলি BMU-এর আশেপাশের মধ্যে বলে মনে করা হয়।

K-এর সাথে SOM-এর সাদৃশ্য মানে ক্লাস্টারিং

K-Means ক্লাস্টারিং এবং SOM উভয়ই উচ্চমাত্রিক ডেটাকে নিম্ন মাত্রিক ডেটাতে রূপান্তর করার একটি মাধ্যম। যদিও একটি মেশিন লার্নিং অ্যালগরিদম এবং অন্যটি একটি ডিপ লার্নিং অ্যালগরিদম তবুও দুটির মধ্যে একটি সাদৃশ্য রয়েছে।

কে-মিনস ক্লাস্টারিং-এ, যখন নতুন ডেটা পয়েন্ট উপস্থাপন করা হয়, সেন্ট্রোয়েডগুলি আপডেট করা হয় এবং K-এর মান খুঁজে বের করার জন্য কনুই পদ্ধতির মতো পদ্ধতি রয়েছে। যেখানে স্ব-সংগঠিত মানচিত্রে, নিউরাল নেটওয়ার্কের আর্কিটেকচার আপডেট করার জন্য পরিবর্তন করা হয়। ওজন এবং নিউরনের সংখ্যা একটি টিউনিং প্যারামিটার।

পাইথনে স্ব-সংগঠিত মানচিত্র বাস্তবায়ন

পাইথনে জালিয়াতি গ্রাহকদের সনাক্ত করতে আমরা স্ব-সংগঠিত মানচিত্র কৌশল ব্যবহার করব। ডেটাতে একটি ক্লাস লেবেল এবং গ্রাহক আইডি সহ 690টি রেকর্ড এবং 16টি বৈশিষ্ট্য রয়েছে। যেহেতু এসওএম একটি তত্ত্বাবধানহীন কৌশল, তাই আমরা এখানে ক্লাস কলাম ব্যবহার করব না এবং গ্রাহক আইডি কলামেরও প্রয়োজন নেই। আমার থেকে ডেটাসেট এবং কোডগুলি অ্যাক্সেস করা যেতে পারে GitHub সংগ্রহস্থল।

এসওএমগুলি একটি দ্বি-মাত্রিক মানচিত্র ফেরত দেয় যেখানে ডেটা পয়েন্টগুলির চিহ্নিত নির্দিষ্ট গোষ্ঠীকে ম্যাপ করতে রঙ-কোডিং নিযুক্ত করা হয়।

পাইথনে, আমরা মিনিসম নামক লাইব্রেরি ব্যবহার করি যা স্ব-সংগঠিত মানচিত্র সম্পাদনের জন্য ব্যবহৃত হয়।

import numpy as np import matplotlib.pyplot plt import pandas pd হিসাবে # Minisom লাইব্রেরি এবং মডিউল minisom import MiniSom থেকে স্ব-সংগঠিত মানচিত্র সম্পাদনের জন্য ব্যবহৃত হয়
# ডেটা ডেটা লোড হচ্ছে = pd.read_csv('Credit_Card_Applications.csv') # X ডেটা # ডেটার আকৃতি: data.shape # ডেটার তথ্য: data.info()

স্ব-সংগঠিত মানচিত্রের জন্য, শুধুমাত্র X ভেরিয়েবল প্রয়োজন। এই ক্ষেত্রে, আমাদের কাস্টমারআইডি প্রয়োজন হয় না কারণ এটি একটি অনন্য পরিবর্তনশীল এবং না Y (টার্গেট ভেরিয়েবল) তাই উভয়ই ব্যবহার করছে না।

যদিও, আউটপুট ইনপুটের সাথে মিলছে কি না তা বোঝার জন্য লক্ষ্য পরিবর্তনশীল (Y) ব্যবহার করা যেতে পারে।

# SOM এর ইনপুটের জন্য X ভেরিয়েবল সংজ্ঞায়িত করা
X = data.iloc[:, 1:14].values ​​y = data.iloc[:, -1].values ​​# X ভেরিয়েবল:
pd.DataFrame(X)

এক্স ভেরিয়েবল স্কেল করা:

sklearn.preprocessing থেকে আমদানি MinMaxScaler sc = MinMaxScaler(feature_range = (0, 1)) X = sc.fit_transform(X) pd.DataFrame(X)

এসওএম নিউরনের একটি দ্বি-মাত্রিক অ্যারে। সুতরাং, এসওএমগুলিকে সংজ্ঞায়িত করার জন্য আমাদের জানতে হবে x এবং y মাত্রার ক্রম অনুসারে কতগুলি সারি এবং কলাম এবং নিউরন প্রয়োজন। SOM এর পরামিতিগুলি হল:

  • x: som_grid_rows, হল সারির সংখ্যা
  • y: som_grid_columns, হল কলামের সংখ্যা
  • সিগমা হল প্রতিবেশী ব্যাসার্ধ
  • শেখার_হার

যেহেতু x এবং y হল SOM-এর মাত্রা, এগুলি ছোট হওয়া উচিত নয় এবং সিগমা এবং learning_rate উচ্চতর মান নেওয়া যেতে পারে কারণ প্রতিটি পুনরাবৃত্তিতে এই মানগুলি সামঞ্জস্য করা হয়। যদিও ব্যাসার্ধের প্রাথমিক মান 1।

# হাইপার প্যারামিটার সেট করুন som_grid_rows = 10 som_grid_columns = 10 পুনরাবৃত্তি = 20000 sigma = 1 learning_rate = 0.5

x = 10 এবং y = 10 সারি এবং কলামের সংখ্যা (মাত্রা) হিসাবে, 10*10 অর্থাত্ 100 টি সেগমেন্ট থাকবে। আমরা এলোমেলোভাবে পর্যবেক্ষণগুলি গ্রহণ করি এবং পুনরাবৃত্তিগুলি সম্পাদন করার জন্য কোনও ক্রমানুসারে নয়।

# SOM সংজ্ঞায়িত করুন: som = MiniSom(x = som_grid_rows, y = som_grid_columns, input_len=13, sigma=sigma, learning_rate=learning_rate) # ওজন শুরু করা som.random_weights_init(X) # প্রশিক্ষণ_এক্সডম (এক্স)

ওজন থেকে ওজন এবং দূরত্ব মানচিত্র হল:

# ওজন হল: wts = som.weights # ওজনের আকৃতি হল: wts.shape # ওজন থেকে দূরত্বের মানচিত্র দেখায়: som.distance_map()

আমরা গড় ইন্টার-নিউরন দূরত্ব (MID) গণনা করি, যা প্রধান নিউরনের প্রতিবেশীর সাথে গড় ইউক্লিডীয় দূরত্ব।

  • MID যত বেশি হবে, তার প্রতিবেশী থেকে বিজয়ী নোড তত দূরে থাকবে।
  • তার আশেপাশের থেকে সেরা ম্যাচিং ইউনিট সাধারণত ক্লাস্টার থেকে অনেক দূরে।
  • যদি কিছু মানের মধ্যে আরও অনুরূপ দূরত্ব থাকে অর্থাৎ MID এর পরিপ্রেক্ষিতে ছোট দূরত্ব থাকে তবে সেই মানগুলি একে অপরের সাথে আরও কাছাকাছি এবং একই রকম হয়।

Pcolor() সব MID কে রঙ করতে ব্যবহার করা হয় এবং উইন্ডো হল bone()।

পাইল্যাব থেকে আমদানি প্লট, অক্ষ, শো, pcolor, colorbar, bone bone() pcolor(som.distance_map().T) # ব্যাকগ্রাউন্ড colorbar() show() হিসাবে দূরত্ব মানচিত্র

রোগে আক্রান্ত রোগীদের সনাক্ত করার জন্য প্রতিটি লেবেলের জন্য বিভিন্ন রং এবং মার্কার ব্যবহার করা। SOM নীতিগুলি ব্যাখ্যা করার জন্য ব্যবহৃত সবচেয়ে সাধারণ উদাহরণ হল তিনটি মাত্রা-লাল, সবুজ-নীল থেকে দুটি মাত্রায় রঙের ম্যাপিং। যদি হিটম্যাপে চিত্রিত আউটলায়ারটি প্রকৃত জালিয়াতি গ্রাহকদের সাথে সারিবদ্ধ হয় বা না হয় তাহলে এর মাধ্যমে ক্রস-চেক করতে পারেন:

bone() pcolor(som.distance_map().T) colorbar() #gives legend markers = ['o', 's'] # যদি পর্যবেক্ষণটি জালিয়াতি হয় তাহলে লাল বৃত্তাকার রঙ নয়তো সবুজ বর্গাকার রং = ['r' , 'g'] i এর জন্য, গণনাতে x(X): w = som.winner(x) plot(w[0] + 0.5, w[1] + 0.5, markers[y[i]], markeredgecolor = রং [y[i]], markerfacecolor = 'None', markersize = 10, markeredgewidth = 2) show()
  • জালিয়াতির পার্থক্য করতে ব্যবহৃত মার্কারগুলি হল:
    • রেড সার্কুলার হল প্রতারক গ্রাহক হিসাবে শ্রেণী 0
    • গ্রীন স্কোয়ার হল ক্লাস 1 হল প্রতারণার গ্রাহক নয়
  • i হল সূচক এবং x হল প্রতিটি মানের ভেক্টর এবং প্রতিটি x এর জন্য প্রথমে উইনিং নোড পান
  • বিজয়ী নোডের কো-অর্ডিনেটগুলি হল w[0] এবং w[1], মার্কারের কেন্দ্রে 0.5 যোগ করা হয়
  • s হল একটি বর্গক্ষেত্র এবং মার্কার মুখের রঙ হল মার্কারটির ভিতরের রঙ

কিছু গ্রাহক থাকবে যাদের উপরে কোন ম্যাপিং নেই এবং তাই তারা সেগমেন্টের অংশ হবে না। বিভাগগুলির অংশ গঠনকারী মানগুলি দেখানোর জন্য:

ম্যাপিং = som.win_map(ডেটা) ম্যাপিংস mappings.keys() len(mappings.keys()) ম্যাপিংস[(9,8)] হিট ম্যাপ থেকে কিছু লাল সার্কুলার নেওয়া এবং জালিয়াতি হিসাবে ম্যাপিং:
frauds = np.concatenate((ম্যাপিং[(0,9)], ম্যাপিংস[(8,9)]), axis = 0) জালিয়াতি # গ্রাহকদের তালিকা যারা জালিয়াতি করে: frauds1 = sc.inverse_transform(frauds) pd. ডেটাফ্রেম(জালিয়াতি1)

শেষটীকা

নীচের পরিকল্পিত স্ব-সংগঠিত মানচিত্রগুলির কাজকে চিত্রিত করে:

চিত্র 8

  • স্ব-সংগঠিত মানচিত্র অ্যালগরিদম ডেটার টপোলজি বজায় রেখে উচ্চ-মাত্রিক ডেটাকে দ্বি-মাত্রিক মানচিত্রে প্রজেক্ট করে যাতে অনুরূপ ডেটা পয়েন্টগুলি মানচিত্রের কাছাকাছি অবস্থানগুলিতে ম্যাপ করা হয়।

  • কৌশলটি কোনো তত্ত্বাবধান ছাড়াই ডেটাকে শ্রেণীবদ্ধ করে এবং কোনো লক্ষ্য ভেক্টর নেই এবং তাই কোনো পশ্চাদমুখী প্রচার নেই।

  • SOM-এর আউটপুট হল একটি দ্বি-মাত্রিক মানচিত্র এবং কালার-কোডিং ডেটা পয়েন্টের যেকোন নির্দিষ্ট গ্রুপ সনাক্ত করতে ব্যবহৃত হয়।

আমি আশা করি নিবন্ধটি আপনার জন্য সহায়ক ছিল এবং আপনি নতুন কিছু শিখেছেন। পড়া বন্ধ করার জন্য এবং আপনার নেটওয়ার্কের সাথে নিবন্ধটি ভাগ করে নেওয়ার জন্য আপনাকে অনেক ধন্যবাদ 🙂৷

হ্যাপি লার্নিং! 🙂

আমার সম্পর্কে

হাই সেখানে! আমি নেহা শেঠ। আমি গ্রেট লেক ইনস্টিটিউট অফ ম্যানেজমেন্ট থেকে ডেটা সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং-এ স্নাতকোত্তর প্রোগ্রাম এবং পরিসংখ্যানে স্নাতক করেছি। আমি হিসাবে বৈশিষ্ট্যযুক্ত করা হয়েছে 10 সালের সেরা 2020 জন জনপ্রিয় অতিথি লেখক অ্যানালিটিক্স বিদ্যা (AV) এর উপর।

আমার আগ্রহের ক্ষেত্র NLP এবং গভীর শিক্ষার মধ্যে রয়েছে। আমি সিএফএ প্রোগ্রামও পাস করেছি। আপনি আমার সাথে যোগাযোগ করতে পারেন লিঙ্কডইন এবং জন্য আমার অন্যান্য ব্লগ পড়তে পারেন এভি।

তথ্যসূত্র

https://en.wikipedia.org/wiki/Teuvo_Kohonen

চিত্র উত্স

  1. Image 1: https://static-01.hindawi.com/articles/cin/volume-2016/2476256/figures/2476256.fig.002.svgz
  2. ছবি 2: 63_blog_image_2.png (671×663) (sds-platform-private.s3-us-east-2.amazonaws.com)
  3. ছবি 3 : 63_blog_image_3.png (671×663) (sds-platform-private.s3-us-east-2.amazonaws.com)
  4. ছবি 4 : 63_blog_image_4.png (671×663) (sds-platform-private.s3-us-east-2.amazonaws.com)
  5. ছবি 5 : 63_blog_image_5.png (671×663) (sds-platform-private.s3-us-east-2.amazonaws.com)
  6. ছবি 6: https://www.researchgate.net/publication/350552111/figure/fig2/AS:[ইমেল সুরক্ষিত]/সেলফ-অর্গানাইজিং-ম্যাপ-SOM.png-এ-সর্বোত্তম-ম্যাচিং-ইউনিট
  7. ছবি 7: mathworks.com
  8. ছবি 8: https://www.researchgate.net/profile/Bruno-Senzio/publication/313160273/figure/fig2/AS:[ইমেল সুরক্ষিত]/SOM-কাঠামো-এবং-আপডেট-অফ-বেস্ট-ম্যাচিং-ইউনিট-19.png

এই নিবন্ধে প্রদর্শিত মিডিয়াগুলি অ্যানালিটিক্স বিদ্যা মালিকানাধীন নয় এবং এটি লেখকের বিবেচনার ভিত্তিতে ব্যবহৃত হয়।

সূত্র: https://www.analyticsvidhya.com/blog/2021/09/beginners-guide-to-anomaly-detection-using-self-organizing-maps/

সময় স্ট্যাম্প:

থেকে আরো বিশ্লেষণ বিদ্যা