স্ব-নিরাময় সিস্টেম সম্পর্কে আর্কিটেকচার আমাদের কী শেখাতে পারে

স্ব-নিরাময় সিস্টেম সম্পর্কে আর্কিটেকচার আমাদের কী শেখাতে পারে

উত্স নোড: 1988904

DevOps দল এবং সাইট নির্ভরযোগ্যতা প্রকৌশলী (SREs) প্রতিদিন কোডের সাথে কাজ করে। এটি করা তাদের তাদের জগত যাচাই করতে, সূক্ষ্ম পর্যবেক্ষণ করতে এবং অপ্রত্যাশিত সংযোগগুলি আঁকতে শেখায়। সর্বোপরি, যদিও প্রকৃতির দিক থেকে অত্যন্ত যৌক্তিক এবং গাণিতিক, সফ্টওয়্যার বিকাশ অন্তত আংশিকভাবে শিল্পের আকারে। 

যে বিবৃতি দ্বারা অবিশ্বাসী? ইতিহাসের সবচেয়ে উল্লেখযোগ্য স্থাপত্যের কীর্তি এবং আধুনিক সফ্টওয়্যার প্রকৌশলের মধ্যে সমান্তরাল বিবেচনা করুন। এটি একটি উপযুক্ত তুলনা: সফ্টওয়্যার প্রকৌশলের মতোই, স্থাপত্য জটিল গাণিতিক গণনা নিযুক্ত করে সুন্দর কিছু তৈরি করতে। এবং উভয় ক্ষেত্রেই, সামান্য ভুল গণনা তাৎপর্যপূর্ণ পরিণতির দিকে নিয়ে যেতে পারে। চিত্তাকর্ষকভাবে, অনেক বিখ্যাত স্থাপত্যগত ভুলগুলি আমরা কোডে খুঁজে পাই এমন সমস্যার সাথে সাদৃশ্যপূর্ণ।

মনে রাখবেন, অনুপ্রেরণা সর্বত্র রয়েছে – যতক্ষণ আপনি জানেন কোথায় দেখতে হবে। এখানে কয়েকটি পাঠ রয়েছে যা সফ্টওয়্যার ইঞ্জিনিয়াররা শতাব্দীর পর শতাব্দী ধরে স্থাপত্যের এপিফানি থেকে শিখতে পারে, বিশেষত স্ব-নিরাময় সিস্টেমের ভবিষ্যত সম্পর্কে।

পাঠ 1: এজ কেস সবসময় সিস্টেমের দুর্বলতাকে কাজে লাগাবে

সিটিকর্প টাওয়ার - যাকে এখন 601 লেক্সিংটন বলা হয় - 1977 সালে নিউ ইয়র্ক সিটিতে নির্মাণ শেষ হয়েছিল, সেই সময়ে এটি বিশ্বের সপ্তম উচ্চতম ভবন ছিল। স্কাইস্ক্র্যাপারের অত্যাধুনিক ডিজাইনে তিনটি 100-প্লাস-ফুট স্টিল অন্তর্ভুক্ত ছিল। এটি সমাপ্তিতে একটি বিস্ময়কর ছিল. যাইহোক, একজন স্নাতক ছাত্র শীঘ্রই কিছু আপত্তিকর কিছু আবিষ্কার করলেন: প্রবল বাতাস বিল্ডিং এর অখণ্ডতা বিপন্ন হতে পারে. বিশেষ করে, সিটিকর্প টাওয়ারের কোণায় যদি শক্তিশালী বায়ুপ্রবাহ আঘাত হানে, তাহলে কাঠামোটি ধসে পড়তে পারে - একটি আক্ষরিক প্রান্তের কেস.

টাওয়ারটি প্রতি বছর 16-এর মধ্যে একটি ধসে পড়ার সম্ভাবনা ছিল। এই প্রতিকূলতাগুলি জুয়ার টেবিলে বসে থাকা কাউকে প্রলুব্ধ করতে পারে, কিন্তু সিটিকর্প টাওয়ারের পিছনের স্থপতি এবং কাঠামোগত প্রকৌশলীদের দৃষ্টিভঙ্গি খারাপ ছিল৷ সৌভাগ্যক্রমে, প্রযুক্তিবিদরা বিল্ডিং এর বোল্ট করা জয়েন্টগুলিকে শক্তিশালী করতে সক্ষম হয়েছিল। দুর্যোগ এড়ানো গেল।

স্ট্রাকচারাল ইঞ্জিনিয়াররা জানতেন সিটিকর্প টাওয়ার শেষ পর্যন্ত তার বিয়ারিংগুলিকে আপস করার জন্য যথেষ্ট শক্তিশালী বাতাসের মুখোমুখি হবে। একইভাবে, অভিজ্ঞ সফ্টওয়্যার ইঞ্জিনিয়াররা জানেন যে শক্তিশালী অ্যাপ্লিকেশন পারফরম্যান্স মনিটরিং (APM) এবং ইভেন্ট ম্যানেজমেন্ট একটি সিস্টেমকে অনিবার্য প্রান্তের কেস থেকে রক্ষা করার জন্য যথেষ্ট নয়। যে কারণে স্ট্যাটিক সিস্টেম ছাড়া মেশিন লার্নিং (এমএল) ক্ষমতাগুলি অপ্রত্যাশিত এবং অপরিকল্পিত নতুন পরিস্থিতি যেমন কোয়ার্টারিং উইন্ড পরিচালনা করতে পারে না। শুধুমাত্র মনিটরিং টুলের উপর নির্ভর করার সময়, একজন মানব প্রশাসককে অবশ্যই ত্রুটির পাঠোদ্ধার করতে হবে এবং ঘটনা পরিচালনার প্রক্রিয়াকে বাড়িয়ে তুলতে হবে।

পুনরুদ্ধার করার গড় সময় (MTTR)/মিন টাইম টু ডিটেক্ট (MTTD) কমাতে, DevOps টিমগুলিকে এজ কেসগুলির উচ্চ সম্ভাবনা গ্রহণ করতে হবে এবং স্ব-শিক্ষার সমাধানগুলিকে আগে থেকেই মোতায়েন করার জন্য কাজ করতে হবে। এই পাঠটি অনেক দূর এগিয়ে যায়, কারণ প্রকৌশলে দূরদর্শিতা গুরুত্বপূর্ণ।

পাঠ 2: "বিমানটি উড়ে যাওয়ার সাথে সাথে তৈরি করা" একটি কখনও শেষ না হওয়া চক্র তৈরি করে৷

মর্মান্তিক ঘটনা বেশ কিছু বিতরণ করেছে বিমান চলাচলের ইতিহাসের সবচেয়ে গুরুত্বপূর্ণ পাঠ. 1954 সালে যখন একটি প্লেন উড্ডয়নের মাঝামাঝি প্রচণ্ড ডিকম্প্রেশনের শিকার হয় এবং বিধ্বস্ত হয়, তখন প্রকৌশলীরা নিশ্চিত করেছিলেন যে বর্গাকার যাত্রীর জানালাগুলি একটি অপ্রয়োজনীয় স্ট্রেস পয়েন্ট ছিল। এখন থেকে, প্লেনগুলি বৃত্তাকার জানালা দিয়ে সাজানো ছিল. জাহাজে অগ্নিকাণ্ডের ফলে নতুন বসার ব্যবস্থা করা হয়েছে যা সরিয়ে নেওয়ার সহজতাকে অগ্রাধিকার দেয়। এই পরিবর্তনগুলি অগণিত জীবন বাঁচিয়েছে।

অনেক শিল্পে - বিমান চালনা অন্তর্ভুক্ত - একটি পণ্যকে সম্পূর্ণভাবে চাপ-পরীক্ষা করার কোন উপায় নেই। পূর্বে উল্লিখিত হিসাবে, প্রান্ত কেস অনিবার্য. এখানে সবচেয়ে বড় উপায় হল যে সফ্টওয়্যার ইঞ্জিনিয়ারদের তাদের সিস্টেমের দুর্বলতাগুলিকে মনোযোগ দিতে হবে যখন তারা নিজেদের উপস্থাপন করে। সেখান থেকে, তাদের অবশ্যই তাদের দ্রুত সমাধান করতে হবে। এটি করার জন্য দুটি জিনিসের প্রয়োজন: (1) সঠিক মূল কর্মক্ষমতা সূচক (KPIs) সনাক্ত করা এবং ট্র্যাক করা এবং (2) প্রাসঙ্গিক মেট্রিক্সের উপর ভিত্তি করে সিস্টেমগুলিকে উন্নত করতে সময় এবং সংস্থান বিনিয়োগ করা।

গড় প্রকৌশল দল 16 থেকে 40টি পর্যবেক্ষণ সরঞ্জামগুলিতে বিনিয়োগ করে, তবুও তারা প্রায়শই সেই চিহ্নটি মিস করে যা মেট্রিক্স সাফল্য প্রদর্শন করে। 15% এরও কম দল MTTD ট্র্যাক করে, তাই তারা ঘটনার জীবনচক্রের 66% মিস করে। আর এক-চতুর্থাংশ দল রিপোর্ট করে তাদের পরিষেবা স্তর চুক্তি (SLAs) অনুপস্থিত প্রাপ্যতা ট্র্যাকিং উল্লেখযোগ্য বিনিয়োগ সত্ত্বেও. এটি আমাদের বলে যে ডেটা সংগ্রহের জন্য এটিকে কাটাতে পুঙ্খানুপুঙ্খ, পদ্ধতিগত বিশ্লেষণের প্রয়োজন- পয়েন্ট সমাধানগুলি আর যথেষ্ট নয়।

সফ্টওয়্যার প্রকৌশলী, DevOps দল এবং SRE-কে অবশ্যই প্রাধান্য দিতে হবে এমন প্রক্রিয়া এবং সরঞ্জামগুলি যা প্রাপ্যতা সম্পর্কে প্রচুর পরিমাণে তথ্য থেকে মূল্য বের করে। শুধুমাত্র একটি সমালোচনামূলক ত্রুটি পর্যবেক্ষণ করার পরিবর্তে, তাদের অবশ্যই একজন বিমান প্রকৌশলীর বই থেকে একটি পৃষ্ঠা নিতে হবে এবং দ্রুত সমালোচনামূলক সিদ্ধান্ত নিতে হবে। এটি করার রহস্য AI এর মধ্যে রয়েছে।

পাঠ 3: AI হল স্ব-নিরাময় ব্যবস্থার জন্য একটি মৌলিক বিল্ডিং ব্লক

একটি সম্পূর্ণ স্বায়ত্তশাসিত, নিখুঁতভাবে কার্যকরী, স্ব-নিরাময় ব্যবস্থা যেকোনো সফ্টওয়্যার ইঞ্জিনিয়ারের জন্য আদর্শ। যে সিস্টেমগুলি নিজেরাই প্যাচ করে সেগুলি গ্রাহক সন্তুষ্টির জন্য ভাল, কারণ তারা ব্যয়বহুল ভোক্তা-মুখী ডাউনটাইম দূর করে। অধিকন্তু, তারা IT পরিষেবা ব্যবস্থাপনা (ITSM) ফাংশনের জন্য অবিশ্বাস্যভাবে উপকারী, কারণ তারা ক্লান্তিকর টিকিট পরিচালনার প্রয়োজনীয়তা উল্লেখযোগ্যভাবে হ্রাস করে। এই ধরনের একটি সিস্টেম তৈরির জন্য বেশ কয়েকটি উপাদানের প্রয়োজন, যার অনেকগুলি বর্তমানে নাগালের বাইরে। কিন্তু আমরা একটি স্ব-নিরাময় বাস্তবতার কাছাকাছি যা কেউ কেউ বুঝতে পারে না।

ব্যাপক AI গ্রহণের অভাব আজকাল সবচেয়ে বড় বাধা হয়ে দাঁড়িয়েছে যার মুখোমুখি স্ব-নিরাময় ব্যবস্থা। যদিও অনেক ব্যবসা প্রাথমিক AI বা ML-ভিত্তিক সরঞ্জামগুলি গ্রহণ করেছে, এই সরঞ্জামগুলির অখণ্ডতা প্রশ্নবিদ্ধ। অর্থাৎ অনেক প্রকৌশলীই কারবার করেন আইটি অপারেশনের জন্য কৃত্রিম বুদ্ধিমত্তা (AIOps) প্রযুক্তি যা স্বায়ত্তশাসিত AI অ্যালগরিদমের পরিবর্তে নিয়ম-ভিত্তিক অটোমেশন লজিক অনুসরণ করে। পার্থক্যটি মিনিটের মতো মনে হতে পারে, কিন্তু বাস্তবে, এটি হল হারানো উত্পাদনশীলতা এবং লক্ষ লক্ষ সম্ভাব্য ক্ষতির মধ্যে পার্থক্য।

জিনিসটি হল, নিয়ম-ভিত্তিক AIOps সরঞ্জামগুলি ভিন্ন পয়েন্ট সমাধানগুলির মধ্যে মিথস্ক্রিয়া বিশ্লেষণ করে এবং সম্ভবত সাধারণ ডেটা ত্রুটিগুলি সনাক্ত করতে পারে। কিন্তু অটোমেশন-ভিত্তিক সিস্টেমগুলি সময়ের সাথে সম্পূর্ণ নতুন ত্রুটির বিবর্তন প্রক্রিয়া করতে পারে না বা তারা ডেটাতে নতুন ত্রুটির পূর্বাভাস দিতে পারে না। কারণ এই ফাংশনগুলি কোডিং করা মানব প্রশাসক সিস্টেমকে একটি অনুসরণ করতে বলে যদি এই, তারপর যে লজিক প্যাটার্ন। সত্যিকারের দক্ষ AIOps সরঞ্জামগুলি চারটি ক্লাসিক টেলিমেট্রি পয়েন্টে উদ্ভূত ত্রুটিগুলি প্রশমিত করে - সনাক্তকরণ থেকে রেজোলিউশন পর্যন্ত - মানব প্রযুক্তিবিদরা তাদের অস্তিত্ব সম্পর্কে সচেতন হওয়ার আগেই নতুন এবং সমস্যাযুক্ত নিদর্শনগুলিকে শ্রেণিবদ্ধ করে। 

আমরা অপেক্ষা করার সময় AI এর আসন্ন তৃতীয় তরঙ্গ, AIOps-এর এই সংস্করণটি আমাদের স্ব-নিরাময় ব্যবস্থার সবচেয়ে কাছের। বর্তমান AIOps অ্যাপ্লিকেশনগুলি কীভাবে AI এর ভবিষ্যতে রক্তপাত করছে তা ট্র্যাক করা আকর্ষণীয় হবে, যার মধ্যে সম্পূর্ণরূপে উপলব্ধি করা অটোমেশন এবং স্বাধীন চিন্তার সম্ভাবনা অন্তর্ভুক্ত থাকবে। হয়তো তখন স্ট্রাকচারাল ইঞ্জিনিয়াররাও এআই-ভিত্তিক, স্ব-নিরাময় ব্যবস্থার পুরষ্কার কাটবে।

সময় স্ট্যাম্প:

থেকে আরো ডেটাভার্সিটি