अप्रैल 2022 में, Apache Kafka के लिए Amazon प्रबंधित स्ट्रीमिंग (Amazon MSK) ने एक रोमांचक नई क्षमता लॉन्च की, अमेज़ॅन एमएसके सर्वर रहित. Amazon MSK Apache Kafka के लिए पूरी तरह से प्रबंधित सेवा है जो डेवलपर्स के लिए Apache Kafka पर आधारित अत्यधिक उपलब्ध, सुरक्षित और स्केलेबल एप्लिकेशन बनाना और चलाना आसान बनाती है। एमएसके सर्वरलेस के साथ, डेवलपर्स अपने अपाचे काफ्का क्लस्टर को प्रावधान, कॉन्फ़िगर या अनुकूलित किए बिना अपने एप्लिकेशन चला सकते हैं। MSK सर्वरलेस स्वचालित रूप से गणना और भंडारण संसाधनों का प्रावधान और पैमाना करता है, इसलिए डेवलपर्स के पास ऑन-डिमांड स्ट्रीमिंग क्षमता और भंडारण तक पहुंच होती है।
2022 के शेष समय में, टीम ने ग्राहकों की प्रतिक्रिया एकत्र की और नई क्षमताओं को जोड़ने के लिए ग्राहकों की आवश्यकताओं से पीछे की ओर काम किया जिसने MSK सर्वरलेस को और भी बेहतर बना दिया। इस पोस्ट में, हम इनमें से कुछ संवर्द्धन पर विस्तार से चर्चा करते हैं और एक उदाहरण उपयोग मामला प्रदान करते हैं।
क्लस्टर में विभाजन के लिए उच्च डिफ़ॉल्ट कोटा
Apache Kafka में डेटा को लिखा जाता है विषयों, जिसे कई लॉग फाइलों में विभाजित किया जा सकता है बीसियों. जब कोई निर्माता एप्लिकेशन किसी विषय पर डेटा लिखता है, तो उसे इन विभाजनों में से एक में जोड़ा जाता है। MSK Serverless को प्रति क्लस्टर 120 विभाजन के अधिकतम कोटा के साथ लॉन्च किया गया। हालांकि, हमारे ग्राहकों ने हमें बताया कि उन्हें विभिन्न प्रकार के उपयोग के मामलों के लिए प्रति क्लस्टर अधिक विभाजन की आवश्यकता है, जिसमें परिवर्तन डेटा कैप्चर (सीडीसी) से लेकर वास्तविक समय डेटा प्रोसेसिंग में तेजी शामिल है।
दिसंबर 2022 में, हमने MSK सर्वर रहित क्लस्टर के विभाजन के लिए डिफ़ॉल्ट कोटा बढ़ा दिया। बढ़े हुए कोटा के साथ, आप प्रति क्लस्टर 2,400 विभाजन तक बना सकते हैं। आपके द्वारा प्रति क्लस्टर किए जा सकने वाले विभाजनों की संख्या में 20 गुना वृद्धि से आप प्रति क्लस्टर अधिक विषय बना सकते हैं और अधिक एप्लिकेशन समानांतर में डेटा का उपभोग कर सकते हैं। आप ठीक-ठाक अभिगम नियंत्रण के साथ डेटा के बेहतर अलगाव को भी लागू कर सकते हैं। सीडीसी उपयोग के मामलों के लिए अधिक विभाजन विशेष रूप से उपयोगी होते हैं जहां डेटाबेस में प्रत्येक तालिका में सैकड़ों अनक्यू कुंजियाँ होती हैं, जो प्रत्येक एक अद्वितीय विभाजन के लिए मैप की जाती हैं। अधिक विभाजनों के साथ, आप बहुत सारे तालिकाओं और सैकड़ों चाबियों के साथ बड़े डेटाबेस में परिवर्तनों को कैप्चर करने के लिए MSK सर्वरलेस का उपयोग कर सकते हैं। ध्यान दें कि 2,400 की सीमा केवल लीडर विभाजन पर लागू होती है। MSK Serverless बिना किसी अतिरिक्त लागत के डिफ़ॉल्ट रूप से प्रत्येक विभाजन की दो प्रतिकृतियां बनाता है जो इस सीमा के लिए नहीं गिने जाते हैं।
असीमित डेटा प्रतिधारण अवधि
अपाचे काफ्का उपभोक्ता एपीआई का उपयोग करके डेटा तक पहुंचने की आवश्यकता के आधार पर आपके द्वारा अपने विषयों के लिए उत्पादित डेटा को कॉन्फ़िगर करने योग्य अवधि के लिए अपाचे काफ्का में रखा जा सकता है। आम तौर पर, ग्राहक कुछ घंटों से लेकर कुछ दिनों तक, कम समय के लिए डेटा बनाए रखते हैं। पहले, MSK सर्वर रहित डेटा प्रतिधारण को अधिकतम 24 घंटे (1 दिन) तक सीमित करता था, जो कि सबसे लोकप्रिय Apache Kafka उपयोग मामलों के लिए पर्याप्त है। हालाँकि, कुछ उपयोग मामलों में ग्राहकों को डेटा को लंबे समय तक बनाए रखने की आवश्यकता होती है, जैसे ऑडिट उद्देश्यों के लिए डेटा बनाए रखना या एप्लिकेशन रिकवरी SLAs बनाए रखना।
अब, डेटा प्रतिधारण अवधि कोटा में वृद्धि के साथ, आप अपने MSK सर्वर रहित क्लस्टर में जब तक चाहें तब तक डेटा बनाए रख सकते हैं। लंबे समय तक डेटा प्रतिधारण विशेष रूप से उपयोग के मामलों के लिए उपयोगी होता है जहां आपके उपभोक्ता अनुप्रयोगों को पुराने डेटा तक त्वरित पहुंच की आवश्यकता होती है। उदाहरण के लिए, विफलता के मामले में, एप्लिकेशन को अपनी स्थिति को फिर से बनाने के लिए विषय की शुरुआत से डेटा तक पहुंचने की आवश्यकता हो सकती है। क्योंकि अब आप अपने विषयों में डेटा को लंबे समय तक बनाए रख सकते हैं, आप काफ्का के उपभोक्ता एपीआई का उपयोग करके पुराने डेटा तक पहुंच कर अपने एप्लिकेशन की स्थिति को पुनर्स्थापित कर सकते हैं, जिससे ऐसी विफलताओं से उबरना आसान हो जाता है। एप्लिकेशन के ठीक होने के बाद, आप अपने एप्लिकेशन की स्थिति को पुनर्स्थापित करने के लिए आवश्यक शुरुआती टाइमस्टैम्प से डेटा का उपभोग शुरू करने के लिए अपने एप्लिकेशन को कॉन्फ़िगर कर सकते हैं। ध्यान दें कि आप प्रति विभाजन केवल 250 जीबी तक डेटा ही रख सकते हैं। जब तक आपका विभाजन आकार में 250 जीबी तक नहीं पहुंचता, तब तक आप इसे अपनी इच्छानुसार रख सकते हैं। यदि आपको किसी दिए गए विषय के लिए अधिक संग्रहण की आवश्यकता है, तो आप अधिक विभाजन बना सकते हैं।
ये नए कोटे उन सभी क्षेत्रों में उपलब्ध हैं जहाँ MSK Serverless उपलब्ध है। अधिक जानकारी के लिए, पर नेविगेट करें एमएसके सर्वर रहित टैब पर अमेज़ॅन एमएसके मूल्य निर्धारण पृष्ठ और चुनिए क्षेत्र ड्रॉप डाउन मेनू।
आप द्वारा विभाजन कोटा की अधिकतम संख्या में वृद्धि का अनुरोध भी कर सकते हैं से संपर्क AWS समर्थन यदि आपको क्लस्टर में 2,400 से अधिक विभाजन की आवश्यकता है। अधिक विभाजन और लंबे समय तक अवधारण के लिए कोटा मौजूदा और नए क्लस्टर दोनों पर लागू होता है।
आरंभ करना: 1,000 विभाजनों और 7-दिनों के प्रतिधारण के साथ एक विषय बनाएँ
इस खंड में, हम प्रदर्शित करते हैं कि MSK सर्वर रहित में एक विषय कैसे बनाया जाए, विभाजनों की संख्या निर्दिष्ट करें, और इसकी अवधारण अवधि निर्धारित करें।
एक शर्त के रूप में, आपके पास एक MSK सर्वर रहित क्लस्टर और एक Apache Kafka क्लाइंट होना चाहिए। को देखें MSK सर्वर रहित क्लस्टर का उपयोग करना प्रारंभ करना चरण-दर-चरण निर्देशों के लिए
- अपनी क्लाइंट मशीन पर, access
kafka_2.12-2.8.1/bin
और निम्नलिखित चलाएँexport
कमांड ('my-endpoint' को अपने MSK सर्वर रहित क्लस्टर के बूटस्ट्रैप सर्वर स्ट्रिंग से बदलें): - नामक विषय बनाने के लिए निम्नलिखित कमांड चलाएँ
msk-sample-topic
1,000 विभाजन और 7-दिन डेटा प्रतिधारण (604,800,000 मिलीसेकंड) के साथ: - (वैकल्पिक) उपरोक्त चरण 2 में आपके द्वारा बनाए गए विषय का विवरण देखने के लिए निम्नलिखित कमांड चलाएँ:
आप निम्न परिणाम देखेंगे:
क्लीन अप
इस पोस्ट में बनाए गए AWS संसाधनों पर लगने वाले शुल्क से बचने के लिए, MSK सर्वर रहित क्लस्टर और अमेज़ॅन इलास्टिक कम्प्यूट क्लाउड (अमेज़ॅन ईसी 2) आपके क्लाइंट मशीन के लिए उदाहरण।
- Amazon MSK कंसोल पर, इस समाधान के लिए आपके द्वारा उपयोग किए गए MSK सर्वर रहित क्लस्टर का चयन करें।
- चुनें क्रियाएँ, उसके बाद चुनो मिटाना.
- Amazon EC2 कंसोल पर, उस उदाहरण का चयन करें जिसे आपने अपने Apache Kafka क्लाइंट मशीन के लिए बनाया था।
- चुनें उदाहरण स्थिति, उसके बाद चुनो उदाहरण समाप्त करें.
निष्कर्ष
इस पोस्ट में दिखाया गया है कि 1,000 विभाजन और 7-दिन के अवधारण के साथ MSK सर्वर रहित क्लस्टर विषय कैसे बनाया जाए। नया कोटा बढ़ने के साथ, आप प्रति क्लस्टर 2,400 तक विभाजन बना सकते हैं और जब तक आपको आवश्यकता हो तब तक डेटा बनाए रख सकते हैं। यदि आपके पास टिप्पणियां या फीडबैक हैं, तो कृपया उन्हें टिप्पणियों में छोड़ने के लिए स्वतंत्र महसूस करें।
लेखक के बारे में
उसामा नसीम Amazon MSK के लिए एक वरिष्ठ उत्पाद प्रबंधक है और MSK सर्वरलेस पर ध्यान केंद्रित करता है। पहले, उन्होंने AWS लैम्ब्डा और Amazon Fresh के लिए उत्पाद प्रबंधन की भूमिकाएँ निभाईं। उन्हें ग्राहकों को क्लाउड में रीयल-टाइम एप्लिकेशन बनाने के लिए टूल देने का शौक है। काम के बाहर, वह इस भ्रम में रहता है कि वह एक दिन दुनिया का सर्वश्रेष्ठ स्क्वैश खिलाड़ी होगा।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/big-data/create-more-partitions-and-retain-data-for-longer-in-your-msk-serverless-clusters/
- 000
- 1
- 100
- 2022
- a
- About
- ऊपर
- पहुँच
- तक पहुँचने
- अतिरिक्त
- बाद
- सब
- वीरांगना
- अमेज़ॅन EC2
- और
- अपाचे
- अपाचे काफ्का
- एपीआई
- एपीआई
- आवेदन
- अनुप्रयोगों
- लागू
- अप्रैल
- आडिट
- स्वतः
- उपलब्ध
- से बचने
- एडब्ल्यूएस
- AWS लाम्बा
- आधारित
- क्योंकि
- BEST
- बेहतर
- जूते का फीता
- निर्माण
- बुलाया
- क्षमताओं
- क्षमता
- कब्जा
- कैप्चरिंग
- मामला
- मामलों
- सीडीसी
- परिवर्तन
- परिवर्तन
- प्रभार
- चुनें
- ग्राहक
- बादल
- समूह
- टिप्पणियाँ
- गणना करना
- कंसोल
- उपभोग
- उपभोक्ता
- जारी
- नियंत्रण
- लागत
- बनाना
- बनाया
- बनाता है
- ग्राहक
- ग्राहक
- तिथि
- डेटा संसाधन
- डाटाबेस
- डेटाबेस
- दिन
- दिन
- दिसंबर
- चूक
- दिखाना
- साबित
- निर्भर करता है
- विस्तार
- विवरण
- डेवलपर्स
- चर्चा करना
- नहीं करता है
- dont
- से प्रत्येक
- आसान
- चुनाव
- ईथर (ईटीएच)
- और भी
- उदाहरण
- उत्तेजक
- मौजूदा
- विफलता
- और तेज
- प्रतिक्रिया
- कुछ
- फ़ाइलें
- केंद्रित
- निम्नलिखित
- प्रारूप
- मुक्त
- ताजा
- से
- पूरी तरह से
- दी
- देते
- होने
- सिर
- धारित
- अत्यधिक
- घंटे
- कैसे
- How To
- तथापि
- एचटीएमएल
- HTTPS
- सैकड़ों
- लागू करने के
- in
- बढ़ना
- वृद्धि हुई
- बढ़ जाती है
- करें-
- उदाहरण
- निर्देश
- अलगाव
- IT
- काफ्का
- Instagram पर
- बड़ा
- शुभारंभ
- नेता
- छोड़ना
- चलें
- सीमा
- सीमित
- लंबा
- लंबे समय तक
- मशीन
- बनाया गया
- बनाता है
- निर्माण
- कामयाब
- प्रबंध
- प्रबंधक
- अधिकतम
- मेन्यू
- message
- अधिक
- अधिकांश
- सबसे लोकप्रिय
- विभिन्न
- नेविगेट करें
- आवश्यकता
- जरूरत
- नया
- संख्या
- ONE
- ऑप्टिमाइज़ करें
- बाहर
- समानांतर
- विशेष रूप से
- आवेशपूर्ण
- अवधि
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- खिलाड़ी
- कृप्या अ
- लोकप्रिय
- पद
- पहले से
- कीमत निर्धारण
- प्रसंस्करण
- उत्पादन
- उत्पादक
- एस्ट्रो मॉल
- उत्पाद प्रबंधन
- उत्पादन प्रबंधक
- गुण
- प्रदान करना
- प्रावधान
- प्रयोजनों
- त्वरित
- लेकर
- पहुंच
- वास्तविक समय
- वास्तविक समय डाटा
- की वसूली
- ठीक
- वसूली
- क्षेत्रों
- की जगह
- का अनुरोध
- की आवश्यकता होती है
- आवश्यकताएँ
- उपयुक्त संसाधन चुनें
- परिणाम
- बनाए रखने की
- प्रतिधारण
- भूमिकाओं
- रन
- स्केलेबल
- तराजू
- अनुभाग
- सुरक्षित
- खंड
- वरिष्ठ
- serverless
- सेवा
- सेट
- कम
- आकार
- So
- समाधान
- कुछ
- प्रारंभ
- शुरू
- राज्य
- कदम
- भंडारण
- स्ट्रीमिंग
- ऐसा
- पर्याप्त
- समर्थन
- तालिका
- टीम
- RSI
- दुनिया
- लेकिन हाल ही
- पहर
- टाइमस्टैम्प
- सेवा मेरे
- उपकरण
- विषय
- विषय
- की ओर
- आम तौर पर
- के अंतर्गत
- अद्वितीय
- us
- उपयोग
- उदाहरण
- विविधता
- देखें
- कौन कौन से
- मर्जी
- बिना
- काम
- काम किया
- विश्व
- लिखा हुआ
- आपका
- जेफिरनेट