अमेज़ॅन सेजमेकर का उपयोग करके सिमेंटिक सेगमेंटेशन डेटा लेबलिंग और मॉडल प्रशिक्षण

स्रोत नोड: 1551223

कंप्यूटर विज़न में, सिमेंटिक सेगमेंटेशन एक छवि में प्रत्येक पिक्सेल को लेबल के ज्ञात सेट से एक वर्ग के साथ वर्गीकृत करने का कार्य है, जैसे कि समान लेबल वाले पिक्सेल कुछ विशेषताओं को साझा करते हैं। यह इनपुट छवियों का एक विभाजन मुखौटा उत्पन्न करता है। उदाहरण के लिए, निम्नलिखित छवियां एक विभाजन मुखौटा दिखाती हैं cat लेबल।

नवम्बर 2018 में, अमेज़न SageMaker सेजमेकर सिमेंटिक सेगमेंटेशन एल्गोरिथम के लॉन्च की घोषणा की। इस एल्गोरिथम के साथ, आप अपने मॉडल को सार्वजनिक डेटासेट या अपने स्वयं के डेटासेट के साथ प्रशिक्षित कर सकते हैं। लोकप्रिय इमेज सेगमेंटेशन डेटासेट में कॉमन ऑब्जेक्ट इन कॉन्टेक्स्ट (COCO) डेटासेट और PASCAL विज़ुअल ऑब्जेक्ट क्लासेस (PASCAL VOC) शामिल हैं, लेकिन उनके लेबल की कक्षाएं सीमित हैं और आप लक्ष्य ऑब्जेक्ट पर एक मॉडल को प्रशिक्षित करना चाह सकते हैं जो इसमें शामिल नहीं हैं। सार्वजनिक डेटासेट। इस मामले में, आप उपयोग कर सकते हैं अमेज़ॅन सैजमेकर ग्राउंड ट्रुथ अपने स्वयं के डेटासेट को लेबल करने के लिए।

इस पोस्ट में, मैं निम्नलिखित समाधान प्रदर्शित करता हूं:

  • सिमेंटिक सेगमेंटेशन डेटासेट को लेबल करने के लिए ग्राउंड ट्रुथ का उपयोग करना
  • सेजमेकर बिल्ट-इन सिमेंटिक सेगमेंटेशन एल्गोरिथम के लिए ग्राउंड ट्रुथ से परिणामों को आवश्यक इनपुट प्रारूप में बदलना
  • मॉडल को प्रशिक्षित करने और निष्कर्ष निकालने के लिए सिमेंटिक सेगमेंटेशन एल्गोरिदम का उपयोग करना

सिमेंटिक सेगमेंटेशन डेटा लेबलिंग

सिमेंटिक सेगमेंटेशन के लिए मशीन लर्निंग मॉडल बनाने के लिए, हमें एक डेटासेट को पिक्सेल स्तर पर लेबल करना होगा। ग्राउंड ट्रुथ आपको के माध्यम से मानव व्याख्याकारों का उपयोग करने का विकल्प देता है अमेज़ॅन मैकेनिकल तुर्क, तृतीय-पक्ष विक्रेता, या आपका अपना निजी कार्यबल। कार्यबल के बारे में अधिक जानने के लिए, देखें Workforces बनाएँ और प्रबंधित करें. यदि आप लेबलिंग कार्यबल को स्वयं प्रबंधित नहीं करना चाहते हैं, अमेज़न सेजमेकर ग्राउंड ट्रुथ प्लस नई टर्नकी डेटा लेबलिंग सेवा के रूप में एक और बढ़िया विकल्प है जो आपको उच्च-गुणवत्ता वाले प्रशिक्षण डेटासेट जल्दी से बनाने में सक्षम बनाता है और लागत को 40% तक कम करता है। इस पोस्ट के लिए, मैं आपको दिखाता हूं कि कैसे ग्राउंड ट्रुथ ऑटो-सेगमेंट फीचर के साथ डेटासेट को मैन्युअल रूप से लेबल करना है और मैकेनिकल तुर्क वर्कफोर्स के साथ क्राउडसोर्स लेबलिंग करना है।

ग्राउंड ट्रुथ के साथ मैनुअल लेबलिंग

दिसंबर 2019 में, ग्राउंड ट्रुथ ने लेबलिंग थ्रूपुट को बढ़ाने और सटीकता में सुधार करने के लिए सिमेंटिक सेगमेंटेशन लेबलिंग यूजर इंटरफेस में एक ऑटो-सेगमेंट फीचर जोड़ा। अधिक जानकारी के लिए देखें अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ के साथ सिमेंटिक सेगमेंटेशन लेबलिंग करते समय ऑटो-सेगमेंटिंग ऑब्जेक्ट्स. इस नई सुविधा के साथ, आप विभाजन कार्यों पर अपनी लेबलिंग प्रक्रिया को तेज कर सकते हैं। किसी छवि में किसी ऑब्जेक्ट को कैप्चर करने के लिए कसकर फिटिंग वाले बहुभुज को खींचने या ब्रश टूल का उपयोग करने के बजाय, आप केवल चार बिंदुओं को आकर्षित करते हैं: ऑब्जेक्ट के सबसे ऊपर, सबसे नीचे, सबसे बाएं, और दाएं-अधिकांश बिंदुओं पर। ग्राउंड ट्रुथ इन चार बिंदुओं को इनपुट के रूप में लेता है और ऑब्जेक्ट के चारों ओर कसकर फिटिंग मास्क बनाने के लिए डीप एक्सट्रीम कट (DEXTR) एल्गोरिथम का उपयोग करता है। इमेज सिमेंटिक सेगमेंटेशन लेबलिंग के लिए ग्राउंड ट्रुथ का उपयोग करने वाले ट्यूटोरियल के लिए, देखें छवि शब्दार्थ विभाजनment. किसी ऑब्जेक्ट के चार चरम बिंदुओं को चुनने के बाद ऑटो-सेगमेंटेशन टूल स्वचालित रूप से सेगमेंटेशन मास्क कैसे उत्पन्न करता है, इसका एक उदाहरण निम्नलिखित है।

मैकेनिकल तुर्क कार्यबल के साथ क्राउडसोर्सिंग लेबलिंग

यदि आपके पास एक बड़ा डेटासेट है और आप स्वयं सैकड़ों या हजारों छवियों को मैन्युअल रूप से लेबल नहीं करना चाहते हैं, तो आप मैकेनिकल तुर्क का उपयोग कर सकते हैं, जो एक ऑन-डिमांड, स्केलेबल, मानव कार्यबल प्रदान करता है ताकि वह कार्य पूरा कर सके जो मनुष्य कंप्यूटर से बेहतर कर सकते हैं। मैकेनिकल तुर्क सॉफ्टवेयर अपनी सुविधानुसार टुकड़ों में काम करने के इच्छुक हजारों श्रमिकों को नौकरी के प्रस्तावों को औपचारिक रूप देता है। सॉफ़्टवेयर प्रदर्शन किए गए कार्य को भी पुनर्प्राप्त करता है और इसे आपके लिए संकलित करता है, अनुरोधकर्ता, जो श्रमिकों को संतोषजनक कार्य (केवल) के लिए भुगतान करता है। मैकेनिकल तुर्क के साथ आरंभ करने के लिए, देखें अमेज़न मैकेनिकल तुर्क का परिचय.

एक लेबलिंग कार्य बनाएँ

समुद्री कछुए डेटासेट के लिए मैकेनिकल तुर्क लेबलिंग नौकरी का एक उदाहरण निम्नलिखित है। समुद्री कछुआ डेटासेट कागल प्रतियोगिता से है समुद्री कछुआ चेहरा पहचान, और मैंने प्रदर्शन उद्देश्यों के लिए डेटासेट की 300 छवियों का चयन किया। सार्वजनिक डेटासेट में समुद्री कछुआ एक सामान्य वर्ग नहीं है, इसलिए यह एक ऐसी स्थिति का प्रतिनिधित्व कर सकता है जिसके लिए बड़े पैमाने पर डेटासेट को लेबल करने की आवश्यकता होती है।

  1. SageMaker कंसोल पर, चुनें नौकरियों पर लेबल लगाना नेविगेशन फलक में
  2. चुनें लेबलिंग कार्य बनाएँ.
  3. अपनी नौकरी के लिए एक नाम दर्ज करें।
  4. के लिए इनपुट डेटा सेटअप, चुनते हैं स्वचालित डेटा सेटअप.
    यह इनपुट डेटा का एक मेनिफेस्ट उत्पन्न करता है।
  5. के लिए इनपुट डेटासेट के लिए S3 स्थान, डेटासेट के लिए पथ दर्ज करें।
  6. के लिए कार्य श्रेणी, चुनें छवि.
  7. के लिए कार्य चयन, चुनते हैं शब्दार्थ विभाजन.
  8. के लिए कार्यकर्ता प्रकार, चुनते हैं अमेज़ॅन मैकेनिकल तुर्क.
  9. कार्य समयबाह्य, कार्य समाप्ति समय और मूल्य प्रति कार्य के लिए अपनी सेटिंग्स कॉन्फ़िगर करें।
  10. एक लेबल जोड़ें (इस पोस्ट के लिए, sea turtle), और लेबलिंग निर्देश प्रदान करें।
  11. चुनें बनाएं.

लेबलिंग कार्य सेट करने के बाद, आप सेजमेकर कंसोल पर लेबलिंग प्रगति की जांच कर सकते हैं। जब इसे पूर्ण के रूप में चिह्नित किया जाता है, तो आप परिणामों की जांच करने के लिए कार्य चुन सकते हैं और अगले चरणों के लिए उनका उपयोग कर सकते हैं।

डेटासेट परिवर्तन

ग्राउंड ट्रुथ से आउटपुट प्राप्त करने के बाद, आप इस डेटासेट पर एक मॉडल को प्रशिक्षित करने के लिए सेजमेकर बिल्ट-इन एल्गोरिदम का उपयोग कर सकते हैं। सबसे पहले, आपको सेजमेकर सिमेंटिक सेगमेंटेशन एल्गोरिथम के लिए अनुरोधित इनपुट इंटरफ़ेस के रूप में लेबल किए गए डेटासेट को तैयार करने की आवश्यकता है।

अनुरोधित इनपुट डेटा चैनल

सेजमेकर सिमेंटिक सेगमेंटेशन आपके प्रशिक्षण डेटासेट को संग्रहीत करने की अपेक्षा करता है अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। Amazon S3 में डेटासेट को दो चैनलों में प्रस्तुत किए जाने की उम्मीद है, एक के लिए train और एक के लिए validation, चार निर्देशिकाओं का उपयोग करते हुए, दो छवियों के लिए और दो एनोटेशन के लिए। एनोटेशन के असम्पीडित PNG छवियों के होने की उम्मीद है। डेटासेट में एक लेबल मैप भी हो सकता है जो बताता है कि एनोटेशन मैपिंग कैसे स्थापित की जाती है। यदि नहीं, तो एल्गोरिथ्म डिफ़ॉल्ट का उपयोग करता है। अनुमान के लिए, एक समापन बिंदु a . के साथ छवियों को स्वीकार करता है image/jpeg सामग्री प्रकार। डेटा चैनलों की आवश्यक संरचना निम्नलिखित है:

s3://bucket_name |- train | - image1.jpg | - image2.jpg |- validation | - image3.jpg | - image4.jpg |- train_annotation | - image1.png | - image2.png |- validation_annotation | - image3.png | - image4.png |- label_map | - train_label_map.json | - validation_label_map.json

ट्रेन और सत्यापन निर्देशिका में प्रत्येक JPG छवि में समान नाम के साथ संबंधित PNG लेबल छवि होती है train_annotation और validation_annotation निर्देशिका। यह नामकरण परंपरा एल्गोरिथ्म को प्रशिक्षण के दौरान एक लेबल को उसकी संगत छवि के साथ जोड़ने में मदद करती है। ट्रेन, train_annotation, सत्यापन, और validation_annotation चैनल अनिवार्य हैं। एनोटेशन सिंगल-चैनल PNG इमेज हैं। प्रारूप तब तक काम करता है जब तक छवि में मेटाडेटा (मोड) एल्गोरिदम को एनोटेशन छवियों को एकल-चैनल 8-बिट अहस्ताक्षरित पूर्णांक में पढ़ने में मदद करता है।

ग्राउंड ट्रुथ लेबलिंग जॉब से आउटपुट

ग्राउंड ट्रुथ लेबलिंग जॉब से उत्पन्न आउटपुट में निम्नलिखित फ़ोल्डर संरचना होती है:

s3://turtle2022/labelturtles/ |- activelearning |- annotation-tool |- annotations | - consolidated-annotation | - consolidation-request | - consolidation-response | - output | -0_2022-02-10T17:40:03.294994.png | -0_2022-02-10T17:41:04.530266.png | - intermediate | - worker-response |- intermediate |- manifests | - output | - output.manifest

विभाजन मास्क में सहेजे जाते हैं s3://turtle2022/labelturtles/annotations/consolidated-annotation/output. प्रत्येक एनोटेशन छवि एक .png फ़ाइल होती है जिसका नाम स्रोत छवि के सूचकांक और उस समय के नाम पर रखा जाता है जब यह छवि लेबलिंग पूरी हुई थी। उदाहरण के लिए, मैकेनिकल तुर्क वर्कफोर्स (1_0-2022-02T10:17:41.png) द्वारा उत्पन्न सोर्स इमेज (Image_04.724225.jpg) और इसका सेगमेंटेशन मास्क निम्नलिखित हैं। ध्यान दें कि मुखौटा का सूचकांक स्रोत छवि नाम की संख्या से भिन्न होता है।

लेबलिंग जॉब से आउटपुट मेनिफेस्ट में है /manifests/output/output.manifest फ़ाइल। यह एक JSON फ़ाइल है, और प्रत्येक पंक्ति स्रोत छवि और उसके लेबल और अन्य मेटाडेटा के बीच मैपिंग रिकॉर्ड करती है। निम्न JSON लाइन दिखाए गए स्रोत छवि और उसके एनोटेशन के बीच मैपिंग रिकॉर्ड करती है:

{"source-ref":"s3://turtle2022/Image_1.jpg","labelturtles-ref":"s3://turtle2022/labelturtles/annotations/consolidated-annotation/output/0_2022-02-10T17:41:04.724225.png","labelturtles-ref-metadata":{"internal-color-map":{"0":{"class-name":"BACKGROUND","hex-color":"#ffffff","confidence":0.25988},"1":{"class-name":"Turtle","hex-color":"#2ca02c","confidence":0.25988}},"type":"groundtruth/semantic-segmentation","human-annotated":"yes","creation-date":"2022-02-10T17:41:04.801793","job-name":"labeling-job/labelturtles"}}

स्रोत छवि को Image_1.jpg कहा जाता है, और एनोटेशन का नाम 0_2022-02-10T17:41: 04.724225.png है। डेटा को सेजमेकर सिमेंटिक सेगमेंटेशन एल्गोरिथम के आवश्यक डेटा चैनल प्रारूपों के रूप में तैयार करने के लिए, हमें एनोटेशन नाम बदलने की आवश्यकता है ताकि इसका नाम स्रोत जेपीजी छवियों के समान हो। और हमें डेटासेट को भी विभाजित करने की आवश्यकता है train और validation स्रोत छवियों और एनोटेशन के लिए निर्देशिका।

ग्राउंड ट्रुथ लेबलिंग जॉब से आउटपुट को अनुरोधित इनपुट फॉर्मेट में बदलना

आउटपुट बदलने के लिए, निम्न चरणों को पूरा करें:

  1. Amazon S3 से स्थानीय निर्देशिका में लेबलिंग कार्य से सभी फ़ाइलें डाउनलोड करें:
    !aws s3 cp s3://turtle2022/ Seaturtles --recursive

  2. मेनिफेस्ट फ़ाइल पढ़ें और एनोटेशन के नामों को स्रोत छवियों के समान नामों में बदलें:
    import os
    import re label_job='labelturtles'
    manifest_path=dir_name+'/'+label_job+'/'+'manifests/output/output.manifest' file = open(manifest_path, "r") txt=file.readlines()
    output_path=dir_name+'/'+label_job+'/'+'annotations/consolidated-annotation/output'
    S3_name='turtle2022/'
    im_list=[]
    for i in range(len(txt)): string = txt[i] try: im_name = re.search(S3_name+'(.+)'+'.jpg', string).group(1) print(im_name) im_png=im_name+'.png' im_list.append(im_name) annotation_name = re.search('output/(.+?)"', string).group(1) os.rename(annotation_name, im_png) except AttributeError: pass

  3. ट्रेन और सत्यापन डेटासेट को विभाजित करें:
    import numpy as np
    from random import sample # Prints list of random items of given length
    train_num=len(im_list)*0.8
    test_num=len(im_list)*0.2
    train_name=sample(im_list,int(train_num))
    test_name = list(set(im_list) - set(train_name))

  4. सिमेंटिक सेगमेंटेशन एल्गोरिथम डेटा चैनल के लिए आवश्यक प्रारूप में एक निर्देशिका बनाएं:
    os.chdir('./semantic_segmentation_pascalvoc_2022-01-11')
    os.mkdir('train')
    os.mkdir('validation')
    os.mkdir('train_annotation')
    os.mkdir('validation_annotation')

  5. ट्रेन और सत्यापन छवियों और उनके एनोटेशन को बनाई गई निर्देशिकाओं में ले जाएं।
    1. छवियों के लिए, निम्न कोड का उपयोग करें:
      for i in range(len(train_name)): train_im=train_name[i]+'.jpg' train_im_path=dir_name+'/'+train_im train_new_path='train/'+train_im shutil.move(train_im_path,train_new_path) train_annotation=train_name[i]+'.png' train_annotation_path=dir_name+'/labelturtles/annotations/consolidated-annotation/output/'+train_annotation train_annotation_new_path='train_annotation/'+train_annotation shutil.move(train_annotation_path,train_annotation_new_path)

    2. एनोटेशन के लिए, निम्न कोड का उपयोग करें:
      for i in range(len(test_name)): val_im=test_name[i]+'.jpg' val_im_path=dir_name+'/'+val_im val_new_path='validation/'+val_im shutil.move(val_im_path,val_new_path) val_annotation=test_name[i]+'.png' val_annotation_path=dir_name+'/labelturtles/annotations/consolidated-annotation/output/'+val_annotation val_annotation_new_path='validation_annotationT/'+val_annotation shutil.move(val_annotation_path,val_annotation_new_path)

  6. Amazon S3 पर ट्रेन और सत्यापन डेटासेट और उनके एनोटेशन डेटासेट अपलोड करें:
    !aws s3 cp train s3://turtle2022/train/ --recursive
    !aws s3 cp train_annotation s3://turtle2022/train_annotation/ --recursive
    !aws s3 cp validation s3://turtle2022/validation/ --recursive
    !aws s3 cp validation_annotation s3://turtle2022/validation_annotation/ --recursive

सेजमेकर सिमेंटिक सेगमेंटेशन मॉडल ट्रेनिंग

इस खंड में, हम आपके सिमेंटिक सेगमेंटेशन मॉडल को प्रशिक्षित करने के चरणों के माध्यम से चलते हैं।

नमूना नोटबुक का पालन करें और डेटा चैनल सेट करें

आप में निर्देशों का पालन कर सकते हैं सिमेंटिक सेगमेंटेशन एल्गोरिथम अब अमेज़न सेजमेकर में उपलब्ध है अपने लेबल किए गए डेटासेट में सिमेंटिक सेगमेंटेशन एल्गोरिदम लागू करने के लिए। यह नमूना नोटबुक एल्गोरिदम का परिचय देने वाला एक एंड-टू-एंड उदाहरण दिखाता है। नोटबुक में, आप सीखते हैं कि पूरी तरह से दृढ़ नेटवर्क का उपयोग करके सिमेंटिक सेगमेंटेशन मॉडल को कैसे प्रशिक्षित और होस्ट किया जाए (FCN) एल्गोरिथ्म का उपयोग कर पास्कल वीओसी डेटासेट प्रशिक्षण के लिए। चूंकि मैं पास्कल वीओसी डेटासेट से किसी मॉडल को प्रशिक्षित करने की योजना नहीं बना रहा हूं, इसलिए मैंने इस नोटबुक में चरण 3 (डेटा तैयारी) को छोड़ दिया है। इसके बजाय, मैंने सीधे बनाया train_channel, train_annotation_channe, validation_channel, तथा validation_annotation_channel S3 स्थानों का उपयोग करके जहाँ मैंने अपनी छवियों और टिप्पणियों को संग्रहीत किया है:

Train_channel=’s3://turtle2022/train’
train_annotation_channel=’s3://turtle2022/train_annotation’
validation_channel=’s3://turtle2022/validation’
validation_annotation_channel=’s3://turtle2022/validation_annotation’

SageMaker अनुमानक में अपने स्वयं के डेटासेट के लिए हाइपरपैरामीटर समायोजित करें

मैंने नोटबुक का अनुसरण किया और एक सेजमेकर अनुमानक वस्तु बनाई (ss_estimator) मेरे विभाजन एल्गोरिथ्म को प्रशिक्षित करने के लिए। एक चीज़ जिसे हमें नए डेटासेट के लिए अनुकूलित करने की आवश्यकता है वह है ss_estimator.set_hyperparameters: हमें बदलने की जरूरत है num_classes=21 सेवा मेरे num_classes=2 (turtle और background), और मैं भी बदल गया epochs=10 सेवा मेरे epochs=30 क्योंकि 10 केवल डेमो उद्देश्यों के लिए है। तब मैंने सेटिंग द्वारा मॉडल प्रशिक्षण के लिए p3.2xlarge उदाहरण का उपयोग किया instance_type="ml.p3.2xlarge". प्रशिक्षण 8 मिनट में पूरा हुआ। सबसे अच्छा एमआईओयू (संघ पर औसत चौराहे) 0.846 के युग 11 में प्राप्त किया जाता है a pix_acc (आपकी छवि में पिक्सेल का प्रतिशत जो सही ढंग से वर्गीकृत किया गया है) 0.925 है, जो इस छोटे डेटासेट के लिए एक बहुत अच्छा परिणाम है।

मॉडल अनुमान परिणाम

मैंने मॉडल को कम लागत वाले ml.c5.xlarge उदाहरण पर होस्ट किया:

training_job_name = 'ss-notebook-demo-2022-02-12-03-37-27-151'
ss_estimator = sagemaker.estimator.Estimator.attach(training_job_name)
ss_predictor = ss_estimator.deploy(initial_instance_count=1, instance_type="ml.c5.xlarge")

अंत में, मैंने प्रशिक्षित विभाजन मॉडल के निष्कर्ष परिणाम देखने के लिए 10 कछुआ छवियों का एक परीक्षण सेट तैयार किया:

import os path = "testturtle/"
img_path_list=[]
files = os.listdir(path) for file in files: if file.endswith(('.jpg', '.png', 'jpeg')): img_path = path + file img_path_list.append(img_path) colnum=5
fig, axs = plt.subplots(2, colnum, figsize=(20, 10)) for i in range(len(img_path_list)): print(img_path_list[i]) img = mpimg.imread(img_path_list[i]) with open(img_path_list[i], "rb") as imfile: imbytes = imfile.read() cls_mask = ss_predictor.predict(imbytes) axs[int(i/colnum),i%colnum].imshow(img, cmap='gray') axs[int(i/colnum),i%colnum].imshow(np.ma.masked_equal(cls_mask,0), cmap='jet', alpha=0.8) plt.show()

निम्नलिखित छवियां परिणाम दिखाती हैं।

समुद्री कछुओं के विभाजन के मुखौटे सटीक दिखते हैं और मैं मैकेनिकल तुर्क श्रमिकों द्वारा लेबल किए गए 300-छवि डेटासेट पर प्रशिक्षित इस परिणाम से खुश हूं। आप अन्य उपलब्ध नेटवर्कों को भी एक्सप्लोर कर सकते हैं जैसे कि पिरामिड-सीन-पार्सिंग नेटवर्क (PSP) or डीपलैब-वी3 अपने डेटासेट के साथ नमूना नोटबुक में।

क्लीन अप

निरंतर लागतों से बचने के लिए जब आप समापन बिंदु को समाप्त कर लें तो उसे हटा दें:

ss_predictor.delete_endpoint()

निष्कर्ष

इस पोस्ट में, मैंने दिखाया कि सेजमेकर का उपयोग करके सिमेंटिक सेगमेंटेशन डेटा लेबलिंग और मॉडल प्रशिक्षण को कैसे अनुकूलित किया जाए। सबसे पहले, आप ऑटो-सेगमेंटेशन टूल के साथ एक लेबलिंग जॉब सेट कर सकते हैं या मैकेनिकल तुर्क वर्कफोर्स (साथ ही अन्य विकल्प) का उपयोग कर सकते हैं। यदि आपके पास 5,000 से अधिक ऑब्जेक्ट हैं, तो आप स्वचालित डेटा लेबलिंग का भी उपयोग कर सकते हैं। फिर आप अपने ग्राउंड ट्रुथ लेबलिंग जॉब से आउटपुट को सेजमेकर बिल्ट-इन सिमेंटिक सेगमेंटेशन ट्रेनिंग के लिए आवश्यक इनपुट फॉर्मेट में बदल देते हैं। उसके बाद, आप निम्नलिखित के साथ सिमेंटिक सेगमेंटेशन मॉडल को प्रशिक्षित करने के लिए एक त्वरित कंप्यूटिंग इंस्टेंस (जैसे पी 2 या पी 3) का उपयोग कर सकते हैं नोटबुक और मॉडल को अधिक लागत प्रभावी उदाहरण (जैसे ml.c5.xlarge) पर परिनियोजित करें। अंत में, आप कोड की कुछ पंक्तियों के साथ अपने परीक्षण डेटासेट पर अनुमान परिणामों की समीक्षा कर सकते हैं।

सेजमेकर सिमेंटिक सेगमेंटेशन के साथ शुरुआत करें डेटा लेबलिंग और मॉडल प्रशिक्षण अपने पसंदीदा डेटासेट के साथ!


लेखक के बारे में

कारा यांगो एडब्ल्यूएस प्रोफेशनल सर्विसेज में डेटा साइंटिस्ट हैं। वह AWS क्लाउड सेवाओं के साथ ग्राहकों को उनके व्यावसायिक लक्ष्यों को प्राप्त करने में मदद करने के लिए उत्साहित हैं। उन्होंने विनिर्माण, ऑटोमोटिव, पर्यावरणीय स्थिरता और एयरोस्पेस जैसे कई उद्योगों में संगठनों को एमएल समाधान बनाने में मदद की है।

समय टिकट:

से अधिक AWS मशीन लर्निंग

भाषा संबंधी बाधाओं को दूर करना: निर्बाध समर्थन के लिए अमेज़ॅन ट्रांसलेट के साथ एप्लिकेशन लॉग का अनुवाद करें | अमेज़न वेब सेवाएँ

स्रोत नोड: 2267401
समय टिकट: सितम्बर 12, 2023