สตูดิโอ Amazon SageMaker เป็นสภาพแวดล้อมการพัฒนาแบบบูรณาการอย่างสมบูรณ์ (IDE) สำหรับการเรียนรู้ของเครื่อง (ML) ซึ่งอิงตามบางส่วน จูปิเตอร์แล็บ 3. Studio มีอินเทอร์เฟซบนเว็บเพื่อดำเนินการพัฒนา ML แบบโต้ตอบซึ่งจำเป็นสำหรับการเตรียมข้อมูลและสร้าง ฝึก และปรับใช้โมเดล ML ใน Studio คุณสามารถโหลดข้อมูล ปรับโมเดล ML ย้ายระหว่างขั้นตอนเพื่อปรับการทดสอบ เปรียบเทียบผลลัพธ์ และนำโมเดล ML ไปใช้สำหรับการอนุมาน
พื้นที่ ชุดพัฒนา AWS Cloud (AWS CDK) เป็นเฟรมเวิร์กการพัฒนาซอฟต์แวร์แบบโอเพ่นซอร์สสำหรับสร้าง การก่อตัวของ AWS Cloud กอง ผ่านระบบอัตโนมัติ เทมเพลต CloudFormation รุ่น. สแต็กคือชุดของทรัพยากร AWS ที่สามารถอัปเดต ย้าย หรือลบทางโปรแกรมได้ AWS CDK โครงสร้าง เป็นหน่วยการสร้างของแอปพลิเคชัน AWS CDK ซึ่งเป็นตัวแทนของพิมพ์เขียวเพื่อกำหนดสถาปัตยกรรมระบบคลาวด์
การตั้งค่า Studio ด้วย AWS CDK กลายเป็นกระบวนการที่มีประสิทธิภาพมากขึ้น AWS CDK ช่วยให้คุณใช้โครงสร้างแบบเนทีฟเพื่อกำหนดและปรับใช้ Studio โดยใช้โครงสร้างพื้นฐานเป็นโค้ด (IaC) รวมถึง AWS Identity และการจัดการการเข้าถึง สิทธิ์ (AWS IAM) และการกำหนดค่าทรัพยากรระบบคลาวด์ที่ต้องการ ทั้งหมดนี้รวมอยู่ในที่เดียว แนวทางการพัฒนานี้สามารถใช้ร่วมกับแนวทางปฏิบัติที่ดีที่สุดด้านวิศวกรรมซอฟต์แวร์ทั่วไปอื่นๆ เช่น การปรับใช้รหัสอัตโนมัติ การทดสอบ และ ท่อ CI / CD. AWS CDK ช่วยลดเวลาที่ต้องใช้ในการดำเนินการปรับใช้โครงสร้างพื้นฐานทั่วไป ในขณะที่ลดขนาดพื้นที่ผิวสำหรับข้อผิดพลาดของมนุษย์ผ่านระบบอัตโนมัติ
โพสต์นี้จะแนะนำคุณตลอดขั้นตอนในการเริ่มต้นการตั้งค่าและปรับใช้ Studio เพื่อสร้างมาตรฐานการพัฒนาโมเดล ML และการทำงานร่วมกันกับวิศวกร ML และนักวิทยาศาสตร์ ML ตัวอย่างทั้งหมดในโพสต์เขียนด้วยภาษาโปรแกรม Python อย่างไรก็ตาม AWS CDK ให้การสนับสนุนในตัวสำหรับหลายรายการ ภาษาโปรแกรมอื่นๆ เช่น JavaScript, Java และ C#
เบื้องต้น
ในการเริ่มต้นใช้ข้อกำหนดเบื้องต้นต่อไปนี้:
โคลนที่เก็บ GitHub
ก่อนอื่นเรามา โคลน พื้นที่เก็บข้อมูล GitHub.
เมื่อดึงที่เก็บสำเร็จ คุณอาจตรวจสอบไดเร็กทอรี cdk ที่มีทรัพยากรต่อไปนี้:
- CDK – ประกอบด้วยทรัพยากร cdk หลัก
- app.py – ตำแหน่งที่กำหนดสแต็ก AWS CDK
- cdk.json – มีข้อมูลเมตาและแฟล็กคุณลักษณะ
สคริปต์ AWS CDK
ไฟล์หลักสองไฟล์ที่เราต้องการดูในไฟล์ cdk
ไดเร็กทอรีย่อยคือ sagemaker_studio_construct.py
และ sagemaker_studio_stack.py
. ลองดูที่แต่ละไฟล์โดยละเอียด
ไฟล์สร้างสตูดิโอ
โครงสร้าง Studio ถูกกำหนดไว้ใน sagemaker_studio_construct.py
ไฟล์
โครงสร้างสตูดิโอใช้เวลาใน คลาวด์ส่วนตัวเสมือน (VPC)รายชื่อผู้ใช้ ภูมิภาค AWS และประเภทอินสแตนซ์เริ่มต้นพื้นฐานเป็นพารามิเตอร์ โครงสร้าง AWS CDK นี้ทำหน้าที่ต่อไปนี้:
- สร้างโดเมน Studio (
SageMakerStudioDomain
) - กำหนดบทบาท IAM
sagemaker_studio_execution_role
กับAmazonSageMakerFullAccess
สิทธิ์ที่จำเป็นในการสร้างทรัพยากร สิทธิ์ต้องถูกจำกัดขอบเขตลงไปอีกเพื่อให้เป็นไปตามหลักการสิทธิ์น้อยที่สุดเพื่อความปลอดภัยที่ดียิ่งขึ้น - ตั้งค่าแอปเซิร์ฟเวอร์ Jupyter - รับเข้า
JUPYTER_SERVER_APP_IMAGE_NAME
กำหนดอิมเมจคอนเทนเนอร์ jupyter-server-3 ที่จะใช้ - ตั้งค่าแอปเคอร์เนลเกตเวย์ - รับเข้า
KERNEL_GATEWAY_APP_IMAGE_NAME
กำหนดอิมเมจคอนเทนเนอร์ datascience-2.0 ที่จะใช้ - สร้างโปรไฟล์ผู้ใช้สำหรับผู้ใช้แต่ละคนที่มีรายชื่อ
ข้อมูลโค้ดต่อไปนี้แสดงทรัพยากร AWS CloudFormation ของโดเมน Studio ที่เกี่ยวข้องซึ่งกำหนดไว้ใน AWS CDK:
ข้อมูลโค้ดต่อไปนี้แสดงโปรไฟล์ผู้ใช้ที่สร้างจากทรัพยากร AWS CloudFormation:
ไฟล์สตูดิโอสแต็ก
หลังจากกำหนดโครงสร้างแล้ว คุณสามารถเพิ่มได้โดยสร้างอินสแตนซ์ของคลาสและส่งผ่านอาร์กิวเมนต์ที่จำเป็นภายในสแต็ก สแต็คสร้างทรัพยากร AWS CloudFormation โดยเป็นส่วนหนึ่งของการปรับใช้ที่สอดคล้องกัน ซึ่งหมายความว่าหากสร้างทรัพยากรบนคลาวด์อย่างน้อยหนึ่งรายการไม่สำเร็จ สแต็ก CloudFormation จะย้อนกลับการเปลี่ยนแปลงที่ดำเนินการ ข้อมูลโค้ดต่อไปนี้ของโครงสร้าง Studio สร้างอินสแตนซ์ภายใน Studio stack:
ปรับใช้ AWS CDK stack
ในการปรับใช้สแต็ค AWS CDK ของคุณ ให้เรียกใช้คำสั่งต่อไปนี้จากไดเร็กทอรีรากของโปรเจ็กต์ภายในหน้าต่างเทอร์มินัลของคุณ:
aws configure
pip3 install -r requirements.txt
cdk bootstrap --app "python3 -m cdk.app"
cdk deploy --app "python3 -m cdk.app"
ตรวจสอบทรัพยากรที่ AWS CDK สร้างในบัญชี AWS ของคุณ แล้วเลือกใช่เมื่อได้รับแจ้งให้ปรับใช้สแต็ก รอให้การปรับใช้สแต็กของคุณเสร็จสิ้น โดยทั่วไปจะใช้เวลาน้อยกว่า 5 นาที อย่างไรก็ตาม การเพิ่มทรัพยากรมากขึ้นจะทำให้เวลาในการปรับใช้นานขึ้น คุณยังสามารถตรวจสอบสถานะการปรับใช้บน คอนโซล AWS CloudFormation.
เมื่อปรับใช้สแต็กสำเร็จแล้ว ให้ตรวจสอบข้อมูลโดยไปที่ Studio Control Panel คุณควรเห็นโปรไฟล์ผู้ใช้ SageMaker Studio ที่คุณสร้างขึ้น
หากคุณปรับใช้สแต็กอีกครั้ง ระบบจะตรวจสอบการเปลี่ยนแปลง โดยดำเนินการเฉพาะการอัปเดตทรัพยากรระบบคลาวด์ที่จำเป็นเท่านั้น ตัวอย่างเช่น สามารถใช้เพื่อเพิ่มผู้ใช้หรือเปลี่ยนสิทธิ์ของ ผู้ใช้เหล่านั้นโดยไม่ต้องสร้างทรัพยากรคลาวด์ที่กำหนดไว้ใหม่ทั้งหมด.
ทำความสะอาด
หากต้องการลบสแตก ให้ทำตามขั้นตอนต่อไปนี้:
- บนคอนโซล AWS CloudFormation ให้เลือก สแต็ค ในบานหน้าต่างนำทาง
- เปิดสแต็คที่คุณต้องการลบ
- ในบานหน้าต่างรายละเอียดสแต็ก ให้เลือก ลบ.
- Choose ลบ stack เมื่อได้รับแจ้ง
AWS CloudFormation จะลบทรัพยากรที่สร้างขึ้นเมื่อมีการปรับใช้สแต็ก อาจใช้เวลาสักครู่ขึ้นอยู่กับจำนวนทรัพยากรที่สร้างขึ้น
หากคุณพบปัญหาใดๆ ในขั้นตอนการล้างข้อมูลเหล่านี้ คุณอาจต้องทำ ลบโดเมน Studio ด้วยตนเอง ก่อนที่จะทำซ้ำขั้นตอนในส่วนนี้
สรุป
ในโพสต์นี้ เราได้แสดงวิธีใช้ทรัพยากร IaC บนคลาวด์ของ AWS เพื่อสร้างเทมเพลตที่นำมาใช้ซ้ำได้ง่ายสำหรับการปรับใช้ Studio SageMaker Studio เป็น IDE บนเว็บที่ผนวกรวมอย่างสมบูรณ์ซึ่งมีอินเทอร์เฟซแบบภาพสำหรับงานพัฒนา ML ที่ใช้ JupyterLab3 ด้วยสแต็ก AWS CDK เราสามารถกำหนดโครงสร้างสำหรับสร้างส่วนประกอบระบบคลาวด์ที่สามารถแก้ไข แก้ไข หรือลบได้อย่างง่ายดายโดยทำการเปลี่ยนแปลงสแต็ก CloudFormation พื้นฐาน
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ Amazon Studio โปรดดู สตูดิโอ Amazon SageMaker.
เกี่ยวกับผู้เขียน
คอรี่ แฮร์สตัน เป็นวิศวกรซอฟต์แวร์ที่ Amazon ML Solutions Lab เขากระตือรือร้นเกี่ยวกับการเรียนรู้เทคโนโลยีใหม่ ๆ และใช้ประโยชน์จากข้อมูลนั้นเพื่อสร้างโซลูชันซอฟต์แวร์ที่ใช้ซ้ำได้ เขาเป็นนักยกพลังตัวยงและใช้เวลาว่างไปกับการสร้างงานศิลปะดิจิทัล
มาร์เซโล อาแบร์เล่ เป็นวิศวกร ML ในองค์กร AWS AI เขาเป็นผู้นำความพยายามด้าน MLOps ที่ Amazon ML Solutions Lab โดยช่วยลูกค้าออกแบบและใช้งานระบบ ML ที่ปรับขนาดได้ ภารกิจของเขาคือการแนะนำลูกค้าเกี่ยวกับเส้นทาง ML สำหรับองค์กร และเร่งเส้นทาง ML ไปสู่การผลิต
ยัชชาห์ เป็นผู้จัดการวิทยาศาสตร์ใน ห้องปฏิบัติการโซลูชัน Amazon ML. เขาและทีมนักวิทยาศาสตร์ประยุกต์และวิศวกรด้านแมชชีนเลิร์นนิงทำงานในกรณีการใช้งานแมชชีนเลิร์นนิงที่หลากหลายตั้งแต่การดูแลสุขภาพ กีฬา ยานยนต์ และการผลิต
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/set-up-amazon-sagemaker-studio-with-jupyter-lab-3-using-the-aws-cdk/
- 1
- 100
- a
- สามารถ
- เกี่ยวกับเรา
- เร่งความเร็ว
- เข้า
- ลงชื่อเข้าใช้
- AI
- ทั้งหมด
- ช่วยให้
- อเมซอน
- ห้องปฏิบัติการโซลูชัน Amazon ML
- อเมซอน SageMaker
- สตูดิโอ Amazon SageMaker
- จำนวน
- และ
- app
- การใช้งาน
- ประยุกต์
- ใช้
- เข้าใกล้
- คะนอง
- AREA
- ข้อโต้แย้ง
- ศิลปะ
- อัตโนมัติ
- อัตโนมัติ
- ยานยนต์
- AWS
- การก่อตัวของ AWS Cloud
- กลับ
- ตาม
- กลายเป็น
- ก่อน
- ที่ดีที่สุด
- ปฏิบัติที่ดีที่สุด
- ระหว่าง
- Blocks
- บูต
- สร้าง
- การก่อสร้าง
- built-in
- กรณี
- เปลี่ยนแปลง
- การเปลี่ยนแปลง
- ตรวจสอบ
- Choose
- เมฆ
- รหัส
- สอดคล้องกัน
- การทำงานร่วมกัน
- ชุด
- การผสมผสาน
- ร่วมกัน
- เปรียบเทียบ
- สมบูรณ์
- ส่วนประกอบ
- ปลอบใจ
- สร้าง
- ภาชนะ
- มี
- ควบคุม
- แผงควบคุม
- สร้าง
- ที่สร้างขึ้น
- สร้าง
- การสร้าง
- การสร้าง
- ลูกค้า
- ข้อมูล
- ค่าเริ่มต้น
- การกำหนด
- ทั้งนี้ขึ้นอยู่กับ
- ปรับใช้
- นำไปใช้
- ปรับใช้
- การใช้งาน
- การใช้งาน
- ออกแบบ
- รายละเอียด
- รายละเอียด
- พัฒนาการ
- ดิจิตอล
- ศิลปะดิจิตอล
- พิการ
- โดเมน
- ลง
- แต่ละ
- อย่างง่ายดาย
- ความพยายาม
- พบ
- วิศวกร
- ชั้นเยี่ยม
- วิศวกร
- Enterprise
- สิ่งแวดล้อม
- ความผิดพลาด
- อีเธอร์ (ETH)
- ตัวอย่าง
- ตัวอย่าง
- ล้มเหลว
- ลักษณะ
- มนุษย์
- เนื้อไม่มีมัน
- ไฟล์
- ชื่อจริง
- ปฏิบัติตาม
- ดังต่อไปนี้
- กรอบ
- ฟรี
- ราคาเริ่มต้นที่
- อย่างเต็มที่
- ฟังก์ชั่น
- ต่อไป
- เกตเวย์
- รุ่น
- ได้รับ
- GitHub
- ไป
- ให้คำแนะนำ
- คู่มือ
- มี
- การดูแลสุขภาพ
- การช่วยเหลือ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTML
- HTTPS
- เป็นมนุษย์
- IAC
- AMI
- เอกลักษณ์
- ภาพ
- การดำเนินการ
- การปรับปรุง
- in
- ข้อมูล
- โครงสร้างพื้นฐาน
- ติดตั้ง
- ตัวอย่าง
- แบบบูรณาการ
- อินเตอร์เฟซ
- ปัญหา
- IT
- ชวา
- JavaScript
- การเดินทาง
- JSON
- ห้องปฏิบัติการ
- ภาษา
- ชั้นนำ
- การเรียนรู้
- การใช้ประโยชน์
- จดทะเบียน
- โหลด
- ดู
- เครื่อง
- เรียนรู้เครื่อง
- หลัก
- การทำ
- ผู้จัดการ
- การผลิต
- วิธี
- เมตาดาต้า
- นาที
- ภารกิจ
- ML
- ม.ป.ป
- แบบ
- โมเดล
- การแก้ไข
- ข้อมูลเพิ่มเติม
- ย้าย
- หลาย
- พื้นเมือง
- การเดินเรือ
- จำเป็น
- จำเป็นต้อง
- ใหม่
- เทคโนโลยีใหม่ ๆ
- เสนอ
- ONE
- โอเพนซอร์ส
- ซอฟต์แวร์โอเพนซอร์ส
- organizacja
- อื่นๆ
- บานหน้าต่าง
- แผง
- พารามิเตอร์
- ส่วนหนึ่ง
- ที่ผ่านไป
- เส้นทาง
- ดำเนินการ
- ที่มีประสิทธิภาพ
- สิทธิ์
- สถานที่
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- โพสต์
- การปฏิบัติ
- เตรียมการ
- ข้อกำหนดเบื้องต้น
- หลัก
- ส่วนตัว
- กระบวนการ
- การผลิต
- โปรไฟล์
- ดูรายละเอียด
- การเขียนโปรแกรม
- โครงการ
- ให้
- หลาม
- พิสัย
- ลด
- ภูมิภาค
- ตรงประเด็น
- กรุ
- เป็นตัวแทนของ
- จำเป็นต้องใช้
- ความต้องการ
- ทรัพยากร
- แหล่งข้อมูล
- ผลสอบ
- นำมาใช้ใหม่
- บทบาท
- ม้วน
- ราก
- วิ่ง
- sagemaker
- ที่ปรับขนาดได้
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ขอบเขต
- Section
- ความปลอดภัย
- ตนเอง
- ให้บริการอาหาร
- ชุด
- การตั้งค่า
- การตั้งค่า
- น่า
- แสดงให้เห็นว่า
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- วิศวกรซอฟต์แวร์
- วิศวกรรมซอฟต์แวร์
- โซลูชัน
- บาง
- กีฬา
- กอง
- สแต็ค
- ข้อความที่เริ่ม
- Status
- ขั้นตอน
- คล่องตัว
- สตูดิโอ
- ประสบความสำเร็จ
- อย่างเช่น
- สนับสนุน
- พื้นผิว
- ระบบ
- ระบบ
- เอา
- ใช้เวลา
- งาน
- ทีม
- เทคโนโลยี
- เทมเพลต
- สถานีปลายทาง
- การทดสอบ
- พื้นที่
- ของพวกเขา
- ตลอด
- เวลา
- ไปยัง
- รถไฟ
- ตามแบบฉบับ
- เป็นปกติ
- พื้นฐาน
- ให้กับคุณ
- การปรับปรุง
- ใช้
- ผู้ใช้งาน
- ผู้ใช้
- เสมือน
- รอ
- web-based
- ในขณะที่
- จะ
- ภายใน
- ไม่มี
- งาน
- เขียน
- ของคุณ
- ลมทะเล