Studio Amazon SageMaker adalah lingkungan pengembangan terintegrasi penuh (IDE) untuk pembelajaran mesin (ML) sebagian berdasarkan JupyterLab 3. Studio menyediakan antarmuka berbasis web untuk melakukan tugas pengembangan ML secara interaktif yang diperlukan untuk menyiapkan data dan membangun, melatih, dan menerapkan model ML. Di Studio, Anda dapat memuat data, menyesuaikan model ML, beralih di antara langkah-langkah untuk menyesuaikan eksperimen, membandingkan hasil, dan menerapkan model ML untuk inferensi.
Grafik Kit Pengembangan AWS Cloud (AWS CDK) adalah kerangka kerja pengembangan perangkat lunak sumber terbuka untuk dibuat Formasi AWS Cloud tumpukan melalui otomatis Templat CloudFormation generasi. Tumpukan adalah kumpulan sumber daya AWS, yang dapat diperbarui, dipindahkan, atau dihapus secara terprogram. CDK AWS konstruksi adalah blok pembangun aplikasi AWS CDK, yang mewakili cetak biru untuk menentukan arsitektur cloud.
Menyiapkan Studio dengan AWS CDK telah menjadi proses yang disederhanakan. AWS CDK memungkinkan Anda menggunakan konstruksi asli untuk menentukan dan menerapkan Studio menggunakan infrastruktur sebagai kode (IaC), termasuk Identitas AWS dan Manajemen Akses (AWS IAM) dan konfigurasi sumber daya cloud yang diinginkan, semuanya di satu tempat. Pendekatan pengembangan ini dapat digunakan dalam kombinasi dengan praktik terbaik rekayasa perangkat lunak umum lainnya seperti penerapan kode otomatis, pengujian, dan Jalur pipa CI / CD. AWS CDK mengurangi waktu yang diperlukan untuk melakukan tugas penerapan infrastruktur biasa sambil mengecilkan area permukaan untuk kesalahan manusia melalui otomatisasi.
Postingan ini memandu Anda melalui langkah-langkah untuk memulai penyiapan dan penerapan Studio untuk menstandarkan pengembangan model ML dan kolaborasi dengan sesama teknisi ML dan ilmuwan ML. Semua contoh di postingan ditulis dalam bahasa pemrograman Python. Namun, AWS CDK menawarkan dukungan bawaan untuk banyak bahasa pemrograman lainnya seperti JavaScript, Java dan C#.
Prasyarat
Untuk memulai, prasyarat berikut berlaku:
Kloning repositori GitHub
Pertama, ayo clone itu Repositori GitHub.
Ketika repositori berhasil ditarik, Anda dapat memeriksa direktori cdk yang berisi sumber daya berikut:
- cdk โ Berisi sumber daya cdk utama
- app.py โ Di mana tumpukan AWS CDK ditentukan
- cdk.json โ Berisi metadata, dan flag fitur
Skrip AWS CDK
Dua file utama yang ingin kita lihat di cdk
subdirektori adalah sagemaker_studio_construct.py
dan sagemaker_studio_stack.py
. Mari kita lihat setiap file lebih detail.
File konstruksi studio
Konstruk Studio didefinisikan dalam file sagemaker_studio_construct.py
file.
Konstruk Studio mencakup awan pribadi virtual (VPC), pengguna terdaftar, Wilayah AWS, dan jenis instans default yang mendasarinya sebagai parameter. Konstruksi AWS CDK ini melayani fungsi-fungsi berikut:
- Membuat domain Studio (
SageMakerStudioDomain
) - Menetapkan peran IAM
sagemaker_studio_execution_role
denganAmazonSageMakerFullAccess
izin yang diperlukan untuk membuat sumber daya. Izin perlu diperluas lebih jauh untuk mengikuti prinsip hak istimewa paling rendah untuk keamanan yang lebih baik. - Setel pengaturan aplikasi server Jupyter โ menerima
JUPYTER_SERVER_APP_IMAGE_NAME
, menentukan gambar wadah jupyter-server-3 yang akan digunakan. - Mengatur pengaturan aplikasi kernel gateway โ menerima
KERNEL_GATEWAY_APP_IMAGE_NAME
, menentukan image container datascience-2.0 yang akan digunakan. - Membuat profil pengguna untuk setiap pengguna yang terdaftar
Cuplikan kode berikut menunjukkan sumber daya AWS CloudFormation domain Studio relevan yang ditentukan dalam AWS CDK:
Cuplikan kode berikut menampilkan profil pengguna yang dibuat dari sumber daya AWS CloudFormation:
File tumpukan studio
Setelah konstruk ditentukan, Anda dapat menambahkannya dengan membuat instance kelas dan meneruskan argumen yang diperlukan di dalam tumpukan. Tumpukan membuat sumber daya AWS CloudFormation sebagai bagian dari satu penerapan yang koheren. Ini berarti bahwa jika setidaknya satu sumber daya cloud gagal dibuat, tumpukan CloudFormation mengembalikan semua perubahan yang dilakukan. Cuplikan kode berikut dari konstruksi Studio yang dibuat di dalam tumpukan Studio:
Terapkan tumpukan AWS CDK
Untuk menerapkan tumpukan AWS CDK Anda, jalankan perintah berikut dari direktori akar proyek di dalam jendela terminal Anda:
aws configure
pip3 install -r requirements.txt
cdk bootstrap --app "python3 -m cdk.app"
cdk deploy --app "python3 -m cdk.app"
Tinjau sumber daya yang dibuat AWS CDK di akun AWS Anda dan pilih ya saat diminta untuk menerapkan tumpukan. Tunggu penerapan tumpukan Anda selesai. Ini biasanya memakan waktu kurang dari 5 menit; namun, menambahkan lebih banyak sumber daya akan memperpanjang waktu penerapan. Anda juga dapat memeriksa status penyebaran di Konsol AWS CloudFormation.
Saat tumpukan telah berhasil diterapkan, periksa informasinya dengan masuk ke Panel Kontrol Studio. Anda akan melihat profil pengguna SageMaker Studio yang Anda buat.
Jika Anda menerapkan ulang tumpukan, tumpukan akan memeriksa perubahan, hanya melakukan pembaruan sumber daya cloud yang diperlukan. Misalnya, ini dapat digunakan untuk menambah pengguna, atau mengubah izin pengguna tersebut tanpa harus membuat ulang semua sumber daya cloud yang ditentukan.
Membersihkan
Untuk menghapus tumpukan, selesaikan langkah-langkah berikut:
- Pada konsol AWS CloudFormation, pilih Tumpukan di panel navigasi.
- Buka tumpukan yang ingin Anda hapus.
- Di panel detail tumpukan, pilih Delete.
- Pilih Hapus tumpukan ketika diminta.
AWS CloudFormation akan menghapus sumber daya yang dibuat saat tumpukan diterapkan. Ini mungkin memakan waktu tergantung pada jumlah sumber daya yang dibuat.
Jika Anda mengalami masalah apa pun melalui langkah-langkah pembersihan ini, Anda mungkin perlu melakukannya menghapus domain Studio secara manual terlebih dahulu sebelum mengulangi langkah-langkah di bagian ini.
Kesimpulan
Dalam postingan ini, kami menunjukkan cara menggunakan sumber daya IaC cloud-native AWS untuk membuat template yang mudah digunakan kembali untuk penerapan Studio. SageMaker Studio adalah IDE berbasis web terintegrasi penuh yang menyediakan antarmuka visual untuk tugas pengembangan ML berdasarkan JupyterLab3. Dengan tumpukan AWS CDK, kami dapat menentukan konstruksi untuk membangun komponen cloud yang dapat dengan mudah dimodifikasi, diedit, atau dihapus dengan membuat perubahan pada tumpukan CloudFormation yang mendasarinya.
Untuk informasi selengkapnya tentang Amazon Studio, lihat Studio Amazon SageMaker.
Tentang Penulis
Corry Hairston adalah Insinyur Perangkat Lunak di Amazon ML Solutions Lab. Dia bersemangat mempelajari teknologi baru dan memanfaatkan informasi itu untuk membangun solusi perangkat lunak yang dapat digunakan kembali. Dia adalah seorang pengangkat kekuatan yang rajin dan menghabiskan waktu luangnya membuat seni digital.
Marcelo Aberle adalah Insinyur ML di organisasi AWS AI. Dia memimpin upaya MLOps di Amazon ML Solutions Lab, membantu pelanggan merancang dan menerapkan sistem ML yang dapat diskalakan. Misinya adalah memandu pelanggan dalam perjalanan ML perusahaan mereka dan mempercepat jalur ML mereka menuju produksi.
Yash Shah adalah Manajer Sains di Lab Solusi Amazon ML. Dia dan timnya yang terdiri dari ilmuwan terapan dan insinyur pembelajaran mesin mengerjakan berbagai kasus penggunaan pembelajaran mesin mulai dari perawatan kesehatan, olahraga, otomotif, dan manufaktur.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/set-up-amazon-sagemaker-studio-with-jupyter-lab-3-using-the-aws-cdk/
- 1
- 100
- a
- Sanggup
- Tentang Kami
- mempercepat
- mengakses
- Akun
- AI
- Semua
- memungkinkan
- Amazon
- Lab Solusi Amazon ML
- Amazon SageMaker
- Studio Amazon SageMaker
- jumlah
- dan
- aplikasi
- aplikasi
- terapan
- Mendaftar
- pendekatan
- berapi-api
- DAERAH
- argumen
- Seni
- Otomatis
- Otomatisasi
- otomotif
- AWS
- Formasi AWS Cloud
- kembali
- berdasarkan
- menjadi
- sebelum
- TERBAIK
- Praktik Terbaik
- antara
- Blok
- Bootstrap
- membangun
- Bangunan
- built-in
- kasus
- perubahan
- Perubahan
- memeriksa
- Pilih
- awan
- kode
- KOHEREN
- kolaborasi
- koleksi
- kombinasi
- Umum
- membandingkan
- lengkap
- komponen
- konsul
- membangun
- Wadah
- mengandung
- kontrol
- panel kontrol
- membuat
- dibuat
- menciptakan
- membuat
- penciptaan
- pelanggan
- data
- Default
- mendefinisikan
- Tergantung
- menyebarkan
- dikerahkan
- penggelaran
- penyebaran
- penyebaran
- Mendesain
- rinci
- rincian
- Pengembangan
- digital
- digital Art
- cacat
- domain
- turun
- setiap
- mudah
- upaya
- pertemuan
- insinyur
- Teknik
- Insinyur
- Enterprise
- Lingkungan Hidup
- kesalahan
- Eter (ETH)
- contoh
- contoh
- gagal
- Fitur
- sesama
- File
- File
- Pertama
- mengikuti
- berikut
- Kerangka
- Gratis
- dari
- sepenuhnya
- fungsi
- lebih lanjut
- pintu gerbang
- generasi
- mendapatkan
- GitHub
- akan
- membimbing
- Panduan
- memiliki
- kesehatan
- membantu
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- Namun
- HTML
- HTTPS
- manusia
- IAC
- IAM
- identitas
- gambar
- melaksanakan
- ditingkatkan
- in
- informasi
- Infrastruktur
- install
- contoh
- terpadu
- Antarmuka
- masalah
- IT
- Jawa
- JavaScript
- perjalanan
- json
- laboratorium
- bahasa
- terkemuka
- pengetahuan
- leveraging
- Daftar
- memuat
- melihat
- mesin
- Mesin belajar
- Utama
- Membuat
- manajer
- pabrik
- cara
- Metadata
- menit
- Misi
- ML
- MLOps
- model
- model
- dimodifikasi
- lebih
- pindah
- beberapa
- asli
- Navigasi
- perlu
- Perlu
- New
- Teknologi baru
- Penawaran
- ONE
- open source
- Perangkat Lunak Sumber Terbuka
- organisasi
- Lainnya
- pane
- panel
- parameter
- bagian
- Lewat
- path
- melakukan
- melakukan
- Izin
- Tempat
- plato
- Kecerdasan Data Plato
- Data Plato
- Pos
- praktek
- Mempersiapkan
- prasyarat
- prinsip
- swasta
- proses
- Produksi
- Profil
- profil
- Pemrograman
- memprojeksikan
- menyediakan
- Ular sanca
- jarak
- mengurangi
- wilayah
- relevan
- gudang
- mewakili
- wajib
- Persyaratan
- sumber
- Sumber
- Hasil
- dapat digunakan kembali
- Peran
- gulungan
- akar
- Run
- pembuat bijak
- terukur
- Ilmu
- ilmuwan
- cakupan
- Bagian
- keamanan
- DIRI
- melayani
- set
- pengaturan
- pengaturan
- harus
- Pertunjukkan
- Perangkat lunak
- pengembangan perangkat lunak
- Software Engineer
- rekayasa Perangkat Lunak
- Solusi
- beberapa
- Olahraga
- tumpukan
- Tumpukan
- mulai
- Status
- Tangga
- efisien
- studio
- berhasil
- seperti itu
- mendukung
- Permukaan
- sistem
- sistem
- Mengambil
- Dibutuhkan
- tugas
- tim
- Teknologi
- Template
- terminal
- tes
- Grafik
- mereka
- Melalui
- waktu
- untuk
- Pelatihan VE
- khas
- khas
- pokok
- diperbarui
- Pembaruan
- menggunakan
- Pengguna
- Pengguna
- maya
- menunggu
- berbasis web
- sementara
- akan
- dalam
- tanpa
- Kerja
- tertulis
- Anda
- zephyrnet.dll