Ogłoszenie nowego wkładu Jupyter przez AWS w demokratyzację generatywnej sztucznej inteligencji i skalowanie obciążeń ML | Usługi sieciowe Amazona

Ogłoszenie nowego wkładu Jupyter przez AWS w demokratyzację generatywnej sztucznej inteligencji i skalowanie obciążeń ML | Usługi sieciowe Amazona

Węzeł źródłowy: 2092834

Project Jupyter to wielostronny projekt typu open source, który tworzy aplikacje, otwarte standardy i narzędzia do analizy danych, uczenia maszynowego (ML) i nauk obliczeniowych. Jupyter Notebook, wydany po raz pierwszy w 2011 roku, stał się de facto standardowym narzędziem używanym przez miliony użytkowników na całym świecie we wszystkich możliwych sektorach akademickich, badawczych i przemysłowych. Jupyter umożliwia użytkownikom interaktywną pracę z kodem i danymi oraz tworzenie i udostępnianie narracji obliczeniowych, które zapewniają pełny i powtarzalny zapis ich pracy.

Biorąc pod uwagę znaczenie Jupyter dla analityków danych i programistów ML, AWS jest aktywnym sponsorem i współtwórcą Project Jupyter. Naszym celem jest praca w społeczności open source, aby pomóc Jupyterowi stać się najlepszą możliwą platformą notebooków do analizy danych i uczenia maszynowego. AWS jest platynowym sponsorem Projektu Jupyter za pośrednictwem Fundacji NumFOCUS. Jestem dumny i zaszczycony, że mogę przewodzić oddanemu zespołowi inżynierów AWS, którzy wnoszą wkład w oprogramowanie Jupyter oraz uczestniczą w społeczności i zarządzaniu Jupyter. Nasz wkład open source w Jupyter obejmuje JupyterLab, Jupyter Server i podprojekty Jupyter Notebook. Jesteśmy również członkami grup roboczych Jupyter ds. bezpieczeństwa i różnorodności, równości i integracji (DEI). Równolegle do tych wkładów open source mamy zespoły produktowe AWS, które pracują nad integracją Jupytera z produktami takimi jak Amazon SageMaker.

Dziś na JupyterCon z radością ogłaszamy kilka nowych narzędzi dla użytkowników Jupyter, które poprawią ich doświadczenie i zwiększą produktywność programistów. Wszystkie te narzędzia są open-source i mogą być używane w dowolnym miejscu, w którym działa Jupyter.

Przedstawiamy dwa generatywne rozszerzenia AI dla Jupytera

Generatywna sztuczna inteligencja może znacznie zwiększyć produktywność analityków danych i programistów podczas pisania kodu. Dzisiaj ogłaszamy dwa rozszerzenia Jupyter, które zapewniają użytkownikom Jupyter generatywną sztuczną inteligencję za pośrednictwem interfejsu czatu, magicznych poleceń IPython i autouzupełniania. Te rozszerzenia umożliwiają wykonywanie szerokiego zakresu zadań programistycznych przy użyciu generatywnych modeli AI w notebookach JupyterLab i Jupyter.

Jupyter AI, projekt typu open source mający na celu wprowadzenie generatywnej sztucznej inteligencji do notebooków Jupyter

Wykorzystując moc dużych modeli językowych, takich jak ChatGPT, AI21's Jurassic-2 i (wkrótce) Amazon Titan, Sztuczna inteligencja Jupytera to projekt typu open source, który wprowadza generatywne funkcje sztucznej inteligencji do notebooków Jupyter. Na przykład, używając dużego modelu językowego, Jupyter AI może pomóc programiście w generowaniu, debugowaniu i wyjaśnianiu kodu źródłowego. Jupyter AI może również odpowiadać na pytania dotyczące plików lokalnych i generować całe notatniki na podstawie prostego monitu w języku naturalnym. Jupyter AI oferuje zarówno magiczne polecenia, które działają w dowolnym notebooku lub powłoce IPython, jak i przyjazny interfejs czatu w JupyterLab. Oba te środowiska współpracują z dziesiątkami modeli od wielu dostawców modeli. Użytkownicy JupyterLab mogą wybrać dowolny tekst lub komórkę notatnika, wprowadzić monit w języku naturalnym, aby wykonać zadanie z zaznaczeniem, a następnie wstawić odpowiedź wygenerowaną przez sztuczną inteligencję w dowolnym miejscu. Jupyter AI jest zintegrowany z systemem typu MIME firmy Jupyter, który umożliwia pracę z wejściami i wyjściami dowolnego typu obsługiwanego przez Jupyter (tekst, obrazy itp.). Jupyter AI zapewnia również punkty integracji, które umożliwiają stronom trzecim konfigurowanie własnych modeli. Jupyter AI to oficjalny projekt typu open source Project Jupyter.

Rozszerzenie Amazon CodeWhisperer Jupyter

Autouzupełnianie ma fundamentalne znaczenie dla programistów, a generatywna sztuczna inteligencja może znacznie poprawić wrażenia z sugestii kodu. Dlatego ogłosiliśmy ogólną dostępność Zaklinacz kodów Amazon wcześniej w 2023 r. CodeWhisperer jest towarzyszem programowania AI, który wykorzystuje podstawowe modele pod maską, aby radykalnie poprawić produktywność programistów. Działa to poprzez generowanie sugestii kodu w czasie rzeczywistym na podstawie komentarzy programistów w języku naturalnym i wcześniejszego kodu w ich zintegrowanym środowisku programistycznym (IDE).

Dziś z przyjemnością ogłaszamy, że użytkownicy JupyterLab mogą bezpłatnie zainstalować i używać rozszerzenia CodeWhisperer do generowania w czasie rzeczywistym jednowierszowych lub pełnych funkcji sugestii kodu dla notatników Pythona w JupyterLab i Studio Amazon SageMaker. Dzięki CodeWhisperer możesz napisać komentarz w języku naturalnym, opisujący konkretne zadanie w języku angielskim, na przykład „Utwórz ramkę danych pandy za pomocą pliku CSV”. Na podstawie tych informacji CodeWhisperer zaleca jeden lub więcej fragmentów kodu bezpośrednio w notatniku, które mogą wykonać zadanie. Możesz szybko i łatwo zaakceptować najlepszą sugestię, wyświetlić więcej sugestii lub kontynuować pisanie własnego kodu.

Podczas swojej wersji zapoznawczej CodeWhisperer udowodnił, że doskonale nadaje się do generowania kodu w celu przyspieszenia zadań związanych z kodowaniem, pomagając programistom wykonywać zadania średnio o 57% szybciej. Ponadto programiści, którzy korzystali z CodeWhisperer, mieli o 27% większe prawdopodobieństwo pomyślnego ukończenia zadania kodowania niż ci, którzy tego nie robili. To ogromny skok naprzód w produktywności programistów. CodeWhisperer zawiera również wbudowane narzędzie do śledzenia referencji, które wykrywa, czy sugestia kodu może przypominać dane szkoleniowe typu open source i może oflagować takie sugestie.

Przedstawiamy nowe rozszerzenia Jupyter do tworzenia, trenowania i wdrażania uczenia maszynowego na dużą skalę

Naszą misją w AWS jest demokratyzacja dostępu do ML we wszystkich branżach. Aby osiągnąć ten cel, począwszy od 2017 roku uruchomiliśmy tzw Instancja notebooka Amazon SageMaker— w pełni zarządzana instancja obliczeniowa z systemem Jupyter, która zawiera wszystkie popularne pakiety data science i ML. W 2019 roku zrobiliśmy znaczący krok naprzód, wprowadzając SageMaker Studio, IDE dla ML zbudowane na bazie JupyterLab, które umożliwia budowanie, trenowanie, dostrajanie, debugowanie, wdrażanie i monitorowanie modeli z poziomu jednej aplikacji. Dziesiątki tysięcy klientów korzysta ze Studio, aby wspierać zespoły analityków danych każdej wielkości. W 2021 roku jeszcze bardziej rozszerzyliśmy korzyści płynące z SageMaker dla społeczności milionów użytkowników Jupyter, uruchamiając Laboratorium Amazon SageMaker Studio— bezpłatna usługa notebooków, ponownie oparta na JupyterLab, która obejmuje bezpłatne obliczenia i trwałe przechowywanie.

Dziś z przyjemnością ogłaszamy trzy nowe możliwości, które pomogą Ci szybciej skalować rozwój uczenia maszynowego.

Planowanie notebooków

W 2022 roku udostępniliśmy nową możliwość, aby umożliwić naszym klientom uruchamiaj notatniki jako zaplanowane zadania w SageMaker Studio i Studio Lab. Dzięki tej możliwości wielu naszych klientów zaoszczędziło czas, nie musząc ręcznie konfigurować złożonej infrastruktury chmurowej w celu skalowania swoich przepływów pracy ML.

Z radością informujemy, że narzędzie do planowania notatników jest już dostępne rozszerzenie Jupyter typu open source która pozwala użytkownikom JupyterLab uruchamiać i planować notatniki w SageMaker w dowolnym miejscu, w którym działa JupyterLab. Użytkownicy mogą wybrać notebook i zautomatyzować go jako zadanie uruchamiane w środowisku produkcyjnym za pośrednictwem prostego, ale wydajnego interfejsu użytkownika. Po wybraniu notatnika narzędzie wykonuje migawkę całego notatnika, pakuje jego zależności w kontenerze, buduje infrastrukturę, uruchamia notatnik jako zautomatyzowane zadanie zgodnie z harmonogramem ustawionym przez użytkownika i anuluje aprowizację infrastruktury po zakończeniu zadania. Skraca to czas potrzebny na przeniesienie notebooka do produkcji z tygodni do godzin.

Dystrybucja open-source SageMaker

Analitycy danych i programiści chcą szybko rozpocząć tworzenie aplikacji ML, a instalacja wzajemnie kompatybilnych wersji wszystkich niezbędnych pakietów może być skomplikowana. Z radością ogłaszamy, że chcemy wyeliminować pracę ręczną i poprawić produktywność nowa dystrybucja typu open source który obejmuje najpopularniejsze pakiety do ML, nauki o danych i wizualizacji danych. Ta dystrybucja obejmuje platformy do głębokiego uczenia się, takie jak PyTorch, TensorFlow i Keras; popularne pakiety Pythona, takie jak NumPy, scikit-learn i pandas; oraz IDE, takie jak JupyterLab i Jupyter Notebook. Dystrybucja jest wersjonowana przy użyciu SemVer i będzie wydawana regularnie w przyszłości. Kontener jest dostępny przez Publiczna galeria Amazon ECR, a jego kod źródłowy jest dostępny w serwisie GitHub. Zapewnia to przedsiębiorstwom przejrzystość pakietów i procesu kompilacji, ułatwiając im w ten sposób reprodukcję, dostosowywanie lub ponowną certyfikację dystrybucji. Podstawowy obraz jest dostarczany z pip i Conda/Mamba, dzięki czemu analitycy danych mogą szybko zainstalować dodatkowe pakiety, aby spełnić ich specyficzne potrzeby.

Rozszerzenie Amazon CodeGuru Jupyter

Amazon CodeGuru Bezpieczeństwo obsługuje teraz skanowanie bezpieczeństwa i jakości kodu w JupyterLab i SageMaker Studio. Ta nowa funkcja pomaga użytkownikom notebooków w wykrywaniu luk w zabezpieczeniach, takich jak błędy w iniekcji, wycieki danych, słaba kryptografia lub brak szyfrowania w komórkach notebooka. Można również wykryć wiele typowych problemów, które mają wpływ na czytelność, odtwarzalność i poprawność notatników obliczeniowych, takich jak niewłaściwe użycie interfejsów API biblioteki ML, nieprawidłowa kolejność wykonywania i niedeterminizm. Gdy w notatniku zostaną zidentyfikowane luki w zabezpieczeniach lub problemy z jakością, CodeGuru generuje zalecenia, które umożliwiają zaradzenie tym problemom w oparciu o najlepsze praktyki bezpieczeństwa AWS.

Wnioski

Nie możemy się doczekać, aby zobaczyć, jak społeczność Jupyter wykorzysta te narzędzia do skalowania rozwoju, zwiększenia produktywności i wykorzystania generatywnej sztucznej inteligencji do przekształcenia swoich branż. Sprawdź następujące zasoby, aby dowiedzieć się więcej o Jupyter w AWS oraz o tym, jak zainstalować i rozpocząć korzystanie z tych nowych narzędzi:


O autorze

Briana Grangera jest liderem projektu Python, współzałożycielem Project Jupyter i aktywnym współtwórcą wielu innych projektów open source, skupiających się na data science w Pythonie. W 2016 współtworzył pakiet Altair do wizualizacji statystycznej w Pythonie. Jest członkiem rady doradczej Fundacji NumFOCUS, wykładowcą Cal Poly Center for Innovation and Entrepreneurship oraz starszym głównym technologem w AWS.

Znak czasu:

Więcej z Uczenie maszynowe AWS