Az AWS új Jupyter-hozzájárulásainak bejelentése a generatív mesterséges intelligencia demokratizálására és az ML munkaterhelések skálázására | Amazon webszolgáltatások

Az AWS új Jupyter-hozzájárulásainak bejelentése a generatív mesterséges intelligencia demokratizálására és az ML munkaterhelések skálázására | Amazon webszolgáltatások

Forrás csomópont: 2092834

A Project Jupyter egy több érdekelt felet tömörítő, nyílt forráskódú projekt, amely alkalmazásokat, nyílt szabványokat és eszközöket épít az adattudományhoz, a gépi tanuláshoz (ML) és a számítástechnikához. Az először 2011-ben kiadott Jupyter Notebook de facto szabványos eszközzé vált, amelyet felhasználók milliói használnak világszerte minden lehetséges tudományos, kutatási és ipari szektorban. A Jupyter lehetővé teszi a felhasználók számára, hogy interaktívan dolgozzanak kóddal és adatokkal, valamint olyan számítási narratívákat készítsenek és osszák meg, amelyek teljes és reprodukálható rögzítést biztosítanak munkájukról.

Tekintettel a Jupyter fontosságára az adatkutatók és az ML-fejlesztők számára, az AWS aktív szponzora és közreműködője a Project Jupyternek. Célunk, hogy a nyílt forráskódú közösségben dolgozzunk, hogy segítsük a Jupytert, hogy a lehető legjobb notebook platform legyen az adattudomány és az ML számára. Az AWS a NumFOCUS Alapítványon keresztül a Project Jupyter platina szponzora, és büszke vagyok és megtiszteltetés számomra, hogy egy elkötelezett AWS-mérnöki csapatot vezethetek, akik hozzájárulnak a Jupyter szoftveréhez, és részt vesznek a Jupyter közösségében és irányításában. A Jupyterhez nyújtott nyílt forráskódú hozzájárulásaink közé tartozik a JupyterLab, a Jupyter Server és a Jupyter Notebook alprojektek. Tagjai vagyunk a Jupyter biztonsággal, sokszínűséggel, egyenlőséggel és befogadással (DEI) foglalkozó munkacsoportjainak is. Ezekkel a nyílt forráskódú hozzájárulásokkal párhuzamosan AWS-termékcsapatokkal dolgozunk, amelyek azon dolgoznak, hogy a Jupytert integrálják olyan termékekkel, mint az Amazon SageMaker.

A mai JupyterConon örömmel jelentjük be, hogy számos új eszközt jelentünk be a Jupyter-felhasználók számára, hogy javítsák élményüket és fokozzák a fejlesztési hatékonyságot. Ezen eszközök mindegyike nyílt forráskódú, és bárhol használható, ahol a Jupytert futtatja.

Bemutatunk két generatív AI-bővítményt a Jupyterhez

A generatív mesterséges intelligencia jelentősen növelheti az adattudósok és fejlesztők produktivitását kódírás közben. A mai napon bejelentünk két Jupyter-bővítményt, amelyek generatív mesterséges intelligenciát biztosítanak a Jupyter-felhasználók számára csevegőfelületen, IPython mágikus parancsokon és automatikus kiegészítésön keresztül. Ezek a bővítmények lehetővé teszik a fejlesztési feladatok széles skálájának elvégzését a JupyterLab és a Jupyter notebookok generatív mesterséges intelligencia modelljeivel.

Jupyter AI, egy nyílt forráskódú projekt, amely a generatív AI-t a Jupyter notebookokhoz juttatja el

A nagy nyelvi modellek, például a ChatGPT, az AI21 Jurassic-2 és (hamarosan) Amazon Titan erejét kihasználva, Jupyter AI egy nyílt forráskódú projekt, amely generatív mesterséges intelligencia funkciókat hoz a Jupyter notebookokhoz. Például egy nagy nyelvi modell használatával a Jupyter AI segíthet a programozónak a forráskód létrehozásában, hibakeresésében és magyarázatában. A Jupyter AI a helyi fájlokkal kapcsolatos kérdésekre is képes válaszolni, és teljes jegyzetfüzeteket generálhat egy egyszerű természetes nyelvű promptból. A Jupyter AI mágikus parancsokat kínál, amelyek bármely notebookban vagy IPython shellben működnek, és egy barátságos csevegési felhasználói felületet a JupyterLabban. Mindkét tapasztalat több tucat modellel működik a modellszolgáltatók széles skálájától. A JupyterLab-felhasználók bármilyen szöveges vagy jegyzetfüzet cellát kiválaszthatnak, beírhatnak egy természetes nyelvű promptot, hogy végrehajtsanak egy feladatot a kijelöléssel, majd a mesterséges intelligencia által generált választ bárhová beszúrhatják. A Jupyter AI integrálva van a Jupyter MIME típusú rendszerével, amely lehetővé teszi, hogy bármilyen típusú bemenettel és kimenettel dolgozzon, amelyet a Jupyter támogat (szöveg, képek stb.). A Jupyter AI olyan integrációs pontokat is biztosít, amelyek lehetővé teszik harmadik felek számára, hogy konfigurálják saját modelleiket. A Jupyter AI a Project Jupyter hivatalos nyílt forráskódú projektje.

Amazon CodeWhisperer Jupyter kiterjesztés

Az automatikus kiegészítés alapvető fontosságú a fejlesztők számára, és a generatív AI jelentősen javíthatja a kódjavaslat élményét. Ezért jelentettük be az általános elérhetőséget Amazon Code Whisperer 2023 elején. A CodeWhisperer egy mesterséges intelligencia kódoló társ, amely alapmodelleket használ a motorháztető alatt a fejlesztők termelékenységének radikális javítására. Ez úgy működik, hogy valós időben kódjavaslatokat generál a fejlesztők természetes nyelvű megjegyzései és az integrált fejlesztői környezetükben (IDE) lévő korábbi kód alapján.

A mai napon örömmel jelentjük be, hogy a JupyterLab-felhasználók ingyenesen telepíthetik és használhatják a CodeWhisperer bővítményt valós idejű, egysoros vagy teljes funkciós kódjavaslatok létrehozásához a JupyterLab és a Python notebookokhoz. Amazon SageMaker Studio. A CodeWhispererrel természetes nyelven írhat megjegyzést, amely egy konkrét feladatot vázol fel angolul, például „Create a pandas dataframe with a CSV file“. Ezen információk alapján a CodeWhisperer egy vagy több kódrészletet javasol közvetlenül a notebookban, amelyek végrehajthatják a feladatot. Gyorsan és egyszerűen elfogadhatja a legfontosabb javaslatot, további javaslatokat tekinthet meg, vagy folytathatja saját kódjának írását.

Az előzetese során a CodeWhisperer bebizonyította, hogy kiválóan alkalmas kódgenerálásra a kódolási feladatok felgyorsítására, így a fejlesztők átlagosan 57%-kal gyorsabban hajthatnak végre feladatokat. Ezenkívül a CodeWhisperert használó fejlesztők 27%-kal nagyobb valószínűséggel végeztek sikeresen egy kódolási feladatot, mint azok, akik nem. Ez óriási előrelépés a fejlesztői termelékenység terén. A CodeWhisperer egy beépített referenciakövetőt is tartalmaz, amely észleli, hogy egy kódjavaslat hasonlít-e a nyílt forráskódú oktatási adatokra, és meg tudja jelölni az ilyen javaslatokat.

Bemutatjuk az új Jupyter-bővítményeket az ML építéséhez, betanításához és telepítéséhez

Az AWS-nél az a küldetésünk, hogy demokratizáljuk az ML-hez való hozzáférést az iparágakban. E cél elérése érdekében 2017-től elindítottuk a Amazon SageMaker notebook példány– a Jupytert futtató, teljesen felügyelt számítási példány, amely tartalmazza az összes népszerű adattudományi és ML-csomagot. 2019-ben jelentős előrelépést tettünk a SageMaker Studio elindításával, amely a JupyterLab tetejére épülő IDE for ML, amely lehetővé teszi a modellek építését, betanítását, hangolását, hibakeresését, telepítését és monitorozását egyetlen alkalmazásból. Ügyfelek tízezrei használják a Stúdiót, hogy bármilyen méretű adattudományi csapatot felhatalmazzanak. 2021-ben tovább terjesztettük a SageMaker előnyeit a Jupyter-felhasználók millióinak közösségére azáltal, hogy Amazon SageMaker Studio Lab– egy ingyenes notebook szolgáltatás, amely ismét a JupyterLab alapú, ingyenes számítást és állandó tárolást tartalmaz.

Ma örömmel jelentjük be három új képességet, amelyek segítségével gyorsabban skálázhatja az ML fejlesztést.

Notebookok ütemezése

2022-ben új képességet adtunk ki, amely lehetővé teszi ügyfeleink számára a jegyzetfüzeteket ütemezett munkákként futtathatja a SageMaker Stúdióban és a Studio Labban. Ennek a képességnek köszönhetően sok ügyfelünk időt takarított meg azzal, hogy nem kell manuálisan beállítania az összetett felhő-infrastruktúrát az ML munkafolyamatok méretezéséhez.

Örömmel jelentjük be, hogy a notebookok ütemező eszköze már elérhető nyílt forráskódú Jupyter bővítmény amely lehetővé teszi a JupyterLab-felhasználók számára a jegyzetfüzetek futtatását és ütemezését a SageMaker-en bárhol, ahol a JupyterLab fut. A felhasználók kiválaszthatnak egy notebookot, és egy egyszerű, de hatékony felhasználói felületen keresztül termelési környezetben futó feladatként automatizálhatják. A jegyzetfüzet kiválasztása után az eszköz pillanatképet készít a teljes notebookról, egy tárolóba csomagolja a függőségeit, felépíti az infrastruktúrát, a notebookot automatizált feladatként futtatja a felhasználó által beállított ütemezés szerint, és a feladat befejezése után leválasztja az infrastruktúrát. Ez hetekről órákra csökkenti a notebook gyártási folyamatba való áthelyezésének idejét.

SageMaker nyílt forráskódú disztribúció

Az adattudósok és fejlesztők gyorsan szeretnék elkezdeni az ML alkalmazások fejlesztését, és bonyolult lehet az összes szükséges csomag kölcsönösen kompatibilis verziójának telepítése. A kézi munka megszüntetése és a termelékenység javítása érdekében örömmel jelentjük be egy új nyílt forráskódú disztribúció amely tartalmazza a legnépszerűbb ML, adattudományi és adatvizualizációs csomagokat. Ez a disztribúció olyan mély tanulási keretrendszereket tartalmaz, mint a PyTorch, TensorFlow és Keras; népszerű Python-csomagok, mint a NumPy, a scikit-learn és a pandas; és olyan IDE-k, mint a JupyterLab és a Jupyter Notebook. A disztribúció verziószáma a SemVer használatával történik, és a jövőben rendszeresen megjelennek. A konténer a következőn keresztül érhető el Amazon ECR Public Gallery, forráskódja pedig elérhető a GitHubon. Ez átláthatóságot biztosít a vállalatok számára a csomagok és az összeállítási folyamat terén, ezáltal megkönnyíti számukra a terjesztés reprodukálását, testreszabását vagy újratanúsítását. Az alapképhez pip és Conda/Mamba tartozik, így az adattudósok gyorsan telepíthetnek további csomagokat sajátos igényeiknek megfelelően.

Amazon CodeGuru Jupyter kiterjesztés

Amazon CodeGuru A Security mostantól támogatja a biztonsági és kódminőségi vizsgálatokat a JupyterLab és a SageMaker Studio alkalmazásban. Ez az új képesség segít a notebook-felhasználóknak felderíteni a biztonsági réseket, például a beillesztési hibákat, az adatszivárgást, a gyenge titkosítást vagy a titkosítás hiányát a notebook celláiban. Számos olyan gyakori probléma is észlelhető, amelyek befolyásolják a számítási jegyzetfüzetek olvashatóságát, reprodukálhatóságát és helyességét, mint például az ML könyvtár API-kkal való visszaélés, az érvénytelen futási sorrend és a nem meghatározottság. Ha sebezhetőséget vagy minőségi problémákat észlel a notebookban, a CodeGuru ajánlásokat generál, amelyek lehetővé teszik a problémák orvoslását az AWS biztonsági bevált gyakorlatai alapján.

Következtetés

Izgatottan várjuk, hogy a Jupyter közösség hogyan fogja használni ezeket az eszközöket a fejlesztések skálázására, a termelékenység növelésére, valamint a generatív mesterséges intelligencia előnyeinek kihasználására iparágaik átalakítására. Tekintse meg a következő forrásokat, ha többet szeretne megtudni az AWS-en futó Jupyterről, valamint az új eszközök telepítéséről és használatának megkezdéséről:


A szerzőről

Brian Granger a Python projekt vezetője, a Project Jupyter társalapítója, és aktív közreműködője számos más nyílt forráskódú projektnek, amelyek a Python adattudományára összpontosítanak. 2016-ban közösen létrehozta az Altair csomagot a Python statisztikai megjelenítéséhez. A NumFOCUS Alapítvány tanácsadó testületének tagja, a Cal Poly Innovációs és Vállalkozási Központ munkatársa, valamint az AWS Sr. vezető technológusa.

Időbélyeg:

Még több AWS gépi tanulás