Annuncio di nuovi contributi Jupyter da parte di AWS per democratizzare l'IA generativa e ridimensionare i carichi di lavoro ML | Servizi Web Amazon

Annuncio di nuovi contributi Jupyter da parte di AWS per democratizzare l'IA generativa e ridimensionare i carichi di lavoro ML | Servizi Web Amazon

Nodo di origine: 2092834

Project Jupyter è un progetto open source con più parti interessate che crea applicazioni, standard aperti e strumenti per data science, machine learning (ML) e scienze computazionali. Jupyter Notebook, rilasciato per la prima volta nel 2011, è diventato di fatto uno strumento standard utilizzato da milioni di utenti in tutto il mondo in ogni possibile settore accademico, di ricerca e industriale. Jupyter consente agli utenti di lavorare con codice e dati in modo interattivo e di creare e condividere narrazioni computazionali che forniscono una registrazione completa e riproducibile del loro lavoro.

Data l'importanza di Jupyter per i data scientist e gli sviluppatori ML, AWS è uno sponsor attivo e un collaboratore del progetto Jupyter. Il nostro obiettivo è lavorare nella comunità open source per aiutare Jupyter a essere la migliore piattaforma per notebook possibile per data science e ML. AWS è uno sponsor di platino del progetto Jupyter attraverso la NumFOCUS Foundation e sono orgoglioso e onorato di guidare un team dedicato di ingegneri AWS che contribuiscono al software di Jupyter e partecipano alla comunità e alla governance di Jupyter. I nostri contributi open source a Jupyter includono JupyterLab, Jupyter Server e i sottoprogetti Jupyter Notebook. Siamo anche membri dei gruppi di lavoro di Jupyter per la sicurezza e la diversità, l'equità e l'inclusione (DEI). Parallelamente a questi contributi open source, abbiamo i team di prodotto AWS che stanno lavorando per integrare Jupyter con prodotti come Amazon SageMaker.

Oggi alla JupyterCon, siamo entusiasti di annunciare diversi nuovi strumenti per gli utenti di Jupyter per migliorare la loro esperienza e aumentare la produttività dello sviluppo. Tutti questi strumenti sono open source e possono essere utilizzati ovunque tu stia eseguendo Jupyter.

Presentazione di due estensioni AI generative per Jupyter

L'IA generativa può aumentare significativamente la produttività di data scientist e sviluppatori mentre scrivono codice. Oggi annunciamo due estensioni di Jupyter che portano l'intelligenza artificiale generativa agli utenti di Jupyter tramite un'interfaccia utente di chat, i comandi magici di IPython e il completamento automatico. Queste estensioni consentono di eseguire un'ampia gamma di attività di sviluppo utilizzando modelli di intelligenza artificiale generativa nei notebook JupyterLab e Jupyter.

Jupyter AI, un progetto open source per portare l'IA generativa nei notebook Jupyter

Utilizzando la potenza di grandi modelli linguistici come ChatGPT, Jurassic-21 di AI2 e (in arrivo) Amazon Titan, IA di Giove è un progetto open source che porta funzionalità di intelligenza artificiale generativa sui notebook Jupyter. Ad esempio, utilizzando un modello di linguaggio di grandi dimensioni, Jupyter AI può aiutare un programmatore a generare, eseguire il debug e spiegare il proprio codice sorgente. Jupyter AI può anche rispondere a domande sui file locali e generare interi notebook da un semplice prompt in linguaggio naturale. Jupyter AI offre sia comandi magici che funzionano in qualsiasi notebook o shell IPython, sia un'interfaccia utente di chat amichevole in JupyterLab. Entrambe queste esperienze lavorano con dozzine di modelli da una vasta gamma di fornitori di modelli. Gli utenti di JupyterLab possono selezionare qualsiasi cella di testo o notebook, inserire una richiesta in linguaggio naturale per eseguire un'attività con la selezione e quindi inserire la risposta generata dall'intelligenza artificiale ovunque scelgano. Jupyter AI è integrato con il sistema di tipo MIME di Jupyter, che consente di lavorare con input e output di qualsiasi tipo supportato da Jupyter (testo, immagini e così via). Jupyter AI fornisce anche punti di integrazione che consentono a terze parti di configurare i propri modelli. Jupyter AI è un progetto open source ufficiale di Project Jupyter.

Estensione Jupyter di Amazon CodeWhisperer

Il completamento automatico è fondamentale per gli sviluppatori e l'IA generativa può migliorare in modo significativo l'esperienza di suggerimento del codice. Ecco perché abbiamo annunciato la disponibilità generale di Amazon Code Whisperer all'inizio del 2023. CodeWhisperer è un compagno di codifica AI che utilizza modelli fondamentali dietro le quinte per migliorare radicalmente la produttività degli sviluppatori. Funziona generando suggerimenti di codice in tempo reale in base ai commenti degli sviluppatori in linguaggio naturale e al codice precedente nel loro ambiente di sviluppo integrato (IDE).

Oggi siamo lieti di annunciare che gli utenti di JupyterLab possono installare e utilizzare gratuitamente l'estensione CodeWhisperer per generare suggerimenti di codice in tempo reale, a riga singola o con funzioni complete per notebook Python in JupyterLab e Amazon Sage Maker Studio. Con CodeWhisperer, puoi scrivere un commento in linguaggio naturale che delinea un'attività specifica in inglese, ad esempio "Crea un dataframe panda utilizzando un file CSV". Sulla base di queste informazioni, CodeWhisperer consiglia uno o più frammenti di codice direttamente nel notebook in grado di eseguire l'attività. Puoi accettare rapidamente e facilmente il suggerimento principale, visualizzare altri suggerimenti o continuare a scrivere il tuo codice.

Durante la sua anteprima, CodeWhisperer ha dimostrato di essere eccellente nel generare codice per accelerare le attività di codifica, aiutando gli sviluppatori a completare le attività in media il 57% più velocemente. Inoltre, gli sviluppatori che hanno utilizzato CodeWhisperer avevano il 27% di probabilità in più di completare con successo un'attività di codifica rispetto a quelli che non l'hanno fatto. Questo è un enorme balzo in avanti nella produttività degli sviluppatori. CodeWhisperer include anche un tracker di riferimento integrato che rileva se un suggerimento di codice potrebbe assomigliare a dati di addestramento open source e può contrassegnare tali suggerimenti.

Presentazione di nuove estensioni Jupyter per creare, addestrare e distribuire ML su larga scala

La nostra missione in AWS è democratizzare l'accesso al machine learning in tutti i settori. Per raggiungere questo obiettivo, a partire dal 2017, abbiamo lanciato il Istanza di notebook Amazon SageMaker—un'istanza di calcolo completamente gestita che esegue Jupyter che include tutti i popolari pacchetti di data science e ML. Nel 2019, abbiamo compiuto un significativo balzo in avanti con il lancio di SageMaker Studio, un IDE per ML basato su JupyterLab che consente di creare, addestrare, ottimizzare, eseguire il debug, distribuire e monitorare i modelli da una singola applicazione. Decine di migliaia di clienti utilizzano Studio per potenziare i team di data science di tutte le dimensioni. Nel 2021, abbiamo esteso ulteriormente i vantaggi di SageMaker alla comunità di milioni di utenti Jupyter lanciando Laboratorio Amazon SageMaker Studio—un servizio notebook gratuito, sempre basato su JupyterLab, che include elaborazione gratuita e archiviazione persistente.

Oggi siamo lieti di annunciare tre nuove funzionalità per aiutarti a ridimensionare lo sviluppo ML più velocemente.

Programmazione dei taccuini

Nel 2022, abbiamo rilasciato una nuova funzionalità per consentire ai nostri clienti di farlo eseguire i notebook come lavori pianificati in SageMaker Studio e Studio Lab. Grazie a questa funzionalità, molti dei nostri clienti hanno risparmiato tempo non dovendo configurare manualmente complesse infrastrutture cloud per ridimensionare i propri flussi di lavoro ML.

Siamo lieti di annunciare che lo strumento di pianificazione dei taccuini è ora disponibile un'estensione Jupyter open source che consente agli utenti di JupyterLab di eseguire e pianificare i notebook su SageMaker ovunque venga eseguito JupyterLab. Gli utenti possono selezionare un notebook e automatizzarlo come lavoro eseguito in un ambiente di produzione tramite un'interfaccia utente semplice ma potente. Dopo aver selezionato un notebook, lo strumento acquisisce uno snapshot dell'intero notebook, ne impacchetta le dipendenze in un contenitore, crea l'infrastruttura, esegue il notebook come processo automatizzato in base a una pianificazione impostata dall'utente ed esegue il deprovisioning dell'infrastruttura al completamento del processo. Questo riduce il tempo necessario per spostare un notebook in produzione da settimane a ore.

Distribuzione open source SageMaker

I data scientist e gli sviluppatori vogliono iniziare a sviluppare rapidamente applicazioni ML e può essere complesso installare le versioni reciprocamente compatibili di tutti i pacchetti necessari. Per rimuovere il lavoro manuale e migliorare la produttività, siamo entusiasti di annunciare una nuova distribuzione open-source che include i pacchetti più popolari per ML, data science e visualizzazione dei dati. Questa distribuzione include framework di deep learning come PyTorch, TensorFlow e Keras; popolari pacchetti Python come NumPy, scikit-learn e panda; e IDE come JupyterLab e Jupyter Notebook. La distribuzione è versionata utilizzando SemVer e verrà rilasciata regolarmente in futuro. Il contenitore è disponibile tramite Galleria pubblica Amazon ECR, e il suo codice sorgente è disponibile su GitHub. Ciò fornisce alle aziende trasparenza sui pacchetti e sul processo di compilazione, facilitando così la riproduzione, la personalizzazione o la ricertificazione della distribuzione. L'immagine di base viene fornita con pip e Conda/Mamba, in modo che i data scientist possano installare rapidamente pacchetti aggiuntivi per soddisfare le loro esigenze specifiche.

Estensione Jupyter di Amazon CodeGuru

Codice Amazon Guru La sicurezza ora supporta scansioni di sicurezza e qualità del codice in JupyterLab e SageMaker Studio. Questa nuova funzionalità aiuta gli utenti di notebook a rilevare vulnerabilità di sicurezza come difetti di iniezione, fughe di dati, crittografia debole o crittografia mancante all'interno delle celle del notebook. Puoi anche rilevare molti problemi comuni che influenzano la leggibilità, la riproducibilità e la correttezza dei notebook computazionali, come l'uso improprio delle API della libreria ML, l'ordine di esecuzione non valido e il non determinismo. Quando vengono identificate vulnerabilità o problemi di qualità nel notebook, CodeGuru genera raccomandazioni che consentono di risolvere tali problemi in base alle best practice di sicurezza di AWS.

Conclusione

Siamo entusiasti di vedere come la community di Jupyter utilizzerà questi strumenti per ridimensionare lo sviluppo, aumentare la produttività e sfruttare l'IA generativa per trasformare i propri settori. Consulta le seguenti risorse per saperne di più su Jupyter su AWS e su come installare e iniziare a utilizzare questi nuovi strumenti:


L'autore

Brian Granger è un leader del progetto Python, co-fondatore del progetto Jupyter e un collaboratore attivo di una serie di altri progetti open source incentrati sulla scienza dei dati in Python. Nel 2016 ha co-creato il pacchetto Altair per la visualizzazione statistica in Python. È membro del comitato consultivo della NumFOCUS Foundation, membro della facoltà del Cal Poly Center for Innovation and Entrepreneurship e Sr. Principal Technologist presso AWS.

Timestamp:

Di più da Apprendimento automatico di AWS