AWS och Hugging Face samarbetar för att göra generativ AI mer tillgänglig och kostnadseffektiv

AWS och Hugging Face samarbetar för att göra generativ AI mer tillgänglig och kostnadseffektiv

Källnod: 1970451

Vi är glada över att tillkännage ett utökat samarbete mellan AWS och Hugging Face för att påskynda utbildningen, finjusteringen och distributionen av stora språk- och visionmodeller som används för att skapa generativa AI-applikationer. Generativa AI-applikationer kan utföra en mängd olika uppgifter, inklusive textsammanfattning, svara på frågor, kodgenerering, skapa bilder och skriva uppsatser och artiklar.

AWS har en djup historia av innovation inom generativ AI. Till exempel använder Amazon AI för att leverera en konversationsupplevelse med Alexa som kunder interagerar med miljarder gånger varje vecka, och använder alltmer generativ AI som en del av nya upplevelser som Skapa med Alexa. Dessutom, M5 en grupp inom Amazon Search som hjälper team över hela Amazon att ta med stora modeller till sina applikationer, tränade stora modeller för att förbättra sökresultat på Amazon.com. AWS förnyar ständigt inom alla områden av ML inklusive infrastruktur, verktyg på Amazon SageMaker, och AI-tjänster, som t.ex Amazon Code Whisperer, en tjänst som förbättrar utvecklarens produktivitet genom att generera kodrekommendationer baserat på koden och kommentarerna i en IDE. AWS skapade också specialbyggda ML-acceleratorer för utbildningen (AWS Trainium) och slutledning (AWS slutledning) av stora språk- och visionsmodeller på AWS.

Hugging Face valde AWS eftersom det erbjuder flexibilitet över toppmoderna verktyg för att träna, finjustera och distribuera Hugging Face-modeller inklusive Amazon SageMaker, AWS Trainiumoch AWS slutledning. Utvecklare som använder Hugging Face kan nu enkelt optimera prestanda och sänka kostnader för att få generativa AI-applikationer till produktion snabbare.

Högpresterande och kostnadseffektiv generativ AI

Att bygga, träna och implementera stora språk- och visionsmodeller är en dyr och tidskrävande process som kräver djup expertis inom maskininlärning (ML). Eftersom modellerna är mycket komplexa och kan innehålla hundratals miljarder parametrar är generativ AI till stor del utom räckhåll för många utvecklare.

För att överbrygga denna lucka samarbetar Hugging Face nu med AWS för att göra det lättare för utvecklare att få tillgång till AWS-tjänster och distribuera Hugging Face-modeller specifikt för generativa AI-applikationer. Fördelarna är: snabbare träning och skalning av slutledning med låg latens och hög genomströmning. Till exempel Amazon EC2 Trn1-instanserna som drivs av AWS Trainium leverera snabbare tid att träna samtidigt som du erbjuder upp till 50 % kostnadsbesparingar jämfört med jämförbara GPU-baserade instanser. Amazon EC2:s nya Inf2-instanser, som drivs av den senaste generationen av AWS slutledning, är specialbyggda för att distribuera den senaste generationen av stora språk- och visionmodeller och höja prestandan hos Inf1 genom att leverera upp till 4x högre genomströmning och upp till 10x lägre latens. Utvecklare kan använda AWS Trainium och AWS Inferentia genom hanterade tjänster som Amazon SageMaker, en tjänst med verktyg och arbetsflöden för ML. Eller så kan de hantera sig själv på Amazon EC2.

Kom igång idag

Kunder kan börja använda Hugging Face-modeller på AWS på tre sätt: genom SageMaker Försprång, d Hugging Face AWS Deep Learning Containers (DLCs),  eller självstudiekurser för att distribuera dina modeller till AWS Trainium eller AWS Inferentia. Hugging Face DLC är fullpackad med optimerade transformatorer, datauppsättningar och tokenizerbibliotek för att du ska kunna finjustera och distribuera generativa AI-applikationer i skala i timmar istället för veckor – med minimala kodändringar. SageMaker JumpStart och Hugging Face DLC:erna är tillgängliga i alla regioner där Amazon SageMaker finns tillgänglig och kommer utan extra kostnad. Läsa dokumentation och diskussionsforums att lära sig mer eller prova exempel anteckningsböcker i dag.

Tidsstämpel:

Mer från AWS maskininlärning