Brug AutoGluon-Tabular i AWS Marketplace

Kildeknude: 1447646

AutoGluon-Tabular er en open source AutoML-ramme, der kun kræver en enkelt linje Python for at træne meget nøjagtige maskinlæringsmodeller (ML) på et ubearbejdet tabeldatasæt. I dette indlæg guider vi dig gennem en måde at bruge AutoGluon-Tabular på som en kodefri AWS Marketplace produkt. Vi bruger denne proces til at træne og implementere en meget nøjagtig ML-model til en tabelformidlingsopgave.

Oversigt over AutoGluon-Tabular

Tabeldataforudsigelse, som omfatter både klassificering og regression, er den mest udbredte klasse af forudsigelsesproblemer i erhvervslivet. Hvis du har arbejdet med denne type forudsigelsesproblem før, ved du, at det er et stort felt med ekstrem mangfoldighed af data. Virksomheder ønsker at bygge prædiktive modeller oven på data opnået gennem en bred vifte af kilder, såsom købshistorier, forsikringskrav, medicinske rapporter og sensoraflæsninger streamet fra IoT-enheder. Denne mangfoldighed har resulteret i et enormt udvalg af modelleringsteknikker.

Klassiske tilgange har typisk været domineret af domæneekspertise og omhyggelig, tidskrævende feature engineering. Men hvis du følger datavidenskabskonkurrencer som dem, der afholdes af Kaggle, har du muligvis bemærket, at der sker en overgang. På det seneste er de mest konkurrencedygtige tilgange ikke blevet indkapslet af domæneeksperter med omhyggelig funktionsteknik, men i stedet af ML-arkitektureksperter med store ensembler af modeller. Over tid har ML-samfundet opdaget, at modeller, der er værre isoleret set, ofte er overlegne i kombination. Denne idé er nogle gange kendt i andre sammenhænge som mangfoldighedsforudsigelsesteoremet eller mængdens visdom. Denne effekt er typisk størst, når individuelle modeller er forskellige og har fejl på forskellige måder.

Denne idé er kernen i AutoGluon-Tabular. AutoGluon-Tabular er designet til at være ligetil, robust, effektiv, nøjagtig og fejltolerant, og vender tilbage til det seneste kontrolpunkt i tilfælde af en fejl. Som et bibliotek er al kompleksiteten blevet abstraheret væk, så resultater ofte kan opnås med kun tre linjer kode.

Vi har taget dette et skridt videre og lanceret AutoGluon-Tabular på AWS Marketplace som en måde at bruge AutoGluon-Tabular på AWS. Det er muligt at bygge modeller i verdensklasse uden en enkelt kodelinje! Derudover kan du drage fordel af kraftfulde Amazon SageMaker funktioner. Amazon SageMaker er en fuldt administreret tjeneste, der giver enhver udvikler og dataforsker mulighed for hurtigt at forberede bygge, træne og implementere maskinlæringsmodeller. Det gør det nemt at implementere din trænede model til produktion med et enkelt klik.

Løsningsoversigt

De følgende afsnit viser dig, hvordan du bruger AutoGluon-Tabular i AWS Marketplace på SageMaker-konsollen. Hvis du ønsker at bruge AutoGluon-Tabular i AWS Marketplace i SageMaker-notebooks, kan du henvise til følgende eksempel notesbog.

Vi gennemgår følgende trin:

  1. Abonner på AutoGluon-Tabular i AWS Marketplace.
  2. Opret et SageMaker træningsjob.
  3. Opret en modelpakke.
  4. Implementer et slutpunkt.
  5. Opret et SageMaker batch transformationsjob.

Abonner på AutoGluon-Tabular i AWS Marketplace

Det første trin er at abonnere på AutoGluon-Tabular i AWS Marketplace.

  1. Naviger til AutoGluon-tabel på AWS Marketplace.
  2. Vælg Fortsæt med at abonnere.
  3. Vælg Accepter tilbud.
  4. Vælg Fortsæt til konfiguration.
  5. Til Software Version, vælg version 3.5.
  6. Til Område, vælg en region.
  7. Vælg Se i Amazon SageMaker.

Du bliver omdirigeret til SageMaker-konsollen.

Opret et SageMaker træningsjob

For at oprette et træningsjob skal du udføre følgende trin:

  1. Opret et nyt træningsjob på SageMaker-konsollen.
  2. Til Job navn, indtast et navn (for dette indlæg, autogluon-demo).
  3. Til IAM rolle, vælg en AWS identitets- og adgangsstyring (IAM) rolle.
  4. Til Forekomsttype, vælg din forekomststørrelse.
  5. Til Yderligere lagervolumen pr. instans, indtast din lydstyrkestørrelse.

Vi anbefaler at bruge m5-instanstypen og en volumenstørrelse på mere end 30 GB.

  1. I Hyperparametre afsnit, kan du bestå args til AutoGluon-Tabular.

Minimumskravet er at indstille navnet på etiketkolonnen til at forudsige.

  1. I Indgangsdatakonfiguration afsnit, for S3 placering, skal du indtaste Amazon S3-placeringen for din CSV-fil til træning.
  2. Angiv eventuelt Amazon S3-placeringen af ​​din testfil.
  3. Angiv Amazon S3-placeringen for dine outputdata.
  4. Vælg Opret træningsjob.

Opret en modelpakke

Når træningen er færdig, kan du oprette en modelpakke.

  1. Træningsjob side på SageMaker-konsollen, skal du vælge dit træningsjob.
  2. handlinger menu, vælg Opret modelpakke.
  3. Til Modelpakkenavn, indtast et navn (for dette indlæg, autogluon-demo).
  4. Type Angiv den algoritme, der bruges til træning, og dens modelartefakter.
  5. Vælg Næste.
  6. Til Valider denne ressource, Vælg Ingen.
  7. Vælg Opret modelpakke.

Implementer et slutpunkt

Udfør følgende trin for at implementere dit slutpunkt:

  1. På SageMaker-konsollen skal du vælge den modelpakke, du har oprettet.
  2. Vælg Opret slutpunkt.
  3. Vælg Næste.
  4. Til Modelnavn, indtast et navn (for dette indlæg, autogluon-demo).
  5. Til Indgangsmuligheder for container, Vælg Brug et modelpakkeabonnement fra AWS Marketplace.
  6. På næste side, for Endpoint navn, indtast et navn (f.eks. autogluon-demo).
  7. Vælg instanstypen.
  8. Vælg Opret slutpunktskonfiguration, Og vælg derefter Indsend.

Opret et SageMaker batch transformationsjob

For at oprette et batchtransformationsjob skal du udføre følgende trin:

  1. På SageMaker-konsollen skal du navigere til den model, du har oprettet.
  2. Vælg Opret batch transformationsjob.
  3. Til Job navn, indtast et navn (for dette indlæg, autogluon-demo).
  4. Til Forekomsttype, vælg en forekomsttype.
  5. I Indgangsdatakonfiguration afsnit, for Opdelt type, vælg Line (linje).
  6. Til Indholdstype, gå ind text/csv.
  7. Til S3 placering, indtast S3-stien til din CSV-fil.
  8. Til S3 udgangsvej, indtast S3-stien til dine outputdata.
  9. Vælg Skab job.

Ryd op i ressourcer

Slet endelig slutpunktet, når du er færdig, så du ikke pådrager dig yderligere gebyrer.

Konklusion

I dette indlæg ledte vi dig igennem, hvordan du træner ML-modeller og laver forudsigelser ved hjælp af AutoGluon-tabel på AWS Marketplace via SageMaker-konsollen. Du kan bruge denne kodefri løsning til at bruge kraften i ML uden forudgående programmering eller datavidenskabsekspertise. Prøv det og lad os vide, hvordan det går i kommentarerne!


Om forfatterne

Yohei Nakayama er Deep Learning Architect ved Amazon ML Solutions Lab. Han arbejder med kunder på tværs af forskellige vertikaler for at fremskynde deres brug af kunstig intelligens og AWS Cloud-tjenester for at løse deres forretningsmæssige udfordringer. Han er interesseret i at anvende ML/AI-teknologier til rumindustrien.

Austin Welch er dataforsker ved Amazon ML Solutions Lab, hvor han hjælper AWS-kunder på tværs af forskellige industrier med at accelerere deres AI og cloud-adoption.

Tatsuya Arai Ph.D. er en biomedicinsk ingeniør, der er blevet deep learning-dataforsker på Amazon ML Solutions Lab-teamet. Han tror på den sande demokratisering af AI, og at AI's kraft ikke bør være eksklusiv for dataloger eller matematikere.

Kilde: https://aws.amazon.com/blogs/machine-learning/use-autogluon-tabular-in-aws-marketplace/

Tidsstempel:

Mere fra AWS Machine Learning Blog