Amazonin teksti on koneoppimispalvelu (ML), joka poimii automaattisesti tekstin, käsinkirjoituksen ja datan mistä tahansa asiakirjasta tai kuvasta. Amazon Textractin ominaisuuksien arvioinnin helpottamiseksi olemme julkaisseet Amazon Textract -konsolissa uuden Bulk Document Uploader -ominaisuuden, jonka avulla voit nopeasti käsitellä omia dokumenttejasi ilman koodin kirjoittamista.
Tässä viestissä käymme läpi, milloin ja miten voit käyttää Amazon Textract Bulk Document Uploaderia arvioidaksesi, kuinka Amazon Textract toimii asiakirjoissasi.
Katsaus ratkaisuun
Bulk Document Uploaderia tulisi käyttää Amazon Textractin nopeaan arvioimiseen ennalta määrätyissä käyttötapauksissa. Lataamalla useita asiakirjoja samanaikaisesti intuitiivisen käyttöliittymän kautta, voit helposti mitata, kuinka hyvin Amazon Textract toimii asiakirjoissasi.
Voit ladata ja käsitellä jopa 150 asiakirjaa kerralla. Toisin kuin olemassa olevat Amazon Textract -konsolin demot, jotka asettavat keinotekoisia rajoituksia asiakirjojen lukumäärälle, asiakirjan koolle ja suurimmalle sallitulle sivumäärälle, joukkoasiakirjojen lähetysohjelma tukee jopa 150 asiakirjan käsittelyä pyyntöä kohden ja siinä on samat asiakirjan koko- ja sivurajoitukset kuin Amazon Textract API:t. Tämä tekee suuremman asiakirjajoukon arvioinnista tehokkaampaa.
Bulk Document Uploader tulostaa tavallisen Amazon Textract JSON -vastauksen ja CSV-tiedoston. Tulokset toimitetaan JSON-muodossa helppoa ohjelmallista analysointia varten. Lisäksi tarjolla on ihmisen luettavissa oleva CSV-tiedosto luotettavuuspisteillä, jotta poimittuja tietoja voidaan verrata ja arvioida helposti.
Kun käytät tätä ominaisuutta, muista seuraavat asiat:
- Joukkoasiakirjojen latausohjelma käsittelee asiakirjoja kautta asynkroniset toiminnot. Voit seurata käsittelyn tilaa Amazon Textract -konsolissa. Vain DetectDocumentText (OCR), Analysoi asiakirja (taulukot, kyselyt, lomakkeet ja allekirjoitukset) ja AnalyzeExpense Sovellusliittymiä tuetaan tällä hetkellä.
- Asiakirjan joukkolähetysohjelma tarjoaa API-toimintojen JSON-tuloksia ja muotoiltuja CSV-raportteja. Saatat joutua luottamaan ulkoisiin työkaluihin tietojen visualisoinnissa, kuten näyttämään rajoituslaatikon korostuksia asiakirjassa JSON-tulosten avulla.
- Tämän ominaisuuden käyttämisestä asiakirjojen käsittelyyn peritään samat maksut kuin tavallisesta Amazon Textractin käytöstä (käytettävästä ominaisuudesta riippuen), ja siihen sovelletaan tilille ja alueelle asetettuja API-rajoituksia (transactions per second). Lisätietoja hinnoittelusta, katso Amazon Textract hinnoittelu. Lisätietoja Amazon Textractin rajoituksista on kohdassa Kiintiöt Amazon Textractissa.
- Joukkolatauksen hyväksytyt tiedostomuodot ovat JPEG, PNG, TIF ja PDF. Myös JPEG 2000 -koodattuja kuvia PDF-tiedostoissa tuetaan. JPEG- ja PNG-tiedostojen kokorajoitus on 10 Mt, kun taas PDF- ja TIF-tiedostoilla 500 Mt. Monisivuisilla PDF- ja TIF-tiedostoilla on 3,000 XNUMX sivun raja.
Käytä joukkoasiakirjojen latausohjelmaa
Bulk Document Uploader on tarkoitettu auttamaan sinua arvioimaan nopeasti, kuinka Amazon Textract toimii joukolla omia asiakirjojasi ilman, että sinun tarvitsee kirjoittaa mitään koodia. Voit käyttää tiedostojen joukkolähetysohjelmaa jopa 150 asiakirjan käsittelyyn sen sijaan, että lataat ja käsittelet asiakirjoja erikseen. Voit joukkolähettää asiakirjoja suoraan tietokoneeltasi tai tuoda asiakirjoja olemassa olevista Amazonin yksinkertainen tallennuspalvelu (Amazon S3)-kauha.
Joukkoasiakirjojen latausohjelma tarjoaa tuloksia, jotka voit ladata myöhemmin offline-tarkastelua varten. Jokainen ladattava ZIP-tiedosto sisältää Amazon Textract API -vastauksen JSON-tiedostomuodossa ja ihmisen luettavan CSV-tiedoston, joka sisältää poimitut tiedot ja luottamuspisteet. Tulosten tulokset ovat ladattavissa 7 päivän ajan käsittelyn jälkeen. 14 päivän kuluttua asiakirjat poistetaan Lähetetyt asiakirjat osio. Jos haluat käyttää joukkoasiakirjojen latausohjelmaa, suorita seuraavat vaiheet:
- Amazon Textract -konsolissa, alla Demos valitse siirtymisruudussa Joukkoasiakirjojen latausohjelma.
- Valita Lataa asiakirjat.
- Määritä asiakirjojen lähde.
Sinulla on kaksi vaihtoehtoa lähettää asiakirjoja:
- Tuo asiakirjat S3-ämpäristä – Jos käytät asiakirjoillesi S3-säilöä, anna ämpärin URL-osoite ja (valinnaisesti) etuliite, jossa asiakirjat sijaitsevat,
s3://your-bucket/prefix/
muoto. Vaihtoehtoisesti valitse Selaa S3: ta selataksesi ja valitaksesi asiakirjojen haluamasi sijainnin. Jos määrittämäsi Amazon S3 -sijainti sisältää yli 150 asiakirjaa, vain ensimmäiset 150 asiakirjaa lähetetään Amazon Textractiin käsiteltäväksi. - Lataa asiakirjoja tietokoneeltasi – Jos lataat asiakirjoja tietokoneeltasi, voit ladata jopa 50 asiakirjaa kerralla valitsemalla Lataa asiakirjat. Jos haluat ladata lisää asiakirjoja (enintään 150), valitse Lisää asiakirjoja sen jälkeen, kun alkuperäiset asiakirjat on ladattu.
Tässä tapauksessa asiakirjasi ladataan ensin tilisi S3-säilöyn, joka on luotu puolestasi, joten on tärkeää varmistaa, että sinulla on oikeudet käyttää ja ladata asiakirjoja Amazon S3:een. Tämä on kertaluonteinen toiminto, ja samaa ryhmää käytetään kaikissa myöhemmissä tietokoneeltasi tapahtuvissa latauksissa. Jos haluat ladata ja käsitellä saman asiakirjajoukon, voit käyttää polkua tähän S3-säilöyn käyttämällä Tuo asiakirjat S3-ämpäristä vaihtoehto. Sinun puolestasi luotu S3-säilö tulee näkyviin, kun säilö on luotu.
- Määritä seuraavaksi Amazon Textract -ominaisuus, jota haluat käyttää asiakirjojen käsittelyyn.
Voit valita vain yhden ominaisuuden kerrallaan käsitelläksesi asiakirjojasi. Jos haluat arvioida lisäominaisuuksia, sinun on luotava erillinen pyyntö valitsemalla haluamasi ominaisuus ja lataamalla asiakirjat uudelleen. Jos AnalyzeDocument – Kyselyt ominaisuus on valittuna, sinun on annettava kyselyt, joita haluat testata asiakirjoissasi. Voit määrittää enintään 30 kyselyä kerrallaan. Jos lähetetyt asiakirjat sisältävät monisivuisia (PDF- tai TIF-)tiedostoja, kyselyjä sovelletaan vain kunkin asiakirjan ensimmäiselle sivulle. Viitata Parhaat käytännöt kyselyihin oppiaksesi rakentamaan kyselyitä.
- Valita Aloita käsittely lähettää asiakirjat Amazon Textractille käsittelyä varten.
Voit seurata asiakirjan tilaa ja ladata käsiteltyjen asiakirjojen tulosteet Lähetetyt asiakirjat osio. Tämä osio päivittyy säännöllisesti, ja voit päivittää sen manuaalisesti nähdäksesi, onko käsittely valmis. Jokainen asiakirja käsitellään erikseen, joten voit valita asiakirjan joko käyttämällä Valmis ladattavaksi tila tai odota, että kaikki asiakirjat on käsitelty loppuun, jotta voit ladata tulokset. Käsiteltyjen asiakirjojen tulosteet ovat ladattavissa enintään 7 päivää, jonka jälkeen ne vanhenevat. Vanhentuneet asiakirjat tyhjennetään Lähetetyt asiakirjat kohta 7 lisäpäivän jälkeen (14 päivää käsittelypäivästä). Suosittelemme tulosteiden lataamista ja säilyttämistä 7 päivän aikana.
Yhteenveto
Tässä viestissä julkistimme uuden Amazon Textract Bulk Document Uploader -ominaisuuden, jonka avulla voit käsitellä nopeasti suuren määrän asiakirjoja arviointitarkoituksiin. Tämän ominaisuuden avulla voit arvioida Amazon Textractin ennalta määrätyssä käyttötapauksessa asiakirjoisi kanssa. Saat lisätietoja siitä, kuinka voit käyttää Amazon Textractia älykkäässä asiakirjakäsittelyssäsi, vierailemalla osoitteessa Amazon Textractin ominaisuudet ja Amazon Textractin käytön aloittaminen.
Tietoja Tekijät
Shashwat Sapre on vanhempi tekninen tuotepäällikkö Amazon Textract -tiimissä. Hän on keskittynyt rakentamaan koneoppimiseen perustuvia palveluita AWS-asiakkaille. Vapaa-ajallaan hän lukee mielellään uusista teknologioista, matkustaa ja tutkii erilaisia ruokia.
Anjan Biswas on vanhempi AI-palveluratkaisuarkkitehti, joka keskittyy tekoälyyn/ML:ään ja data-analyyseihin. Anjan on osa maailmanlaajuista tekoälypalvelutiimiä ja työskentelee asiakkaiden kanssa auttaakseen heitä ymmärtämään ja kehittämään ratkaisuja tekoälyn ja ML:n liiketoimintaongelmiin. Anjanilla on yli 14 vuoden kokemus työskentelystä maailmanlaajuisten toimitusketju-, valmistus- ja vähittäismyyntiorganisaatioiden kanssa, ja hän auttaa aktiivisesti asiakkaita pääsemään alkuun ja skaalaamaan AWS AI -palveluita.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoAiStream. Web3 Data Intelligence. Tietoa laajennettu. Pääsy tästä.
- Tulevaisuuden lyöminen Adryenn Ashley. Pääsy tästä.
- Osta ja myy osakkeita PRE-IPO-yhtiöissä PREIPO®:lla. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :on
- :On
- :missä
- $ YLÖS
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- Meistä
- pääsy
- Tili
- Toiminta
- aktiivisesti
- lisä-
- Lisäksi
- Jälkeen
- uudelleen
- vastaan
- AI
- Tekoälyn palvelut
- AI / ML
- Kaikki
- mahdollistaa
- Myös
- Amazon
- Amazonin teksti
- Amazon Web Services
- an
- analyysi
- Analytics
- ja
- ilmoitti
- Kaikki
- api
- API
- sovellettu
- OVAT
- keinotekoinen
- AS
- At
- automaattisesti
- saatavissa
- AWS
- BE
- Laatikko
- Rakentaminen
- liiketoiminta
- by
- CAN
- kyvyt
- tapaus
- tapauksissa
- ketju
- maksut
- Valita
- valita
- koodi
- vertailu
- täydellinen
- tietokone
- luottamus
- Console
- rakentaa
- sisältää
- luoda
- luotu
- Tällä hetkellä
- Asiakkaat
- tiedot
- Data Analytics
- Päivämäärä
- päivää
- Demos
- Riippuen
- haluttu
- kehittää
- eri
- suoraan
- näyttämällä
- asiakirja
- asiakirjat
- download
- kukin
- helposti
- helppo
- tehokas
- myöskään
- mahdollistaa
- tehostettu
- varmistaa
- Eetteri (ETH)
- arvioida
- arviointi
- olemassa
- experience
- Tutkiminen
- ulkoinen
- otteet
- Ominaisuus
- Ominaisuudet
- filee
- Asiakirjat
- Etunimi
- Keskittää
- keskityttiin
- jälkeen
- varten
- muoto
- lomakkeet
- alkaen
- saada
- Global
- Olla
- he
- auttaa
- auttaa
- raidat
- hänen
- Miten
- Miten
- HTML
- http
- HTTPS
- luettavaan
- if
- kuva
- kuvien
- tuoda
- tärkeä
- määrätä
- in
- Erikseen
- tiedot
- ensimmäinen
- sen sijaan
- Älykäs
- Älykäs asiakirjojen käsittely
- tarkoitettu
- käyttöön
- intuitiivinen
- IT
- jpg
- json
- Pitää
- suuri
- suurempi
- myöhemmin
- käynnistettiin
- OPPIA
- oppiminen
- RAJOITA
- rajat
- sijainti
- kone
- koneoppiminen
- tehdä
- TEE
- johtaja
- käsin
- valmistus
- monet
- maksimi
- Saattaa..
- mielessä
- ML
- lisää
- tehokkaampi
- moninkertainen
- täytyy
- suunnistus
- Tarve
- tarvitsevat
- Uusi
- Uudet teknologiat
- numero
- OCR
- of
- offline
- on
- kerran
- ONE
- vain
- Operations
- Vaihtoehto
- Vaihtoehdot
- or
- organisaatioiden
- ulostulo
- yli
- oma
- sivulla
- lasi
- osa
- polku
- suorittaa
- aika
- Oikeudet
- Platon
- Platonin tietotieto
- PlatonData
- Kirje
- käytännöt
- säilöntä
- hinnoittelu
- ongelmia
- prosessi
- Prosessit
- käsittely
- Tuotteet
- tuotepäällikkö
- ohjelmallinen
- toimittaa
- mikäli
- tarjoaa
- tarkoituksiin
- kyselyt
- nopea
- nopeasti
- Lukeminen
- alue
- säännöllinen
- luottaa
- jäädä
- Raportit
- pyyntö
- vastaus
- tulokset
- vähittäiskauppa
- arviot
- sama
- Asteikko
- Toinen
- Osa
- nähdä
- valittu
- valitsemalla
- vanhempi
- lähetetty
- erillinen
- palvelu
- Palvelut
- setti
- shouldnt
- allekirjoitukset
- Yksinkertainen
- samanaikaisesti
- Koko
- So
- Ratkaisumme
- lähde
- määritelty
- standardi
- alkoi
- Tila
- Askeleet
- Levytila
- aihe
- antaa
- myöhempi
- niin
- ehdottaa
- toimittaa
- toimitusketju
- Tuetut
- Tukee
- joukkue-
- Tekninen
- Technologies
- testi
- kuin
- että
- -
- Lähde
- Niitä
- sitten
- siksi
- ne
- tätä
- Kautta
- aika
- että
- työkalut
- tps
- raita
- Liiketoimet
- Matkustaminen
- kaksi
- ui
- varten
- ymmärtää
- toisin kuin
- Päivitykset
- ladattu
- Ladataan
- URL
- Käyttö
- käyttää
- käyttölaukku
- käytetty
- käyttämällä
- kautta
- näkyvä
- Vierailla
- visualisointi
- odottaa
- haluta
- we
- verkko
- verkkopalvelut
- HYVIN
- kun
- joka
- tulee
- with
- sisällä
- ilman
- työskentely
- toimii
- kirjoittaa
- kirjoittaminen
- vuotta
- te
- Sinun
- zephyrnet
- Postinumero