Dokumenter er et primært værktøj til registrering, kommunikation, samarbejde og transaktioner på tværs af mange brancher, herunder finansielle, medicinske, juridiske og fast ejendom. De millioner af ansøgninger om realkreditlån og hundredvis af millioner af W2-skatteformularer, der behandles hvert år, er blot nogle få eksempler på sådanne dokumenter.
Kritiske forretningsdata forbliver låst op i ustrukturerede dokumenter såsom scannede billeder og PDF'er og forsøger at få mennesker til at læse disse data eller endda arv OCR er kedeligt, dyrt og udsat for fejl.
Dette er grunden til, at vi lancerede amazontekst i 2019 for at hjælpe dig med at automatisere dine kedelige dokumentbehandlingsarbejdsgange drevet af kunstig intelligens. Amazon Textract udtrækker automatisk trykt tekst, håndskrift og data fra ethvert dokument.
Amazon Textract forbedrer løbende tjenesten baseret på din feedback.
I dette indlæg deler vi funktionerne og forbedringerne til Amazon Textract-tjenesten, der udgives hvert kvartal.
2022 – 4. kvartal
Analyser udlån for at fremskynde behandlingen af lånedokumenter
Funktionen Analyser Lending i Amazon Textract er en administreret API, der hjælper dig med at automatisere behandling af realkreditdokumenter for at øge virksomhedens effektivitet, reducere omkostningerne og skalere hurtigt. Analyse Lending automatiserer fuldt ud klassificering og udtræk af information fra lånepakker. Du uploader blot dine realkreditlånsdokumenter til Analyze Lending API, og dets forudtrænede maskinlæringsmodeller vil automatisk klassificere og opdele efter dokumenttype og udtrække kritiske informationsfelter fra en realkreditlånspakke. Lær mere om denne funktion i indlægget Klassificering og udtræk af realkreditlånsdata med Amazon Textract.
Mulighed for at registrere signaturer på ethvert dokument
Med denne funktion giver Amazon Textract mulighed for at opdage håndskrevne signaturer, e-signaturer og initialer på dokumenter såsom låneansøgningsskemaer, checks, kravformularer og mere. Signaturfunktionen er tilgængelig som en del af AnalyzeDocument
API. Det reducerer behovet for menneskelige korrekturlæsere og hjælper dig med at reducere omkostningerne, spare tid og bygge skalerbare løsninger til dokumentbehandling. AnalyzeDocument
Signaturer angiver placeringen og konfidensresultaterne for de opdagede signaturer. Funktionen kan bruges selvstændigt eller i kombination med andre AnalyzeDocument-funktioner. Signaturer er foruddannet på en lang række finansielle, forsikrings- og skattemæssige dokumenter. Lær mere om, hvordan du bruger denne funktion i vores dokumentation for AnalyzeDocument
API.
AnalyzeDocument Forms-forbedringer til indrammede formularer og E13B-skrifttype
Amazon Textract har lavet kvalitetsforbedringer til tekst- og formularudtrækningsfunktionerne, der er tilgængelige som en del af AnalyzeDocument
API.
Disse opdateringer forbedrer den overordnede nøgle-værdi-parudtrækningsnøjagtighed og forbedrer specifikt ekstraktion af data, der er indfanget i formularer med enkelttegn, der almindeligvis findes i skat, immigration og andre former. Amazon Textract er nu i stand til at bruge sin viden om disse enkelt-tegns indrammede formularer til at give højere nøjagtigheder i nøgleværdi-parudtræk.
Derudover er vi glade for at kunne annoncere support til E13B-skrifttyper, der almindeligvis findes i indbetalingschecks, nøjagtighedsforbedringer til at detektere internationale bankkontonumre (IBAN), der findes i bankdokumenter, og lange ord (såsom e-mail-adresser) via AnalyzeDocument
API. Virksomheder på tværs af brancher som forsikring, sundhedspleje og banker bruger disse dokumenter i deres forretningsprocesser og vil automatisk se fordelene ved denne opdatering, når de bruger AnalyzeDocument
API.
AnalyzeExpense API tilføjer nye felter og OCR-output
Opdateringen til AnalyzeExpense
API øger antallet af normaliserede felter til over 40. De nyligt understøttede normaliserede felter omfatter opsummeringsfelter såsom leverandøradresse og linjepostfelter såsom produktkode. Med denne nye funktion kan du direkte udtrække dine ønskede oplysninger og spare tid på at skrive og vedligeholde kompleks efterbehandlingskode. Udover understøttelse af nye felter, har vi yderligere forbedret nøjagtigheden for felter som leverandørnavn og total, der allerede blev understøttet i den tidligere version.
Sammen med normaliserede nøgleværdi-par og almindelige nøgleværdipar, AnalyzeExpense
leverer nu hele OCR-outputtet i API-svaret. Du kan få både nøgleværdi-par og det rå OCR-ekstrakt gennem en enkelt API-anmodning. Lær mere om AnalyzeExpense
API i Analyse af fakturaer og kvitteringer.
Analyser ID maskinlæsbar zonekodeunderstøttelse og OCR-output
Analyse ID tilføjer understøttelse til at udtrække den maskinlæsbare zone-kode (MRZ) på amerikanske pas. Dette er ud over de andre felter, du kan udtrække på amerikanske pas, såsom dokumentnummer, fødselsdato og udstedelsesdato, for i alt 10 felter. Du kan fortsætte med at udtrække 19 felter fra amerikanske kørekort, inklusive udledte felter såsom fornavn, efternavn og adresse. Udover understøttelse af det nye MRZ-kodefelt, har vi yderligere forbedret nøjagtigheden for felter som udløbsdato og fødselssted, der allerede blev understøttet i den tidligere version.
Sammen med normaliserede nøgleværdi-par leverer Analyse-id hele OCR-outputtet i API-svaret med denne udgivelse. Du kan få både nøgleværdi-par og det rå OCR-ekstrakt gennem en enkelt API-anmodning. Lær mere om vores Analyse ID API i Analyse af identitetsdokumenter.
2022 – 3. kvartal
Nøjagtighedsforbedringer til tekstudtrækning (OCR).
De seneste tekst (OCR) ekstraktionsmodeller tilgængelige via DetectDocumentText
API forbedrer ord- og linjeudtrækningsnøjagtigheden. Amazon Textract tilføjede også understøttelse af E13B-skrifttypeudtrækning, som almindeligvis findes i checks, IBAN-numre fundet i bankdokumenter og forbedret nøjagtighed på længere ord såsom e-mail-adresser. For at lære mere om lanceringen, se Amazon Textract annoncerer opdateringer til tekstudtrækningsfunktionen.
Nøjagtighedsforbedringer til formularekstraktion
Amazon Textract giver nu forbedret nøgleværdi-parudtrækningsnøjagtighed til standardiserede dokumenter med ensartede layouts som udvalgte CMS (Center for Medicare og Medicaid) sundhedspleje, IRS-skat og ACORD-forsikringsformularer. Disse dokumenter har traditionelt været udfordrende at udtrække information fra på grund af deres tætte og komplekse layout. Amazon Textract er nu i stand til at bruge sin viden om disse standardiserede formularer til at give højere nøjagtigheder i nøgleværdi-parudtræk. Virksomheder på tværs af brancher som forsikring, sundhedspleje og bank vil automatisk se fordelene ved denne opdatering, når de bruger formularudtræksfunktionen. For mere information, se Amazon Textract annoncerer kvalitetsopdatering til sin formularekstraktionsfunktion.
Integration med AWS Servicekvoter
Du kan nu proaktivt administrere alle dine Amazon Textract-tjenestekvoter via AWS servicekvoter konsol. Med Service Quotas kan dine anmodninger om kvoteforøgelse nu behandles automatisk, hvilket i de fleste tilfælde fremskynder godkendelsestider. Ud over at se standard kvoteværdier kan du nu se de anvendte kvoteværdier for dine konti i en specifik region, de historiske udnyttelsesmetrics pr. kvote og opsætte alarmer for at give dig besked, når udnyttelsen af en given kvote overstiger en konfigurerbar tærskel.
Du kan nu også bruge Amazon Textract kvoteberegner for nemt at estimere kvotekravene for din arbejdsbyrde, inden du indsender en anmodning om kvoteforøgelse direkte fra AWS Service Quotas-konsollen. For mere information, se Introduktion af selvbetjeningskvotestyring og højere standardservicekvoter for Amazon Textract.
Forøgede standardservicekvoter for Amazon Textract
Amazon Textract har nu højere standardservicekvoter for adskillige asynkrone og synkrone API-operationer i flere store AWS-regioner. Specifikt er højere standardservicekvoter nu tilgængelige for AnalyzeDocument
, DetectDocumentText
API asynkrone og synkrone operationer i USA Øst (Ohio), US East (N. Virginia), US West (Oregon), Asia Pacific (Mumbai) og Europa (Irland). For flere detaljer, se Introduktion af selvbetjeningskvotestyring og højere standardservicekvoter for Amazon Textract.
Reduktion af jobbehandlingstid på Amazon Textract asynkrone API'er
Amazon Textract tilbyder synkron API'er ligesom DetectDocumentText, AnalyserDokument, Analyser Udgiftog AnalyseID, som returnerer det faktiske dokumentsvar, og asynkront API'er ligesom StartDocumentTextDetection, Start Dokumentanalyseog Start Udgiftsanalyse, som giver dig mulighed for at indsende dokumenter på flere sider og modtage en meddelelse, når jobbehandlingen er afsluttet.
Tidligere fortalte kunder os, at de ofte så store variationer i asynkrone jobbehandlingstider afhængigt af deres anvendelsestilfælde. Baseret på din feedback har vi forbedret oplevelsen, så du kan forvente at se snævrere grænser for den asynkrone jobbehandlingstid, der tages med lavere variabilitet.
Resumé
Amazon Textract forbedrer løbende baseret på kundefeedback og frigiver ofte nye funktioner og forbedringer til tjenesten.
De nye funktioner er tilgængelige i alle regioner, medmindre specifikke regioner er nævnt for en funktion.
Udforsk selv Amazon Textract i dag på Amazon Textract konsol eller ved hjælp af AWS kommandolinjegrænseflade (AWS CLI) eller AWS udviklerværktøjer!
Om forfatteren
Martin Schade er en Senior ML Product SA med Amazon Textract-teamet. Han har mere end 20 års erfaring med internet-relaterede teknologier, ingeniør- og arkitektløsninger og kom til AWS i 2014, hvor han først vejledte nogle af de største AWS-kunder i den mest effektive og skalerbare brug af AWS-tjenester og fokuserede senere på AI/ML med fokus på computersyn og er i øjeblikket besat af at udtrække information fra dokumenter.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/2022h2-amazon-textract-launch-summary/
- 10
- 100
- 2014
- 2019
- a
- I stand
- Om
- fremskynde
- Konto
- Konti
- nøjagtighed
- tværs
- tilføjet
- Desuden
- adresse
- adresser
- Tilføjer
- AI
- AI / ML
- Alle
- allerede
- Amazon
- amazontekst
- analysere
- ,
- Annoncere
- annoncerer
- api
- Anvendelse
- applikationer
- anvendt
- godkendelse
- asia
- asien pacific
- automatisere
- automater
- automatisk
- til rådighed
- AWS
- Bank
- bankkonto
- Bank
- baseret
- fordele
- bygge
- virksomhed
- forretningsprocesser
- virksomheder
- tilfælde
- tilfælde
- center
- udfordrende
- Kontrol
- krav
- klassificering
- Klassificere
- cms
- kode
- samarbejde
- kombination
- almindeligt
- Kommunikation
- fuldføre
- komplekse
- computer
- Computer Vision
- tillid
- konsekvent
- Konsol
- fortsæt
- Omkostninger
- kritisk
- kunde
- Kunder
- data
- Dato
- Standard
- Afhængigt
- depositum
- detaljer
- opdaget
- Udvikler
- direkte
- dokumentet
- dokumenter
- køre
- hver
- nemt
- Øst
- effektivitet
- effektiv
- Engineering
- forbedret
- Hele
- fejl
- ejendom
- skøn
- Ether (ETH)
- Europa
- Endog
- eksempler
- overstiger
- forvente
- dyrt
- erfaring
- ekstrakt
- udvinding
- Uddrag
- Feature
- Funktionalitet
- tilbagemeldinger
- få
- felt
- Fields
- finansielle
- Fornavn
- Fokus
- fokuserede
- skrifttyper
- formularer
- fundet
- hyppigt
- fra
- fuldt ud
- yderligere
- få
- given
- sundhedspleje
- hjælpe
- hjælper
- højere
- historisk
- Hvordan
- How To
- HTML
- HTTPS
- menneskelig
- Mennesker
- Hundreder
- hundreder af millioner
- Identity
- billeder
- indvandring
- Forbedre
- forbedret
- forbedringer
- forbedrer
- in
- omfatter
- Herunder
- Forøg
- Stigninger
- industrier
- oplysninger
- forsikring
- internationalt
- irland
- IRS
- deres skat
- spørgsmål
- IT
- Job
- sluttede
- holde
- Nøgle
- viden
- stor
- største
- Efternavn
- seneste
- lancere
- lanceret
- LÆR
- læring
- Legacy
- Politikker
- udlån
- licenser
- Line (linje)
- lån
- placering
- Lang
- længere
- maskine
- machine learning
- lavet
- større
- administrere
- lykkedes
- ledelse
- mange
- medicinsk
- Medicare
- nævnte
- Metrics
- millioner
- ML
- modeller
- øjeblik
- mere
- Pant
- mest
- flere
- Mumbai
- navn
- Behov
- Ny
- Nye funktioner
- underretning
- nummer
- numre
- OCR
- Tilbud
- Ohio
- Produktion
- Oregon
- Andet
- samlet
- Pacific
- pakker
- par
- del
- forbi
- Place
- plato
- Platon Data Intelligence
- PlatoData
- tilfreds
- Indlæg
- strøm
- tidligere
- primære
- Forud
- Processer
- forarbejdning
- Produkt
- give
- giver
- kvalitet
- Kvarter
- hurtigt
- Raw
- Læs
- ægte
- fast ejendom
- modtage
- optage
- reducere
- reducerer
- region
- regioner
- fast
- frigive
- frigivet
- Udgivelser
- resterne
- anmode
- anmodninger
- Krav
- svar
- afkast
- SA
- Gem
- skalerbar
- Scale
- Selvbetjening
- tjeneste
- Tjenester
- sæt
- flere
- Del
- Underskrifter
- ganske enkelt
- enkelt
- Løsninger
- nogle
- specifikke
- specifikt
- delt
- standalone
- indsende
- sådan
- RESUMÉ
- support
- Understøttet
- skat
- hold
- Teknologier
- deres
- tærskel
- Gennem
- strammere
- tid
- gange
- til
- i dag
- værktøj
- I alt
- traditionelt
- Transaktioner
- Opdatering
- opdateringer
- us
- brug
- brug tilfælde
- udnytte
- værdi
- Værdier
- række
- sælger
- udgave
- via
- Specifikation
- Virginia
- vision
- Vest
- som
- bred
- Wikipedia
- vilje
- ord
- ord
- arbejdsgange
- skrivning
- år
- år
- Din
- dig selv
- zephyrnet