Ekstrakt z amazonki to usługa uczenia maszynowego (ML), która automatycznie wyodrębnia tekst, pismo odręczne i dane z dowolnego dokumentu lub obrazu. Aby ułatwić ocenę możliwości Amazon Texttract, uruchomiliśmy nową funkcję Bulk Document Uploader w konsoli Amazon Texttract, która umożliwia szybkie przetwarzanie własnego zestawu dokumentów bez pisania kodu.
W tym poście omówimy, kiedy i jak używać narzędzia do przesyłania dokumentów zbiorczych Amazon Texttract, aby ocenić, jak działa Amazon Texttract na twoich dokumentach.
Przegląd rozwiązania
Bulk Document Uploader powinien być używany do szybkiej oceny Amazon Texttract pod kątem z góry określonych przypadków użycia. Przesyłając jednocześnie wiele dokumentów za pomocą intuicyjnego interfejsu użytkownika, możesz łatwo ocenić, jak dobrze Amazon Texttract radzi sobie z Twoimi dokumentami.
Możesz przesłać i przetworzyć do 150 dokumentów jednocześnie. W przeciwieństwie do istniejących wersji demonstracyjnych konsoli Amazon Texttract, które nakładają sztuczne ograniczenia na liczbę dokumentów, rozmiar dokumentu i maksymalną dozwoloną liczbę stron, Bulk Document Uploader obsługuje przetwarzanie do 150 dokumentów na żądanie i ma taki sam rozmiar dokumentu i limity stron jak interfejsy API Amazon Text. Dzięki temu ocena większego zestawu dokumentów jest wydajniejsza.
Bulk Document Uploader generuje standardową odpowiedź Amazon Texttract JSON i plik CSV. Wyniki są dostarczane w formacie JSON dla łatwej analizy programowej. Dodatkowo dostępny jest czytelny dla człowieka plik CSV z wynikami ufności w celu prostego porównania i oceny wyodrębnionych informacji.
Korzystając z tej funkcji, pamiętaj o następujących kwestiach:
- Bulk Document Uploader przetwarza dokumenty za pośrednictwem operacje asynchroniczne. Możesz śledzić status przetwarzania w konsoli Amazon Texttract. Tylko Wykryj tekst dokumentu (OCR), AnalizujDokument (Tabele, zapytania, formularze i podpisy) oraz AnalizujWydatki Obecnie obsługiwane są interfejsy API.
- Bulk Document Uploader zapewnia wyniki JSON operacji API i sformatowane raporty CSV. Może być konieczne poleganie na zewnętrznych narzędziach do wizualizacji danych, takich jak wyświetlanie podświetlenia obwiedni w dokumencie przy użyciu wyników JSON.
- Korzystanie z tej funkcji do przetwarzania dokumentów wiąże się z takimi samymi opłatami jak zwykłe korzystanie z Amazon Texttract (w zależności od używanej funkcji) i podlega limitom TPS (transakcje na sekundę) dla interfejsów API ustawionych dla konta i regionu. Aby uzyskać więcej informacji na temat cen, patrz Ceny Amazon Text. Aby dowiedzieć się więcej o limitach Amazon Texttract, zobacz Kwoty w Amazon Text.
- Akceptowane formaty plików w przypadku przesyłania zbiorczego to JPEG, PNG, TIF i PDF. Obsługiwane są również obrazy zakodowane w formacie JPEG 2000 w plikach PDF. Pliki JPEG i PNG mają limit rozmiaru 10 MB, podczas gdy pliki PDF i TIF mają limit rozmiaru 500 MB. Wielostronicowe pliki PDF i TIF mają limit 3,000 stron.
Skorzystaj z narzędzia do przesyłania dokumentów zbiorczych
Bulk Document Uploader ma na celu pomóc Ci szybko ocenić, jak działa Amazon Texttract na zestawie własnych dokumentów, bez konieczności pisania kodu. Za pomocą programu Bulk Document Uploader można przetworzyć do 150 dokumentów zamiast przesyłania i przetwarzania dokumentów pojedynczo. Możesz zbiorczo przesyłać dokumenty bezpośrednio ze swojego komputera lub importować dokumenty z istniejącego Usługa Amazon Simple Storage Łyżka (Amazon S3).
Narzędzie Bulk Document Uploader udostępnia wyniki, które można później pobrać do przeglądu w trybie offline. Każdy plik ZIP do pobrania zawiera odpowiedź Amazon Texttract API w formacie pliku JSON oraz czytelny dla człowieka plik CSV z danymi wyjściowymi zawierającymi wyodrębnione dane i oceny ufności. Wyniki wyjściowe są dostępne do pobrania przez 7 dni po przetworzeniu. Po 14 dniach dokumenty są kasowane z Złożone dokumenty Sekcja. Aby skorzystać z narzędzia do przesyłania wielu dokumentów, wykonaj następujące czynności:
- Na konsoli Amazon Texttract pod Demos w okienku nawigacji wybierz Zbiorcze narzędzie do przesyłania dokumentów.
- Dodaj Prześlij dokumenty.
- Określ źródło swoich dokumentów.
Masz dwie możliwości przesłania dokumentów:
- Importuj dokumenty z zasobnika S3 – Jeśli używasz zasobnika S3 dla swoich dokumentów, podaj adres URL zasobnika i (opcjonalnie) prefiks miejsca, w którym znajdują się dokumenty, w
s3://your-bucket/prefix/
format. Ewentualnie wybierz Przeglądaj S3 aby przeglądać i wybrać żądaną lokalizację dokumentów. Jeśli określona lokalizacja Amazon S3 zawiera więcej niż 150 dokumentów, tylko pierwszych 150 dokumentów zostanie wysłanych do Amazon Texttract w celu przetworzenia. - Prześlij dokumenty z komputera – Jeśli przesyłasz dokumenty z komputera, możesz przesłać do 50 dokumentów jednocześnie, wybierając opcję Prześlij dokumenty. Aby przesłać dodatkowe dokumenty (maksymalnie do 150), wybierz Dodaj dokumenty po przesłaniu wstępnych dokumentów.
W takim przypadku Twoje dokumenty są najpierw przesyłane do zasobnika S3 na Twoim koncie utworzonym w Twoim imieniu, dlatego ważne jest, aby upewnić się, że masz uprawnienia dostępu i przesyłania dokumentów do Amazon S3. Jest to czynność jednorazowa i ten sam zasobnik będzie używany do wszystkich kolejnych operacji przesyłania z Twojego komputera. Jeśli chcesz przesłać i przetworzyć ten sam zestaw dokumentów, możesz użyć ścieżki do tego zasobnika S3 za pomocą pliku Importuj dokumenty z zasobnika S3 opcja. Zasobnik S3 utworzony w Twoim imieniu będzie widoczny po utworzeniu zasobnika.
- Następnie określ funkcję Amazon Text, której chcesz używać do przetwarzania dokumentów.
Możesz wybrać tylko jedną funkcję na raz do przetwarzania dokumentów. Jeśli chcesz ocenić dodatkowe funkcje, musisz utworzyć osobne zapytanie, wybierając żądaną funkcję i ponownie przesyłając dokumenty. jeśli Analizuj dokument — zapytania wybrana jest funkcja, musisz podać zapytania, które chcesz przetestować w swoich dokumentach. Jednorazowo można określić do 30 zapytań. Jeśli przesłane dokumenty zawierają pliki wielostronicowe (PDF lub TIF), zapytania są stosowane tylko do pierwszej strony każdego dokumentu. Odnosić się do Najlepsze praktyki dotyczące zapytań aby dowiedzieć się, jak konstruować zapytania.
- Dodaj Rozpocznij przetwarzanie w celu przesłania dokumentów do Amazon Texttract w celu przetworzenia.
Możesz śledzić status dokumentu i pobierać wyniki wyjściowe przetworzonych dokumentów w formacie Złożone dokumenty Sekcja. Ta sekcja jest okresowo aktualizowana i można ją ręcznie odświeżyć, aby sprawdzić, czy przetwarzanie zostało zakończone. Każdy dokument jest przetwarzany indywidualnie, więc możesz wybrać dokument za pomocą Gotowy do pobrania status lub poczekaj na zakończenie przetwarzania wszystkich dokumentów, aby pobrać wyniki. Dane wyjściowe przetworzonych dokumentów pozostaną dostępne do pobrania do 7 dni, po czym wygasną. Dokumenty, których ważność wygasła, zostaną usunięte z Złożone dokumenty sekcji po 7 dodatkowych dniach (14 dni od daty przetworzenia). Sugerujemy pobranie i zachowanie wyników w ciągu 7 dni.
Wnioski
W tym poście ogłosiliśmy nową funkcję Amazon Texttract Bulk Document Uploader, która umożliwia szybkie przetwarzanie dużej liczby dokumentów do celów oceny. Możesz użyć tej funkcji do oceny Amazon Texttract pod kątem z góry określonego przypadku użycia z twoimi dokumentami. Aby dowiedzieć się więcej o tym, jak możesz wykorzystać Amazon Texttract w swoim inteligentnym przetwarzaniu dokumentów, odwiedź stronę Funkcje Amazon Text i Pierwsze kroki z Amazon Text.
O autorach
Szaszwat Sapre jest starszym kierownikiem technicznym produktu w zespole Amazon Texttract. Koncentruje się na budowaniu usług opartych na uczeniu maszynowym dla klientów AWS. W wolnym czasie lubi czytać o nowych technologiach, podróżować i poznawać różne kuchnie.
Anjana Biswasa jest starszym architektem rozwiązań usług AI ze szczególnym uwzględnieniem AI/ML i analizy danych. Anjan jest częścią ogólnoświatowego zespołu usług AI i współpracuje z klientami, pomagając im zrozumieć i opracować rozwiązania problemów biznesowych związanych ze sztuczną inteligencją i uczeniem się. Anjan ma ponad 14-letnie doświadczenie w pracy z globalnymi organizacjami zajmującymi się łańcuchem dostaw, produkcją i sprzedażą detaliczną oraz aktywnie pomaga klientom rozpocząć i skalować usługi AWS AI.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoAiStream. Analiza danych Web3. Wiedza wzmocniona. Dostęp tutaj.
- Wybijanie przyszłości w Adryenn Ashley. Dostęp tutaj.
- Kupuj i sprzedawaj akcje spółek PRE-IPO z PREIPO®. Dostęp tutaj.
- Źródło: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :ma
- :Jest
- :Gdzie
- $W GÓRĘ
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- O nas
- dostęp
- Konto
- Działania
- aktywnie
- Dodatkowy
- do tego
- Po
- ponownie
- przed
- AI
- Usługi AI
- AI / ML
- Wszystkie kategorie
- pozwala
- również
- Amazonka
- Ekstrakt z amazonki
- Amazon Web Services
- an
- analiza
- analityka
- i
- ogłosił
- każdy
- api
- Pszczoła
- stosowany
- SĄ
- sztuczny
- AS
- At
- automatycznie
- dostępny
- AWS
- BE
- Pudełko
- Budowanie
- biznes
- by
- CAN
- możliwości
- walizka
- Etui
- łańcuch
- Opłaty
- Dodaj
- Wybierając
- kod
- porównanie
- kompletny
- komputer
- pewność siebie
- Konsola
- skonstruować
- zawiera
- Stwórz
- stworzony
- Obecnie
- Klientów
- dane
- Analityka danych
- Data
- Dni
- Demos
- W zależności
- życzenia
- rozwijać
- różne
- bezpośrednio
- wyświetlanie
- dokument
- dokumenty
- pobieranie
- każdy
- z łatwością
- łatwo
- wydajny
- bądź
- Umożliwia
- wzmocnione
- zapewnić
- Eter (ETH)
- oceniać
- ewaluację
- Przede wszystkim system został opracowany
- doświadczenie
- Exploring
- zewnętrzny
- Wyciągi
- Cecha
- Korzyści
- filet
- Akta
- i terminów, a
- Skupiać
- koncentruje
- następujący
- W razie zamówieenia projektu
- format
- formularze
- od
- otrzymać
- Globalne
- Have
- he
- pomoc
- pomoc
- pasemka
- jego
- W jaki sposób
- How To
- HTML
- http
- HTTPS
- czytelne dla człowieka
- if
- obraz
- zdjęcia
- importować
- ważny
- nałożone
- in
- Indywidualnie
- Informacja
- początkowy
- zamiast
- Inteligentny
- Inteligentne przetwarzanie dokumentów
- zamierzony
- wprowadzenie
- intuicyjny
- IT
- jpg
- json
- Trzymać
- duży
- większe
- później
- uruchomiona
- UCZYĆ SIĘ
- nauka
- LIMIT
- Limity
- lokalizacja
- maszyna
- uczenie maszynowe
- robić
- WYKONUJE
- kierownik
- ręcznie
- produkcja
- wiele
- maksymalny
- Może..
- nic
- ML
- jeszcze
- bardziej wydajny
- wielokrotność
- musi
- Nawigacja
- Potrzebować
- potrzeba
- Nowości
- Nowe technologie
- numer
- OCR
- of
- nieaktywny
- on
- pewnego razu
- ONE
- tylko
- operacje
- Option
- Opcje
- or
- organizacji
- wydajność
- koniec
- własny
- strona
- chleb
- część
- ścieżka
- wykonuje
- okres
- uprawnienia
- plato
- Analiza danych Platona
- PlatoDane
- Post
- praktyki
- konserwowanie
- wycena
- problemy
- wygląda tak
- procesów
- przetwarzanie
- Produkt
- product manager
- programowy
- zapewniać
- pod warunkiem,
- zapewnia
- cele
- zapytania
- Szybki
- szybko
- Czytający
- region
- regularny
- polegać
- pozostawać
- Raporty
- zażądać
- odpowiedź
- Efekt
- detaliczny
- przeglądu
- taki sam
- Skala
- druga
- Sekcja
- widzieć
- wybrany
- wybierając
- senior
- wysłany
- oddzielny
- usługa
- Usługi
- zestaw
- powinien
- Podpisy
- Prosty
- jednocześnie
- Rozmiar
- So
- Rozwiązania
- Źródło
- określony
- standard
- rozpoczęty
- Rynek
- Cel
- przechowywanie
- przedmiot
- Zatwierdź
- kolejny
- taki
- sugerować
- Dostawa
- łańcuch dostaw
- Utrzymany
- podpory
- zespół
- Techniczny
- Technologies
- test
- niż
- że
- Połączenia
- Źródło
- Im
- następnie
- w związku z tym
- one
- to
- Przez
- czas
- do
- narzędzia
- Tps
- śledzić
- transakcje
- Podróżowanie
- drugiej
- ui
- dla
- zrozumieć
- w odróżnieniu
- Nowości
- przesłanych
- Uploading
- URL
- Stosowanie
- posługiwać się
- przypadek użycia
- używany
- za pomocą
- przez
- widoczny
- Odwiedzić
- wyobrażanie sobie
- czekać
- chcieć
- we
- sieć
- usługi internetowe
- DOBRZE
- jeśli chodzi o komunikację i motywację
- który
- będzie
- w
- w ciągu
- bez
- pracujący
- działa
- napisać
- pisanie
- lat
- ty
- Twój
- zefirnet
- Zamek błyskawiczny