Amazon Metin Yazısı herhangi bir belge veya görüntüden metni, el yazısını ve verileri otomatik olarak çıkaran bir makine öğrenimi (ML) hizmetidir. Amazon Textract'ın yeteneklerini değerlendirmeyi kolaylaştırmak için Amazon Textract konsolunda herhangi bir kod yazmadan kendi belge kümenizi hızlı bir şekilde işlemenizi sağlayan yeni bir Toplu Belge Yükleyici özelliğini kullanıma sunduk.
Bu gönderide, Amazon Textract'ın belgelerinizde nasıl performans gösterdiğini değerlendirmek için Amazon Textract Bulk Document Uploader'ı ne zaman ve nasıl kullanacağınızı açıklıyoruz.
Çözüme genel bakış
Önceden belirlenmiş kullanım durumları için Amazon Textract'ın hızlı bir şekilde değerlendirilmesi için Toplu Belge Yükleyici kullanılmalıdır. Sezgisel bir kullanıcı arayüzü aracılığıyla aynı anda birden fazla belge yükleyerek, Amazon Textract'ın belgelerinizde ne kadar iyi performans gösterdiğini kolayca ölçebilirsiniz.
Tek seferde 150 adede kadar belge yükleyebilir ve işleyebilirsiniz. Belge sayısına, belge boyutuna ve izin verilen maksimum sayfa sayısına yapay sınırlar getiren mevcut Amazon Textract konsol demolarının aksine, Toplu Belge Yükleyici istek başına 150'ye kadar belgenin işlenmesini destekler ve aynı belge boyutuna ve sayfa sınırlarına sahiptir. Amazon Textract API'leri. Bu, daha büyük bir belge setini değerlendirmenizi daha verimli hale getirir.
Toplu Belge Yükleyici, standart bir Amazon Textract JSON yanıtı ve CSV dosyası çıkarır. Sonuçlar, kolay programatik analiz için JSON formatında sağlanır. Ek olarak, ayıklanan bilgilerin basit bir şekilde karşılaştırılması ve değerlendirilmesi için güven puanlarına sahip, insanlar tarafından okunabilir bir CSV dosyası sağlanır.
Bu özelliği kullanırken aşağıdakileri aklınızda bulundurun:
- Toplu Belge Yükleyici, belgeleri şu yollarla işler: asenkron işlemler. İşlemenin durumunu Amazon Textract konsolunda takip edebilirsiniz. Sadece DetectDocumentMetin (OCR), Analiz etBelge (Tablolar, Sorgular, Formlar ve İmzalar) ve Analiz Gider API'ler şu anda desteklenmektedir.
- Toplu Belge Yükleyici, API işlemlerinin JSON sonuçlarını ve biçimlendirilmiş CSV raporlarını sağlar. JSON sonuçlarını kullanarak belgede sınırlayıcı kutu vurgulamalarını görüntülemek gibi, verilerin görselleştirilmesi için harici araçlara güvenmeniz gerekebilir.
- Belgeleri işlemek için bu özelliğin kullanılması, normal Amazon Textract kullanımıyla aynı ücretlere tabidir (hangi özelliğin kullanıldığına bağlı olarak) ve API'ler için hesap ve Bölge için belirlenen TPS (saniye başına işlem sayısı) sınırlarına tabidir. Fiyatlandırma hakkında daha fazla bilgi için bkz. Amazon Textract fiyatlandırması. Amazon Textract sınırları hakkında daha fazla bilgi edinmek için bkz. Amazon Textract'taki kotalar.
- Toplu yükleyici için kabul edilen dosya biçimleri JPEG, PNG, TIF ve PDF'dir. PDF'ler içindeki JPEG 2000 kodlu görüntüler de desteklenir. JPEG ve PNG dosyalarının 10 MB boyut sınırı vardır, PDF ve TIF dosyalarının ise 500 MB boyut sınırı vardır. Çok sayfalı PDF ve TIF dosyalarının 3,000 sayfa sınırı vardır.
Toplu Belge Yükleyiciyi Kullanın
Toplu Belge Yükleyici, Amazon Textract'ın herhangi bir kod yazmaya gerek kalmadan kendi belgeleriniz üzerinde nasıl performans gösterdiğini hızlı bir şekilde değerlendirmenize yardımcı olmayı amaçlamaktadır. Belgeleri tek tek yüklemek ve işlemek yerine Toplu Belge Yükleyiciyi 150 adede kadar belgeyi işlemek için kullanabilirsiniz. Dokümanları doğrudan bilgisayarınızdan toplu olarak yükleyebilir veya mevcut bir bilgisayardan dokümanları içe aktarabilirsiniz. Amazon Basit Depolama Hizmeti (Amazon S3) kovası.
Toplu Belge Yükleyici, daha sonra çevrimdışı inceleme için indirebileceğiniz sonuçlar sağlar. İndirilebilir her ZIP dosyası, JSON dosya biçimindeki Amazon Textract API yanıtını ve ayıklanan verileri ve güven puanlarını içeren çıktının insanlar tarafından okunabilen bir CSV dosyasını içerir. Çıktı sonuçları, işlendikten sonra 7 gün boyunca indirilebilir. 14 gün sonra, belgeler bankadan silinir. Gönderilen belgeler bölüm. Toplu Belge Yükleyiciyi kullanmak için aşağıdaki adımları tamamlayın:
- Amazon Textract konsolunda, altında Demolar gezinme bölmesinde öğesini seçin. Toplu Belge Yükleyici.
- Klinik Belgeleri yükleyin.
- Belgelerinizin kaynağını belirtin.
Belgeleri yüklemek için iki seçeneğiniz vardır:
- Belgeleri S3 grubundan içe aktarın – Belgeleriniz için bir S3 grubu kullanıyorsanız, klasör URL'sini ve (isteğe bağlı olarak) belgelerinizin bulunduğu ön eki
s3://your-bucket/prefix/
biçim. Alternatif olarak, seçin S3'e göz atın Belgelerinizin istediğiniz konumuna göz atmak ve seçmek için. Belirttiğiniz Amazon S3 konumu 150'den fazla belge içeriyorsa yalnızca ilk 150 belge işlenmek üzere Amazon Textract'a gönderilir. - Belgeleri bilgisayarınızdan yükleyin – Bilgisayarınızdan belge yüklüyorsanız, seçerek bir seferde en fazla 50 belge yükleyebilirsiniz. Belgeleri Yükle. Ek belgeler yüklemek için (maksimum 150'ye kadar), seçin belgeleri ekleyin ilk belgeleriniz yüklendikten sonra.
Bu durumda, belgeleriniz önce hesabınızda sizin adınıza oluşturulmuş bir S3 klasörüne yüklenir, bu nedenle belgelere erişme ve Amazon S3'e yükleme izinleriniz olduğundan emin olmanız önemlidir. Bu tek seferlik bir işlemdir ve bilgisayarınızdan sonraki tüm yüklemeler için aynı grup kullanılacaktır. Aynı belge grubunu karşıya yüklemek ve işlemek istiyorsanız, bu S3 klasörüne giden yolu kullanabilirsiniz. Belgeleri S3 grubundan içe aktarın seçenek. Sizin adınıza oluşturulan S3 grubu, grup oluşturulduktan sonra görünür olacaktır.
- Ardından, belgelerinizi işlemek için kullanmak istediğiniz Amazon Textract özelliğini belirtin.
Belgelerinizi işlemek için her seferinde yalnızca bir özellik seçebilirsiniz. Ek özellikleri değerlendirmeniz gerekiyorsa, istediğiniz özelliği seçip belgeleri tekrar yükleyerek ayrı bir talep oluşturmalısınız. Eğer AnalyzeDocument – Sorgular özelliği seçildiğinde, belgelerinize karşı test etmek istediğiniz sorguları sağlamanız gerekir. Bir seferde en fazla 30 sorgu belirtebilirsiniz. Yüklenen belgeler çok sayfalı (PDF veya TIF) dosyalar içeriyorsa, sorgular her belgenin yalnızca ilk sayfasına uygulanır. bakın Sorgular için En İyi Uygulamalar sorguların nasıl oluşturulacağını öğrenmek için.
- Klinik İşleme başla belgeleri işlenmek üzere Amazon Textract'a göndermek için.
Belge durumunu takip edebilir ve işlenen belgelerin çıktı sonuçlarını indirebilirsiniz. Gönderilen belgeler bölüm. Bu bölüm periyodik olarak güncellenir ve işlemin tamamlanıp tamamlanmadığını görmek için manuel olarak yenileyebilirsiniz. Her belge ayrı ayrı işlenir, böylece belgeyi İndirmeye hazır durum veya sonuçları indirmek için tüm belgelerin işlenmesini tamamlamasını bekleyin. İşlenen belgelerin çıktısı, indirilmek üzere 7 güne kadar açık kalacak ve bu sürenin sonunda sona erecektir. Süresi dolmuş belgeler sistemden silinecektir. Gönderilen belgeler 7 gün sonra (işlenen tarihten itibaren 14 gün). Çıktıları 7 günlük süre içinde indirmenizi ve saklamanızı öneririz.
Sonuç
Bu gönderide, çok sayıda belgeyi değerlendirme amacıyla hızlı bir şekilde işlemenizi sağlayan yeni Amazon Textract Toplu Belge Yükleyici özelliğini duyurduk. Belgelerinizle önceden belirlenmiş bir kullanım durumu için Amazon Textract'ı değerlendirmek üzere bu özelliği kullanabilirsiniz. Akıllı belge işleme iş yükünüz için Amazon Textract'ı nasıl kullanabileceğiniz hakkında daha fazla bilgi edinmek için şu adresi ziyaret edin: Amazon Textract özellikleri ve Amazon Textract'ı kullanmaya başlama.
Yazarlar Hakkında
Şaşvat Sapre Amazon Textract ekibinde Kıdemli Teknik Ürün Müdürüdür. AWS müşterileri için makine öğrenimi tabanlı hizmetler oluşturmaya odaklanmıştır. Boş zamanlarında yeni teknolojiler hakkında okumayı, seyahat etmeyi ve farklı mutfakları keşfetmeyi sever.
Anjan Biswas AI/ML ve Veri Analitiğine odaklanan bir Kıdemli AI Hizmetleri Çözümleri Mimarıdır. Anjan, dünya çapındaki AI hizmetleri ekibinin bir parçasıdır ve AI ve ML ile iş sorunlarını anlamalarına ve bunlara çözümler geliştirmelerine yardımcı olmak için müşterilerle birlikte çalışır. Anjan, küresel tedarik zinciri, üretim ve perakende kuruluşlarıyla çalışma konusunda 14 yılı aşkın deneyime sahiptir ve müşterilerin AWS AI hizmetlerini kullanmaya başlamasına ve bunları ölçeklendirmesine aktif olarak yardımcı olmaktadır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoAiStream. Web3 Veri Zekası. Bilgi Genişletildi. Buradan Erişin.
- Adryenn Ashley ile Geleceği Basmak. Buradan Erişin.
- PREIPO® ile PRE-IPO Şirketlerinde Hisse Al ve Sat. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :vardır
- :dır-dir
- :Neresi
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- Hakkımızda
- erişim
- Hesap
- Action
- aktif
- Ek
- Ayrıca
- Sonra
- tekrar
- karşı
- AI
- AI hizmetleri
- AI / ML
- Türkiye
- veriyor
- Ayrıca
- Amazon
- Amazon Metin Yazısı
- Amazon Web Servisleri
- an
- analiz
- analytics
- ve
- açıkladı
- herhangi
- api
- API'ler
- uygulamalı
- ARE
- yapay
- AS
- At
- otomatik olarak
- mevcut
- AWS
- BE
- kutu
- bina
- iş
- by
- CAN
- yetenekleri
- dava
- durumlarda
- zincir
- yükler
- Klinik
- seçme
- kod
- karşılaştırma
- tamamlamak
- bilgisayar
- güven
- konsolos
- kurmak
- içeren
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Şu anda
- Müşteriler
- veri
- Veri Analizi
- Tarih
- Günler
- Demolar
- bağlı
- İstediğiniz
- geliştirmek
- farklı
- direkt olarak
- sergileyen
- belge
- evraklar
- indir
- her
- kolayca
- kolay
- verimli
- ya
- sağlar
- gelişmiş
- sağlamak
- Eter (ETH)
- değerlendirmek
- değerlendirme
- mevcut
- deneyim
- Keşfetmek
- dış
- Hulasa
- Özellikler(Hazırlık aşamasında)
- Özellikler
- fileto
- dosyalar
- Ad
- odak
- odaklanmış
- takip etme
- İçin
- biçim
- formlar
- itibaren
- almak
- Küresel
- Var
- he
- yardım et
- yardım
- özeti
- onun
- Ne kadar
- Nasıl Yapılır
- HTML
- http
- HTTPS
- insan tarafından okunabilir
- if
- görüntü
- görüntüleri
- ithalat
- önemli
- yüklemek
- in
- Bireysel olarak
- bilgi
- ilk
- yerine
- Akıllı
- Akıllı belge işleme
- yönelik
- tanıtım
- sezgisel
- IT
- jpg
- json
- tutmak
- büyük
- büyük
- sonra
- başlattı
- ÖĞRENİN
- öğrenme
- LİMİT
- sınırları
- yer
- makine
- makine öğrenme
- yapmak
- YAPAR
- müdür
- el ile
- üretim
- çok
- maksimum
- Mayıs..
- akla
- ML
- Daha
- daha verimli
- çoklu
- şart
- Navigasyon
- gerek
- gerek
- yeni
- Yeni teknolojiler
- numara
- OCR
- of
- çevrimdışı
- on
- bir Zamanlar
- ONE
- bir tek
- Operasyon
- seçenek
- Opsiyonlar
- or
- organizasyonlar
- çıktı
- tekrar
- kendi
- Kanal
- bölmesi
- Bölüm
- yol
- gerçekleştirir
- dönem
- izinleri
- Platon
- Plato Veri Zekası
- PlatoVeri
- Çivi
- uygulamalar
- korunması
- fiyatlandırma
- sorunlar
- süreç
- Süreçler
- işleme
- PLATFORM
- ürün müdürü
- program niteliğinde
- sağlamak
- sağlanan
- sağlar
- amaçlı
- sorgular
- Hızlı
- hızla
- Okuma
- bölge
- düzenli
- güvenmek
- kalmak
- Raporlar
- talep
- yanıt
- Sonuçlar
- perakende
- yorum
- aynı
- ölçek
- İkinci
- Bölüm
- görmek
- seçilmiş
- seçme
- kıdemli
- gönderdi
- ayrı
- hizmet
- Hizmetler
- set
- meli
- İmzalar
- Basit
- aynı anda
- beden
- So
- Çözümler
- Kaynak
- Belirtilen
- standart
- başladı
- Durum
- Basamaklar
- hafızası
- konu
- sunmak
- sonraki
- böyle
- önermek
- arz
- tedarik zinciri
- destekli
- Destekler
- takım
- Teknik
- Teknolojileri
- test
- göre
- o
- The
- Kaynak
- Onları
- sonra
- bu nedenle
- onlar
- Re-Tweet
- İçinden
- zaman
- için
- araçlar
- tps
- iz
- işlemler
- Seyahat
- iki
- ui
- altında
- anlamak
- aksine
- Güncellemeler
- Yüklenen
- Yükleme
- URL
- kullanım
- kullanım
- kullanım durumu
- Kullanılmış
- kullanma
- üzerinden
- gözle görülür
- Türkiye Dental Sosyal Medya Hesaplarından bizi takip edebilirsiniz.
- görüntüleme
- beklemek
- istemek
- we
- ağ
- web hizmetleri
- İYİ
- ne zaman
- hangi
- irade
- ile
- içinde
- olmadan
- çalışma
- çalışır
- yazmak
- yazı yazıyor
- yıl
- sen
- zefirnet
- zip