アマゾンテキストラック は、ドキュメントや画像からテキスト、手書き文字、データを自動的に抽出する機械学習 (ML) サービスです。 AnalyzeDocument Signatures は、あらゆるドキュメントの署名を自動的に検出する機能を提供する Amazon Textract 内の機能です。 これにより、人間によるレビュー、カスタム コード、または ML の経験の必要性を減らすことができます。
この投稿では、AnalyzeDocument Signatures 機能の利点と、AnalyzeDocument Signatures API がドキュメント内の署名の検出にどのように役立つかについて説明します。 また、Amazon Textract コンソールから機能を使用する方法についても説明し、API を使用して Amazon Textract レスポンスパーサーライブラリでレスポンスを処理するためのコード例を提供します。 最後に、この機能を使用するためのベスト プラクティスをいくつか紹介します。
署名機能の利点
保険、住宅ローン、法律、税務業界のお客様は、書類に署名が必要な規制やコンプライアンスの要件を順守しながら、膨大な量の紙ベースの書類を処理するという課題に直面しています。 申請の処理を開始する前に、エンド クライアントから提出された融資申請書や請求書などの特定のフォームに署名が含まれていることを確認する必要がある場合があります。 特定のドキュメント処理ワークフローでは、検証のために署名を抽出して比較するために、さらに一歩進める必要がある場合があります。
これまで、顧客は通常、ドキュメントを人間のレビュー担当者に転送して、署名を検出していました。 人間のレビュー担当者を使用して署名を検出するには、かなりの時間とリソースが必要になる傾向があります。 また、ドキュメント処理ワークフローの非効率性につながり、ターンアラウンド タイムが長くなり、エンド ユーザー エクスペリエンスが低下する可能性もあります。
AnalyzeDocument Signatures 機能を使用すると、ドキュメントの手書き署名、電子署名、イニシャルを自動的に検出できます。 これにより、コストと時間のかかる手動処理への依存を減らし、自動化されたスケーラブルなソリューションを構築できます。 この機能を使用してドキュメントが署名されているかどうかを確認できるだけでなく、検出された署名の場所の詳細を使用して、フォームの特定のフィールドが署名されているかどうかを検証することもできます。 位置情報を使用して、ドキュメント内の個人を特定できる情報 (PII) を編集することもできます。
AnalyzeDocument Signatures がドキュメント内の署名を検出する方法
AnalyzeDocument API には、フォーム、テーブル、クエリ、署名の XNUMX つの機能タイプがあります。 Amazon Textract がドキュメントを処理すると、結果は次の配列で返されます。 ブロック オブジェクト。 署名機能は、単独で使用することも、他の機能タイプと組み合わせて使用することもできます。 単独で使用すると、署名機能タイプは、検出された署名の場所と信頼スコア、およびドキュメントからの生のテキスト (単語と行) を含む JSON 応答を提供します。 署名機能をフォームやテーブルなどの他の機能タイプと組み合わせることで、有用な洞察を引き出すことができます。 この機能がフォームとテーブルで使用されている場合、応答は署名をキーと値のペアまたはテーブル セルの一部として示します。 たとえば、次のフォームの応答には、キーが次のように含まれています。 貸し手の署名 そして値として Block
オブジェクト。
Amazon Textract コンソールで署名機能を使用する方法
API とコードサンプルを始める前に、Amazon Textract コンソールを確認しましょう。 ドキュメントを Amazon Textract コンソールにアップロードしたら、[ 署名検出 セクションに ドキュメントの構成 セクションと選択 構成を適用する.
次のスクリーンショットは、 署名 Amazon Textract コンソールの Analyze Document API のタブ。
この機能は、署名を検出し、対応するページと信頼スコアとともに提示します。
コード例
署名機能を使用して、小切手、ローン申込書、請求書、給与明細、住宅ローンの書類、銀行取引明細書、リース契約、契約書など、さまざまな種類のドキュメントの署名を検出できます。 このセクションでは、これらのドキュメントのいくつかについて説明し、Signatures パラメーターを指定して AnalyzeDocument API を呼び出して署名を検出する方法を示します。
入力ドキュメントは、バイト配列形式または Amazon シンプル ストレージ サービス (Amazon S3) バケット。 バイト配列形式のドキュメントの場合、次を使用して画像バイトを Amazon Textract API オペレーションに送信できます。 bytes
財産。 機能タイプとしての署名は、同期ドキュメント処理用の AnalyzeDocument API と、ドキュメントの非同期処理用の StartDocumentAnalysis によってサポートされています。
次の例では、雇用証明書の署名を検出します。
次のサンプルPythonコードを使用します。
AnalyzeDocument API から取得した応答を分析してみましょう。 次の応答は、関連する部分のみを表示するようにトリミングされています。 応答には BlockType
of SIGNATURE
これは、信頼スコア、ブロックの ID、境界ボックスの詳細を示しています。
次のコードを使用して、ID と場所を表形式で出力します。
次のスクリーンショットは、結果を示しています。
詳細と完全なコードは、 GitHubレポ.
キー値形式の判読可能な署名を持つドキュメントの場合、 Textract 応答パーサー キーとそれらのキーに対応する値を検索して、署名フィールドのみを抽出します。
上記のコードは、次の結果を返します。
この方法で署名を転記するには、署名が判読可能でなければならないことに注意してください。
署名機能を使用するためのベスト プラクティス
この機能を使用する場合は、次のベスト プラクティスを考慮してください。
- リアルタイムの応答には、AnalyzeDocument API の同期操作を使用します。 バッチ処理など、リアルタイムでの応答を必要としないユース ケースでは、API の非同期操作を使用することをお勧めします。
- 署名機能は、ページに最大 XNUMX つの署名がある場合に最適に機能します。 ページに XNUMX つ以上の署名がある場合は、ページをセクションに分割し、各セクションを個別に API にフィードすることをお勧めします。
- スコアが必要なしきい値を満たしていない場合は、検出された署名で提供される信頼スコアを使用して、人間によるレビューのためにドキュメントをルーティングします。 信頼度スコアは精度の尺度ではなく、予測におけるモデルの信頼度の推定値です。 ユース ケースに最も適した信頼度スコアを選択する必要があります。
まとめ
この投稿では、Amazon Textract の署名機能の概要を説明し、給与明細、レンタル リース契約、契約書などのドキュメントの署名を自動的に検出しました。 AnalyzeDocument Signatures は、人間のレビュー担当者の必要性を減らし、コストを削減し、時間を節約し、ドキュメント処理のためのスケーラブルなソリューションを構築するのに役立ちます。
開始するには、Amazon Textract コンソールにログオンして機能を試してください。 Amazon Textract の機能の詳細については、以下を参照してください。 アマゾンテキストラック Amazon Textract開発者ガイドまたは Textract リソース.
著者について
マラン・チャンドラセカラン は、アマゾン ウェブ サービスのシニア ソリューション アーキテクトであり、企業顧客と協力しています。 仕事以外では、旅行とテキサス ヒル カントリーでバイクに乗るのが大好きです。
シビン・ミカエルラジ AWS Textract チームのシニアプロダクトマネージャーです。 彼は、AWS のお客様向けの AI/ML ベースの製品の構築に注力しています。
スプラカシュ・ダッタ アマゾン ウェブ サービスのシニア ソリューション アーキテクトです。 彼は、デジタル トランスフォーメーション戦略、アプリケーションのモダナイゼーションと移行、データ分析、機械学習に重点を置いています。 彼は AWS の AI/ML コミュニティの一員であり、インテリジェントなドキュメント処理ソリューションを設計しています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- a
- 能力
- 私たちについて
- 精度
- 後
- 協定
- AI / ML
- ことができます
- Amazon
- アマゾンテキストラック
- Amazon Webサービス
- 量
- 分析論
- 分析します
- &
- API
- 申し込み
- 配列
- 自動化
- 自動的に
- 利用できます
- AWS
- 銀行
- 利点
- BEST
- ベストプラクティス
- ブロック
- ブロック
- ボックス
- ビルド
- 建物
- コール
- 機能
- 場合
- 例
- 一定
- 挑戦する
- 小切手
- 選択する
- クレーム
- クライアント
- クライアント
- コード
- 組み合わせ
- 組み合わせた
- コミュニティ
- 比較します
- コンプリート
- コンプライアンス
- 信頼
- 領事
- 含まれています
- 契約
- 対応する
- コスト
- 国
- カスタム
- Customers
- データ
- データ分析
- デザイン
- 細部
- 検出された
- 検出
- Developer
- 異なります
- デジタル
- 話し合います
- ドキュメント
- ドキュメント
- ドント
- 各
- どちら
- エレクトロニック
- 雇用
- 確保
- Enterprise
- 企業顧客
- 推定
- エーテル(ETH)
- 例
- 例
- 体験
- エキス
- 抽出物
- 顔
- 特徴
- フィールド
- フィールズ
- 焦点を当て
- 焦点を当てて
- フォロー中
- フォーム
- 形式でアーカイブしたプロジェクトを保存します.
- フォーム
- から
- さらに
- 一般に
- 取得する
- Go
- グリッド
- 高さ
- 助けます
- ことができます
- 認定条件
- How To
- HTML
- HTTPS
- 巨大な
- 人間
- 画像
- 画像
- import
- in
- 含ま
- 産業
- 情報
- 洞察
- 保険
- インテリジェント-
- インテリジェントなドキュメント処理
- IT
- 自体
- JSON
- キー
- キー
- つながる
- LEARN
- 学習
- リーガルポリシー
- 貸手
- 手紙
- 図書館
- ライン
- ローン
- ローカル
- 位置して
- 場所
- より長いです
- 機械
- 機械学習
- 作る
- マネージャー
- マニュアル
- だけど
- 大会
- 移行
- ML
- 近代化
- 他には?
- モーゲージ
- 最も
- オートバイ
- 必要
- ノート
- オブジェクト
- オブジェクト
- オファー
- 操作
- 注文
- その他
- 外側
- 概要
- 紙ベース
- パラメーター
- 部
- 特定の
- 部品
- 通過
- 個人的に
- 敬虔な
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポリゴン
- 貧しいです
- ポスト
- プラクティス
- 予測
- プレゼント
- 印刷物
- プロセス
- ラボレーション
- 処理
- プロダクト
- プロダクトマネージャー
- 製品
- 財産
- 提供します
- 提供
- は、大阪で
- Python
- Raw
- リアル
- への
- 減らします
- 軽減
- レギュレータ
- 関連した
- 依存
- 必要とする
- の提出が必要です
- 要件
- リソース
- 応答
- 結果として
- 結果
- 収益
- レビュー
- リチャード
- Ride
- ルート
- Save
- ド電源のデ
- を検索
- 検索
- セクション
- セクション
- シニア
- センス
- 別々
- サービス
- サービス
- シェアする
- すべき
- 表示する
- 作品
- 署名
- 署名されました
- 重要
- 簡単な拡張で
- 溶液
- ソリューション
- 一部
- 特定の
- split
- start
- 開始
- 文
- 手順
- ストレージ利用料
- 戦略
- 提出する
- 提出された
- そのような
- サポート
- テーブル
- 税金
- チーム
- テキサス州
- ブロック
- 三
- しきい値
- 介して
- 時間
- 時間がかかる
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- top
- 変換
- 変革戦略
- 旅行
- TRP
- つかいます
- 使用事例
- 検証
- 値
- Verification
- 確認する
- ボリューム
- ウェブ
- Webサービス
- かどうか
- while
- 以内
- 言葉
- 仕事
- ワークフロー
- ワークフロー
- ワーキング
- 作品
- X
- あなたの
- ゼファーネット