Nutzen Sie maschinelles Lernen, ohne eine einzige Codezeile zu schreiben mit Amazon SageMaker Canvas | Amazon Web Services

Nutzen Sie maschinelles Lernen, ohne eine einzige Codezeile zu schreiben mit Amazon SageMaker Canvas | Amazon Web Services

Quellknoten: 2378856

In der jüngeren Vergangenheit erforderte der Einsatz von maschinellem Lernen (ML) zur Erstellung von Vorhersagen, insbesondere für Daten in Form von Text und Bildern, umfangreiche ML-Kenntnisse zur Erstellung und Optimierung von Deep-Learning-Modellen. Heutzutage ist ML für jeden Benutzer zugänglicher geworden, der ML-Modelle zur Generierung von Geschäftswert nutzen möchte. Mit Amazon SageMaker-Leinwandkönnen Sie Vorhersagen für eine Reihe verschiedener Datentypen erstellen, die über reine Tabellen- oder Zeitreihendaten hinausgehen, ohne eine einzige Codezeile schreiben zu müssen. Zu diesen Funktionen gehören vorab trainierte Modelle für Bild-, Text- und Dokumentdatentypen.

In diesem Beitrag diskutieren wir, wie Sie vorab trainierte Modelle verwenden können, um Vorhersagen für unterstützte Datentypen über tabellarische Daten hinaus abzurufen.

Textdaten

SageMaker Canvas bietet eine visuelle Umgebung ohne Code zum Erstellen, Trainieren und Bereitstellen von ML-Modellen. Für NLP-Aufgaben (Natural Language Processing) lässt sich SageMaker Canvas nahtlos integrieren Amazon verstehen damit Sie wichtige NLP-Funktionen wie Spracherkennung, Entitätserkennung, Stimmungsanalyse, Themenmodellierung und mehr ausführen können. Durch die Integration ist keine Codierung oder Datentechnik mehr erforderlich, um die robusten NLP-Modelle von Amazon Comprehend zu verwenden. Sie geben einfach Ihre Textdaten ein und wählen aus vier häufig verwendeten Funktionen aus: Stimmungsanalyse, Spracherkennung, Entitätsextraktion und Erkennung persönlicher Informationen. Für jedes Szenario können Sie die Benutzeroberfläche zum Testen und Verwenden der Batch-Vorhersage verwenden, um die darin gespeicherten Daten auszuwählen Amazon Simple Storage-Service (Amazon S3).

Analysieren von Textdaten auf SageMaker Canvas

Stimmungsanalyse

Mit der Stimmungsanalyse ermöglicht Ihnen SageMaker Canvas, die Stimmung Ihres Eingabetextes zu analysieren. Es kann bestimmen, ob die Gesamtstimmung positiv, negativ, gemischt oder neutral ist, wie im folgenden Screenshot dargestellt. Dies ist in Situationen wie der Analyse von Produktbewertungen nützlich. Zum Beispiel der Text „Ich liebe dieses Produkt, es ist großartig!“ würde von SageMaker Canvas als positiv eingestuft, während „Dieses Produkt ist schrecklich, ich bereue den Kauf“ als negative Stimmung eingestuft würde.

Stimmungsanalyse auf SageMaker Canvas

Extraktion von Entitäten

SageMaker Canvas kann Text analysieren und darin erwähnte Entitäten automatisch erkennen. Wenn ein Dokument zur Analyse an SageMaker Canvas gesendet wird, werden Personen, Organisationen, Orte, Daten, Mengen und andere Entitäten im Text identifiziert. Mit dieser Entitätsextraktionsfunktion können Sie schnell Einblicke in die wichtigsten Personen, Orte und Details gewinnen, die in Dokumenten besprochen werden. Eine Liste der unterstützten Entitäten finden Sie unter Entities.

Entites-Extraktion auf SageMaker Canvas

Spracherkennung

SageMaker Canvas kann mit Amazon Comprehend auch die vorherrschende Textsprache bestimmen. Es analysiert Text, um die Hauptsprache zu identifizieren, und liefert Konfidenzwerte für die erkannte dominante Sprache, zeigt jedoch keine prozentuale Aufschlüsselung für mehrsprachige Dokumente an. Um bei langen Dokumenten in mehreren Sprachen die besten Ergebnisse zu erzielen, teilen Sie den Text in kleinere Teile auf und aggregieren Sie die Ergebnisse, um den Sprachanteil zu schätzen. Am besten funktioniert es mit mindestens 20 Zeichen Text.

Spracherkennung auf SageMaker Canvas

Erkennung personenbezogener Daten

Sie können sensible Daten auch durch die Erkennung persönlicher Informationen mit SageMaker Canvas schützen. Es kann Textdokumente analysieren, um automatisch personenbezogene Daten (PII) zu erkennen, sodass Sie vertrauliche Daten wie Namen, Adressen, Geburtsdaten, Telefonnummern, E-Mail-Adressen und mehr finden können. Es analysiert Dokumente bis zu 100 KB und stellt für jede erkannte Entität einen Konfidenzwert bereit, sodass Sie die vertraulichsten Informationen überprüfen und selektiv schwärzen können. Eine Liste der erkannten Entitäten finden Sie unter Erkennen von PII-Entitäten.

PII-Erkennung auf SageMaker Canvas

Bilddaten

SageMaker Canvas bietet eine visuelle Schnittstelle ohne Code, die es Ihnen durch die Integration mit einfach macht, Computer-Vision-Funktionen zu nutzen Amazon-Anerkennung zur Bildanalyse. Sie können beispielsweise einen Datensatz mit Bildern hochladen, Amazon Rekognition zur Erkennung von Objekten und Szenen verwenden und eine Texterkennung durchführen, um eine Vielzahl von Anwendungsfällen abzudecken. Die visuelle Schnittstelle und die Integration von Amazon Rekognition ermöglichen es auch Nicht-Entwicklern, fortschrittliche Computer-Vision-Techniken zu nutzen.

Bilddaten auf SageMaker Canvas analysieren

Objekterkennung in Bildern

SageMaker Canvas verwendet Amazon Rekognition, um Beschriftungen (Objekte) in einem Bild zu erkennen. Sie können das Bild über die SageMaker Canvas-Benutzeroberfläche hochladen oder das verwenden Chargenvorhersage Klicken Sie auf die Registerkarte, um in einem S3-Bucket gespeicherte Bilder auszuwählen. Wie im folgenden Beispiel gezeigt, können Objekte im Bild wie Glockenturm, Bus, Gebäude usw. extrahiert werden. Über die Schnittstelle können Sie die Vorhersageergebnisse durchsuchen und sortieren.

Objekterkennung in Bildern auf SageMaker Canvas

Texterkennung in Bildern

Das Extrahieren von Text aus Bildern ist ein sehr häufiger Anwendungsfall. Jetzt können Sie diese Aufgabe ganz einfach und ohne Code auf SageMaker Canvas ausführen. Der Text wird als Einzelposten extrahiert, wie im folgenden Screenshot gezeigt. Kurze Phrasen im Bild werden zusammengefasst und als Phrase identifiziert.

Texterkennung in Bildern auf SageMaker Canvas

Sie können Stapelvorhersagen durchführen, indem Sie eine Reihe von Bildern hochladen, alle Bilder in einem einzigen Stapelauftrag extrahieren und die Ergebnisse als CSV-Datei herunterladen. Diese Lösung ist nützlich, wenn Sie Text in Bildern extrahieren und erkennen möchten.

Dokumentdaten

SageMaker Canvas bietet eine Vielzahl gebrauchsfertiger Lösungen, die Ihre täglichen Anforderungen an das Verständnis von Dokumenten erfüllen. Diese Lösungen werden unterstützt von Amazontext. Um alle verfügbaren Optionen für Dokumente anzuzeigen, wählen Sie „ Gebrauchsfertige Modelle im Navigationsbereich und filtern Sie nach Dokumente, wie im folgenden Screenshot gezeigt.

Analysieren von Dokumentdaten auf SageMaker Canvas

Dokumentenanalyse

Die Dokumentenanalyse analysiert Dokumente und Formulare auf Beziehungen zwischen erkanntem Text. Die Vorgänge geben vier Kategorien der Dokumentextraktion zurück: Rohtext, Formulare, Tabellen und Signaturen. Die Fähigkeit der Lösung, die Dokumentstruktur zu verstehen, gibt Ihnen zusätzliche Flexibilität bei der Art der Daten, die Sie aus den Dokumenten extrahieren möchten. Der folgende Screenshot ist ein Beispiel dafür, wie die Tabellenerkennung aussieht.

Dokumentenanalyse auf SageMaker Canvas

Diese Lösung ist in der Lage, Layouts komplexer Dokumente zu verstehen, was hilfreich ist, wenn Sie bestimmte Informationen aus Ihren Dokumenten extrahieren müssen.

Analyse von Identitätsdokumenten

Diese Lösung dient der Analyse von Dokumenten wie Personalausweisen, Führerscheinen oder anderen ähnlichen Identifikationsformen. Für jedes Ausweisdokument werden Informationen wie zweiter Vorname, Landkreis und Geburtsort sowie der individuelle Konfidenzwert für die Genauigkeit zurückgegeben, wie im folgenden Screenshot dargestellt.

Analyse von Identitätsdokumenten auf SageMaker Canvas

Es besteht die Möglichkeit, eine Batch-Vorhersage durchzuführen, mit der Sie Sätze von Ausweisdokumenten in großen Mengen hochladen und als Batch-Auftrag verarbeiten können. Dies bietet eine schnelle und nahtlose Möglichkeit, Ausweisdokumentdetails in Schlüssel-Wert-Paare umzuwandeln, die für nachgelagerte Prozesse wie die Datenanalyse verwendet werden können.

Kostenanalyse

Die Spesenanalyse dient der Analyse von Spesendokumenten wie Rechnungen und Quittungen. Der folgende Screenshot ist ein Beispiel dafür, wie die extrahierten Informationen aussehen.

Spesenanalyse auf SageMaker Canvas

Die Ergebnisse werden als Zusammenfassungsfelder und Einzelpostenfelder zurückgegeben. Zusammenfassungsfelder sind aus dem Dokument extrahierte Schlüssel-Wert-Paare und enthalten Schlüssel wie Gesamtsumme, Geburtstermin und Steuer. Einzelpostenfelder beziehen sich auf Daten, die im Dokument als Tabelle strukturiert sind. Dies ist nützlich, um Informationen aus dem Dokument zu extrahieren und gleichzeitig das Layout beizubehalten.

Dokumentabfragen

Mit Dokumentenabfragen können Sie Fragen zu Ihren Dokumenten stellen. Dies ist eine großartige Lösung, wenn Sie über mehrseitige Dokumente verfügen und sehr spezifische Antworten aus Ihren Dokumenten extrahieren möchten. Im Folgenden finden Sie ein Beispiel für die Arten von Fragen, die Sie stellen können, und wie die extrahierten Antworten aussehen.

Dokumentabfragen auf SageMaker Canvas

Die Lösung bietet eine unkomplizierte Schnittstelle für die Interaktion mit Ihren Dokumenten. Dies ist hilfreich, wenn Sie in großen Dokumenten bestimmte Details abrufen möchten.

Zusammenfassung

SageMaker Canvas bietet eine No-Code-Umgebung für die einfache Verwendung von ML für verschiedene Datentypen wie Text, Bilder und Dokumente. Die visuelle Schnittstelle und die Integration mit AWS-Diensten wie Amazon Comprehend, Amazon Rekognition und Amazon Textract machen Codierung und Datentechnik überflüssig. Sie können Text auf Stimmung, Entitäten, Sprachen und PII analysieren. Bei Bildern ermöglicht die Objekt- und Texterkennung Anwendungsfälle für Computer Vision. Schließlich kann die Dokumentenanalyse Text extrahieren und gleichzeitig sein Layout für nachgelagerte Prozesse beibehalten. Mit den gebrauchsfertigen Lösungen in SageMaker Canvas können Sie fortschrittliche ML-Techniken nutzen, um Erkenntnisse aus strukturierten und unstrukturierten Daten zu gewinnen. Wenn Sie daran interessiert sind, No-Code-Tools mit gebrauchsfertigen ML-Modellen zu verwenden, testen Sie SageMaker Canvas noch heute. Weitere Informationen finden Sie unter Erste Schritte mit der Verwendung von Amazon SageMaker Canvas.


Über die Autoren

Julia Ang ist ein Lösungsarchitekt mit Sitz in Singapur. Sie hat mit Kunden in einer Reihe von Bereichen zusammengearbeitet, vom Gesundheitswesen und dem öffentlichen Sektor bis hin zu Digital-Native-Unternehmen, um Lösungen entsprechend ihrer Geschäftsanforderungen einzuführen. Sie hat auch Kunden in Südostasien und darüber hinaus dabei unterstützt, KI und ML in ihren Unternehmen einzusetzen. Außerhalb der Arbeit lernt sie gerne die Welt kennen, indem sie reist und sich kreativ betätigt.

Loke Jun Kai ist ein spezialisierter Lösungsarchitekt für KI/ML mit Sitz in Singapur. Er arbeitet mit Kunden in der gesamten ASEAN-Region zusammen, um maßstabsgetreue Lösungen für maschinelles Lernen in AWS zu entwickeln. Jun Kai ist ein Befürworter von Low-Code-No-Code-Tools für maschinelles Lernen. In seiner Freizeit ist er gerne in der Natur.

Zeitstempel:

Mehr von AWS Maschinelles Lernen