What Are Graph Neural Networks (GNN)?

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Γραφήματα υπάρχουν παντού γύρω μας. Το κοινωνικό σας δίκτυο είναι ένα γράφημα ανθρώπων και σχέσεων. Το ίδιο και η οικογένειά σου. Οι δρόμοι που ακολουθείτε για να πάτε από το σημείο Α στο σημείο Β αποτελούν ένα γράφημα. Οι σύνδεσμοι που συνδέουν αυτήν την ιστοσελίδα με άλλες σχηματίζουν ένα γράφημα. Όταν ο εργοδότης σας πληρώνει, η πληρωμή σας περνά από ένα γράφημα χρηματοπιστωτικών ιδρυμάτων.

Βασικά, οτιδήποτε αποτελείται από συνδεδεμένες οντότητες μπορεί να αναπαρασταθεί ως γράφημα. Τα γραφήματα είναι εξαιρετικά εργαλεία για την οπτικοποίηση των σχέσεων μεταξύ ανθρώπων, αντικειμένων και εννοιών. Πέρα από την οπτικοποίηση πληροφοριών, ωστόσο, τα γραφήματα μπορούν επίσης να είναι καλές πηγές δεδομένων για την εκπαίδευση μοντέλων μηχανικής εκμάθησης για περίπλοκες εργασίες.

Τα νευρωνικά δίκτυα γραφημάτων (GNN) είναι ένας τύπος αλγόριθμου μηχανικής μάθησης που μπορεί να εξάγει σημαντικές πληροφορίες από γραφήματα και να κάνει χρήσιμες προβλέψεις. Με τα γραφήματα να γίνονται πιο διάχυτα και πλουσιότερα σε πληροφορίες και τα τεχνητά νευρωνικά δίκτυα να γίνονται πιο δημοφιλής και ικανός, τα GNN έχουν γίνει ένα ισχυρό εργαλείο για πολλές σημαντικές εφαρμογές.

Μετασχηματισμός γραφημάτων για επεξεργασία νευρωνικών δικτύων

Κάθε γράφημα αποτελείται από κόμβους και ακμές. Για παράδειγμα, σε ένα κοινωνικό δίκτυο, οι κόμβοι μπορούν να αντιπροσωπεύουν τους χρήστες και τα χαρακτηριστικά τους (π.χ. όνομα, φύλο, ηλικία, πόλη), ενώ οι ακμές μπορούν να αντιπροσωπεύουν τις σχέσεις μεταξύ των χρηστών. Ένα πιο περίπλοκο κοινωνικό γράφημα μπορεί να περιλαμβάνει άλλους τύπους κόμβων, όπως πόλεις, αθλητικές ομάδες, ειδησεογραφικά πρακτορεία, καθώς και άκρες που περιγράφουν τις σχέσεις μεταξύ των χρηστών και αυτών των κόμβων.

Δυστυχώς, η δομή του γραφήματος δεν είναι κατάλληλη για μηχανική εκμάθηση. Νευρωνικά δίκτυα αναμένουν να λαμβάνουν τα δεδομένα τους σε ενιαία μορφή. Τα πολυστρωματικά perceptron αναμένουν έναν σταθερό αριθμό χαρακτηριστικών εισόδου. Τα συνελικτικά νευρωνικά δίκτυα αναμένουν ένα πλέγμα που αντιπροσωπεύει τις διαφορετικές διαστάσεις των δεδομένων που επεξεργάζονται (π.χ. πλάτος, ύψος και έγχρωμα κανάλια εικόνων).

Τα γραφήματα μπορούν να έχουν διαφορετικές δομές και μεγέθη, κάτι που δεν συμμορφώνεται με τις ορθογώνιες συστοιχίες που αναμένουν τα νευρωνικά δίκτυα. Τα γραφήματα έχουν επίσης άλλα χαρακτηριστικά που τα κάνουν να διαφέρουν από τον τύπο πληροφοριών για τον οποίο έχουν σχεδιαστεί τα κλασικά νευρωνικά δίκτυα. Για παράδειγμα, τα γραφήματα είναι "αμετάβλητα μετάθεσης", πράγμα που σημαίνει ότι η αλλαγή της σειράς και της θέσης των κόμβων δεν κάνει διαφορά, εφόσον οι σχέσεις τους παραμένουν οι ίδιες. Αντίθετα, η αλλαγή της σειράς των εικονοστοιχείων οδηγεί σε διαφορετική εικόνα και θα κάνει το νευρωνικό δίκτυο που τα επεξεργάζεται να συμπεριφέρεται διαφορετικά.

Για να γίνουν τα γραφήματα χρήσιμα σε αλγόριθμους βαθιάς μάθησης, τα δεδομένα τους πρέπει να μετατραπούν σε μορφή που να μπορεί να υποβληθεί σε επεξεργασία από ένα νευρωνικό δίκτυο. Ο τύπος μορφοποίησης που χρησιμοποιείται για την αναπαράσταση δεδομένων γραφήματος μπορεί να ποικίλλει ανάλογα με τον τύπο του γραφήματος και την προβλεπόμενη εφαρμογή, αλλά γενικά, το κλειδί είναι η αναπαράσταση των πληροφοριών ως μια σειρά πινάκων.

Για παράδειγμα, σκεφτείτε ένα γράφημα κοινωνικού δικτύου. Οι κόμβοι μπορούν να αναπαρασταθούν ως πίνακας χαρακτηριστικών χρήστη. Ο πίνακας κόμβων, όπου κάθε σειρά περιέχει πληροφορίες για μια οντότητα (π.χ. χρήστης, πελάτης, τραπεζική συναλλαγή), είναι ο τύπος πληροφοριών που θα παρέχετε σε ένα κανονικό νευρωνικό δίκτυο.

Αλλά νευρωνικά δίκτυα γραφημάτων μπορεί επίσης να μάθει από άλλες πληροφορίες που περιέχει το γράφημα. Οι άκρες, οι γραμμές που συνδέουν τους κόμβους, μπορούν να αναπαρασταθούν με τον ίδιο τρόπο, με κάθε σειρά να περιέχει τα αναγνωριστικά των χρηστών και πρόσθετες πληροφορίες όπως ημερομηνία φιλίας, τύπος σχέσης κ.λπ. Τέλος, η γενική συνδεσιμότητα του γραφήματος μπορεί να αναπαρασταθεί ως ένας πίνακας γειτνίασης που δείχνει ποιοι κόμβοι συνδέονται μεταξύ τους.

Όταν όλες αυτές οι πληροφορίες παρέχονται στο νευρωνικό δίκτυο, μπορεί να εξαγάγει μοτίβα και ιδέες που υπερβαίνουν τις απλές πληροφορίες που περιέχονται στα επιμέρους στοιχεία του γραφήματος.

Ενσωματώσεις γραφημάτων

Τα νευρωνικά δίκτυα γραφημάτων μπορούν να δημιουργηθούν όπως κάθε άλλο νευρωνικό δίκτυο, χρησιμοποιώντας πλήρως συνδεδεμένα επίπεδα, συνελικτικά επίπεδα, επίπεδα συγκέντρωσης κ.λπ. Ο τύπος και ο αριθμός των επιπέδων εξαρτώνται από τον τύπο και την πολυπλοκότητα των δεδομένων του γραφήματος και την επιθυμητή έξοδο.

Το GNN λαμβάνει τα μορφοποιημένα δεδομένα γραφήματος ως είσοδο και παράγει ένα διάνυσμα αριθμητικών τιμών που αντιπροσωπεύουν σχετικές πληροφορίες για τους κόμβους και τις σχέσεις τους.

Αυτή η διανυσματική αναπαράσταση ονομάζεται "ενσωμάτωση γραφήματος". Οι ενσωματώσεις χρησιμοποιούνται συχνά στη μηχανική μάθηση για τη μετατροπή περίπλοκων πληροφοριών σε μια δομή που μπορεί να διαφοροποιηθεί και να μαθευτεί. Για παράδειγμα, τα συστήματα επεξεργασίας φυσικής γλώσσας χρησιμοποιούν ενσωματώσεις λέξεων για να δημιουργήσουν αριθμητικές αναπαραστάσεις λέξεων και τις σχέσεις τους μεταξύ τους.

Πώς δημιουργεί το GNN την ενσωμάτωση γραφήματος; Όταν τα δεδομένα του γραφήματος διαβιβάζονται στο GNN, τα χαρακτηριστικά κάθε κόμβου συνδυάζονται με αυτά των γειτονικών κόμβων του. Αυτό ονομάζεται "πέρασμα μηνύματος". Εάν το GNN αποτελείται από περισσότερα από ένα στρώματα, τότε τα επόμενα επίπεδα επαναλαμβάνουν τη λειτουργία μετάδοσης μηνύματος, συλλέγοντας δεδομένα από γείτονες γειτόνων και συγκεντρώνοντάς τα με τις τιμές που προέκυψαν από το προηγούμενο επίπεδο. Για παράδειγμα, σε ένα κοινωνικό δίκτυο, το πρώτο επίπεδο του GNN θα συνδύαζε τα δεδομένα του χρήστη με αυτά των φίλων του και το επόμενο επίπεδο θα προσθέσει δεδομένα από τους φίλους των φίλων και ούτω καθεξής. Τέλος, το επίπεδο εξόδου του GNN παράγει την ενσωμάτωση, η οποία είναι μια διανυσματική αναπαράσταση των δεδομένων του κόμβου και της γνώσης του για άλλους κόμβους στο γράφημα.

Είναι ενδιαφέρον ότι αυτή η διαδικασία μοιάζει πολύ με τον τρόπο με τον οποίο τα συνελικτικά νευρωνικά δίκτυα εξάγουν χαρακτηριστικά από δεδομένα pixel. Συνεπώς, μια πολύ δημοφιλής αρχιτεκτονική GNN είναι το συνελικτικό νευρωνικό δίκτυο γραφήματος (GCN), το οποίο χρησιμοποιεί επίπεδα συνέλιξης για να δημιουργήσει ενσωματώσεις γραφημάτων.

Εφαρμογές νευρωνικών δικτύων γραφημάτων

Μόλις έχετε ένα νευρωνικό δίκτυο που μπορεί να μάθει τις ενσωματώσεις ενός γραφήματος, μπορείτε να το χρησιμοποιήσετε για να ολοκληρώσετε διαφορετικές εργασίες.

Ακολουθούν μερικές εφαρμογές για νευρωνικά δίκτυα γραφημάτων:

Ταξινόμηση κόμβων: Μία από τις ισχυρές εφαρμογές των GNN είναι η προσθήκη νέων πληροφοριών σε κόμβους ή η πλήρωση κενών όπου λείπουν πληροφορίες. Για παράδειγμα, ας πούμε ότι εκτελείτε ένα κοινωνικό δίκτυο και έχετε εντοπίσει μερικούς λογαριασμούς bot. Τώρα θέλετε να μάθετε αν υπάρχουν άλλοι λογαριασμοί bot στο δίκτυό σας. Μπορείτε να εκπαιδεύσετε ένα GNN ώστε να ταξινομεί άλλους χρήστες στο κοινωνικό δίκτυο ως "bot" ή "not bot" με βάση το πόσο κοντά είναι οι ενσωματώσεις γραφημάτων τους σε αυτές των γνωστών bot.

Πρόβλεψη άκρων: Ένας άλλος τρόπος χρήσης GNN είναι να βρείτε νέες ακμές που μπορούν να προσθέσουν αξία στο γράφημα. Επιστρέφοντας στο κοινωνικό μας δίκτυο, ένα GNN μπορεί να βρει χρήστες (κόμβους) που βρίσκονται κοντά σας στο χώρο ενσωμάτωσης αλλά δεν είναι ακόμα φίλοι σας (δηλαδή, δεν υπάρχει άκρη που να σας συνδέει μεταξύ σας). Αυτοί οι χρήστες μπορούν στη συνέχεια να σας παρουσιαστούν ως προτάσεις φίλων.

Ομαδοποίηση: Τα GNN μπορούν να συλλέξουν νέες δομικές πληροφορίες από γραφήματα. Για παράδειγμα, σε ένα κοινωνικό δίκτυο όπου όλοι συνδέονται με τον ένα ή τον άλλο τρόπο με άλλους (μέσω φίλων ή φίλων φίλων κ.λπ.), το GNN μπορεί να βρει κόμβους που σχηματίζουν συμπλέγματα στον χώρο ενσωμάτωσης. Αυτά τα συμπλέγματα μπορούν να παραπέμπουν σε ομάδες χρηστών που μοιράζονται παρόμοια ενδιαφέροντα, δραστηριότητες ή άλλα δυσδιάκριτα χαρακτηριστικά, ανεξάρτητα από το πόσο στενές είναι οι σχέσεις τους. Η ομαδοποίηση είναι ένα από τα κύρια εργαλεία που χρησιμοποιούνται στο μάρκετινγκ που βασίζεται στη μηχανική μάθηση.

Τα νευρωνικά δίκτυα γραφημάτων είναι πολύ ισχυρά εργαλεία. Έχουν ήδη βρει ισχυρές εφαρμογές σε τομείς όπως ο σχεδιασμός δρομολογίων, ο εντοπισμός απάτης, η βελτιστοποίηση δικτύου και η έρευνα φαρμάκων. Όπου υπάρχει ένα γράφημα σχετικών οντοτήτων, τα GNN μπορούν να βοηθήσουν να λάβετε τη μεγαλύτερη αξία από τα υπάρχοντα δεδομένα.

Ο Ben Dickson είναι μηχανικός λογισμικού και ιδρυτής της TechTalks. Γράφει για την τεχνολογία, τις επιχειρήσεις και την πολιτική.

Αυτή η ιστορία αρχικά εμφανίστηκε Bdtechtalks.com. Πνευματικά δικαιώματα 2021

VentureBeat

Η αποστολή της VentureBeat είναι να είναι μια ψηφιακή πλατεία της πόλης για τεχνικούς που λαμβάνουν αποφάσεις για να αποκτήσουν γνώσεις σχετικά με την τεχνολογία μετασχηματισμού και τις συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

ενημερωμένες πληροφορίες για τα θέματα που σας ενδιαφέρουν
τα ενημερωτικά δελτία μας
περιφραγμένο περιεχόμενο με ηγέτη σκέψης και μειωμένη πρόσβαση στις βραβευμένες εκδηλώσεις μας, όπως Μετασχηματισμός 2021: Μάθε περισσότερα
δυνατότητες δικτύωσης και πολλά άλλα

Γίνετε μέλος

Πηγή: https://venturebeat.com/2021/10/13/what-are-graph-neural-networks-gnn/

Σφραγίδα ώρας: Οκτώβριος 13, 2021