Κορυφαία έγγραφα μηχανικής μάθησης που πρέπει να διαβάσετε το 2023

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Κορυφαία έγγραφα μηχανικής μάθησης που πρέπει να διαβάσετε το 2023
Εικόνα από pc.διάνυσμα on Freepik

Η Μηχανική Μάθηση είναι ένα μεγάλο πεδίο με νέες έρευνες που βγαίνουν συχνά. Είναι ένα καυτό πεδίο όπου η ακαδημαϊκή κοινότητα και η βιομηχανία συνεχίζουν να πειραματίζονται με νέα πράγματα για να βελτιώσουν την καθημερινότητά μας.

Τα τελευταία χρόνια, η γενετική τεχνητή νοημοσύνη αλλάζει τον κόσμο λόγω της εφαρμογής της μηχανικής μάθησης. Για παράδειγμα, ChatGPT και Stable Diffusion. Ακόμη και με το 2023 που κυριαρχείται από τη γενετική τεχνητή νοημοσύνη, θα πρέπει να γνωρίζουμε πολλές περισσότερες ανακαλύψεις μηχανικής μάθησης.

Εδώ είναι τα κορυφαία έγγραφα μηχανικής εκμάθησης που πρέπει να διαβάσετε το 2023, ώστε να μην χάσετε τις επερχόμενες τάσεις.

1) Learning the Beauty in Songs: Neural Singing Voice Beautifier

Το Singing Voice Beautifying (SVB) είναι μια νέα εργασία στη γενετική τεχνητή νοημοσύνη που στοχεύει να βελτιώσει την ερασιτεχνική τραγουδιστική φωνή σε όμορφη. Είναι ακριβώς ο ερευνητικός στόχος Liu et αϊ. (2022) όταν πρότειναν ένα νέο μοντέλο παραγωγής που ονομάζεται Neural Singing Voice Beautifier (NSVB).

Το NSVB είναι ένα ημι-εποπτευόμενο μοντέλο εκμάθησης που χρησιμοποιεί έναν αλγόριθμο λανθάνουσας χαρτογράφησης που λειτουργεί ως διορθωτής τόνου και βελτιώνει τον φωνητικό τόνο. Το έργο υπόσχεται να βελτιώσει τη μουσική βιομηχανία και αξίζει να το δείτε.

2) Συμβολική Ανακάλυψη Αλγορίθμων Βελτιστοποίησης

Τα μοντέλα βαθιάς νευρωνικών δικτύων έχουν γίνει μεγαλύτερα από ποτέ και έχει διεξαχθεί πολλή έρευνα για να απλοποιηθεί η διαδικασία εκπαίδευσης. Πρόσφατη έρευνα από την ομάδα της Google (Οι Chen et al. (2023)) έχει προτείνει μια νέα βελτιστοποίηση για το Νευρωνικό Δίκτυο που ονομάζεται Lion (EvoLved Sign Momentum). Η μέθοδος δείχνει ότι ο αλγόριθμος είναι πιο αποδοτικός στη μνήμη και απαιτεί μικρότερο ρυθμό εκμάθησης από τον Adam. Είναι μια εξαιρετική έρευνα που δείχνει πολλές υποσχέσεις που δεν πρέπει να χάσετε.

3) TimesNet: Temporal 2D-Variation Modeling for General Time Series Analysis

Η ανάλυση χρονοσειρών είναι μια συνηθισμένη περίπτωση χρήσης σε πολλές επιχειρήσεις. Για παράδειγμα, πρόβλεψη τιμών, ανίχνευση ανωμαλιών κ.λπ. Ωστόσο, υπάρχουν πολλές προκλήσεις για την ανάλυση χρονικών δεδομένων μόνο με βάση τα τρέχοντα δεδομένα (δεδομένα 1D). Γι' αυτό Οι Wu et al. (2023) προτείνουν μια νέα μέθοδο που ονομάζεται TimesNet για τη μετατροπή των 1D δεδομένων σε δεδομένα 2D, η οποία επιτυγχάνει εξαιρετική απόδοση στο πείραμα. Θα πρέπει να διαβάσετε την εργασία για να κατανοήσετε καλύτερα αυτή τη νέα μέθοδο, καθώς θα βοηθούσε πολύ την ανάλυση χρονοσειρών στο μέλλον.

4) OPT: Ανοίξτε τα προεκπαιδευμένα μοντέλα γλώσσας Transformer

Επί του παρόντος, βρισκόμαστε σε μια γενετική εποχή τεχνητής νοημοσύνης όπου πολλά μεγάλα μοντέλα γλώσσας αναπτύχθηκαν εντατικά από εταιρείες. Κυρίως αυτού του είδους η έρευνα δεν θα κυκλοφόρησε το μοντέλο τους ή θα ήταν μόνο εμπορικά διαθέσιμη. Ωστόσο, η ερευνητική ομάδα Meta AI (Zhang et αϊ. (2022)) προσπαθεί να κάνει το αντίθετο κυκλοφορώντας δημόσια το μοντέλο Open Pre-trained Transformers (OPT) που θα μπορούσε να είναι συγκρίσιμο με το GPT-3. Η εργασία είναι μια εξαιρετική αρχή για την κατανόηση του μοντέλου OPT και των λεπτομερειών της έρευνας, καθώς η ομάδα καταγράφει όλες τις λεπτομέρειες στο χαρτί.

5) REaLTabFormer: Δημιουργία ρεαλιστικών σχεσιακών και πινάκων δεδομένων χρησιμοποιώντας μετασχηματιστές

Το μοντέλο παραγωγής δεν περιορίζεται μόνο στη δημιουργία κειμένου ή εικόνων, αλλά και δεδομένων σε πίνακα. Αυτά τα δεδομένα που δημιουργούνται ονομάζονται συχνά συνθετικά δεδομένα. Πολλά μοντέλα αναπτύχθηκαν για τη δημιουργία συνθετικών πινάκων δεδομένων, αλλά σχεδόν κανένα μοντέλο για τη δημιουργία σχεσιακών συνθετικών δεδομένων πίνακα. Αυτός είναι ακριβώς ο στόχος Solatorio and Dupriez (2023) έρευνα; δημιουργώντας ένα μοντέλο που ονομάζεται REaLTabFormer για συνθετικά σχεσιακά δεδομένα. Το πείραμα έδειξε ότι το αποτέλεσμα είναι ακριβώς κοντά στο υπάρχον συνθετικό μοντέλο, το οποίο θα μπορούσε να επεκταθεί σε πολλές εφαρμογές.

6) Είναι η Ενισχυτική Εκμάθηση (Όχι) για Επεξεργασία Φυσικής Γλώσσας;: Σημεία αναφοράς, γραμμές βάσης και δομικά στοιχεία για τη βελτιστοποίηση πολιτικής φυσικής γλώσσας

Το Reinforcement Learning εννοιολογικά είναι μια εξαιρετική επιλογή για την εργασία Επεξεργασίας Φυσικής Γλώσσας, αλλά είναι αλήθεια; Αυτή είναι μια ερώτηση που Οι Ramamurthy et al. (2022) προσπαθήστε να απαντήσετε. Ο ερευνητής εισάγει διάφορες βιβλιοθήκες και αλγόριθμους που δείχνει πού έχουν πλεονέκτημα οι τεχνικές Ενισχυτικής Μάθησης σε σύγκριση με την εποπτευόμενη μέθοδο στις εργασίες NLP. Συνιστάται να διαβάσετε εάν θέλετε μια εναλλακτική για το σύνολο των δεξιοτήτων σας.

7) Tune-A-Video: Συντονισμός One-Shot μοντέλων διάχυσης εικόνας για δημιουργία κειμένου σε βίντεο

Η δημιουργία κειμένου σε εικόνα ήταν μεγάλη το 2022 και το 2023 θα προβλεφόταν με δυνατότητα κειμένου σε βίντεο (T2V). Έρευνα από Οι Wu et al. (2022) δείχνει πώς το T2V μπορεί να επεκταθεί σε πολλές προσεγγίσεις. Η έρευνα προτείνει μια νέα μέθοδο Tune-a-Video που υποστηρίζει εργασίες T2V, όπως αλλαγή θέματος και αντικειμένου, μεταφορά στυλ, επεξεργασία χαρακτηριστικών, κ.λπ. Είναι ένα εξαιρετικό έγγραφο για ανάγνωση αν σας ενδιαφέρει η έρευνα κειμένου σε βίντεο.

8) PyGlove: Αποτελεσματική ανταλλαγή ιδεών ML ως κώδικα

Η αποτελεσματική συνεργασία είναι το κλειδί για την επιτυχία σε κάθε ομάδα, ειδικά με την αυξανόμενη πολυπλοκότητα στα πεδία μηχανικής εκμάθησης. Για την ενίσχυση της αποτελεσματικότητας, Οι Peng et al. (2023) παρουσιάστε μια βιβλιοθήκη PyGlove για να μοιράζεστε εύκολα ιδέες ML. Η ιδέα του PyGlove είναι να καταγράψει τη διαδικασία της έρευνας ML μέσω μιας λίστας κανόνων επιδιόρθωσης. Στη συνέχεια, η λίστα μπορεί να επαναχρησιμοποιηθεί σε οποιαδήποτε σκηνή πειραμάτων, γεγονός που βελτιώνει την αποτελεσματικότητα της ομάδας. Είναι μια έρευνα που προσπαθεί να λύσει ένα πρόβλημα μηχανικής μάθησης που πολλοί δεν έχουν κάνει ακόμα, οπότε αξίζει να το διαβάσετε.

8) Πόσο κοντά είναι το ChatGPT στους Human Experts; Σύγκριση Corpus, Evaluation, and Detection

Το ChatGPT έχει αλλάξει τόσο πολύ τον κόσμο. Είναι ασφαλές να πούμε ότι η τάση θα ήταν ανοδική από εδώ, καθώς το κοινό είναι ήδη υπέρ της χρήσης του ChatGPT. Ωστόσο, πώς είναι το τρέχον αποτέλεσμα του ChatGPT σε σύγκριση με τους Human Experts; Είναι ακριβώς αυτό το ερώτημα Οι Guo κ.ά. (2023) προσπαθήστε να απαντήσετε. Η ομάδα προσπάθησε να συλλέξει δεδομένα από ειδικούς και τα άμεσα αποτελέσματα του ChatGPT, τα οποία συνέκριναν. Το αποτέλεσμα δείχνει ότι υπήρχαν σιωπηρές διαφορές μεταξύ του ChatGPT και των ειδικών. Η έρευνα είναι κάτι που πιστεύω ότι θα διατηρηθεί στο μέλλον καθώς το μοντέλο παραγωγής τεχνητής νοημοσύνης θα συνεχίσει να αυξάνεται με την πάροδο του χρόνου, οπότε αξίζει να το διαβάσετε.

Το 2023 είναι μια εξαιρετική χρονιά για την έρευνα μηχανικής μάθησης που αποδεικνύεται από την τρέχουσα τάση, ειδικά το γενετικό AI όπως το ChatGPT και το Stable Diffusion. Υπάρχουν πολλά υποσχόμενη έρευνα που πιστεύω ότι δεν πρέπει να χάσουμε επειδή έχουν δείξει πολλά υποσχόμενα αποτελέσματα που μπορεί να αλλάξουν το τρέχον πρότυπο. Σε αυτό το άρθρο, σας έδειξα 9 κορυφαίες εργασίες ML προς ανάγνωση, που κυμαίνονται από το μοντέλο παραγωγής, το μοντέλο χρονοσειρών έως την αποτελεσματικότητα ροής εργασιών. Ελπίζω να βοηθήσει.

Cornellius Yudha Wijaya είναι βοηθός διευθυντής επιστήμης δεδομένων και συγγραφέας δεδομένων. Ενώ εργάζεται με πλήρη απασχόληση στην Allianz Indonesia, του αρέσει να μοιράζεται συμβουλές για Python και Data μέσω των μέσων κοινωνικής δικτύωσης και των μέσων συγγραφής.