Η δημιουργικότητα που βασίζεται στην τεχνητή νοημοσύνη δίνει στους υπερισχύοντες υπολογιστές κάτι που αξίζει να κάνουν επιτέλους

Κόμβος πηγής: 1729591

Στήλη Μέχρι πρόσφατα, το υλικό των προσωπικών υπολογιστών φαινόταν να έχει ξεπεράσει οποιεσδήποτε απαιτήσεις θα μπορούσε ενδεχομένως να του επιβάλει το λογισμικό. Ακόμη και τα παιχνίδια προηγμένης τεχνολογίας – παραδοσιακά η κορυφαία αιχμή των απαιτήσεων των χρηστών όσον αφορά την απόδοση – μόλις και μετά βίας φορολογούσαν τη μαζικά υπερισχύουσα, κορυφαία διαθέσιμη πυρίτιο. Στη συνέχεια ήρθε η τέχνη AI.

Ο μικροεπεξεργαστής M1 Ultra της Apple διαθέτει τρανζίστορ 100 δισεκατομμύρια. Η Nvidia μόλις κυκλοφόρησε ναυαρχίδα RTX 4090 GPU, με 76 δισεκατομμύρια τρανζίστορ – τριπλάσια αύξηση σε σχέση με την προηγούμενη γενιά, το προϊόν του πιο πρόσφατου κόμβου διεργασίας και μια στάση διάβολου για την κατανάλωση ενέργειας. Σχεδόν 500 W TDP; Ανεβάστε το και ζεστάνετε το σπίτι σας αυτό το χειμώνα.

Για ποιο σκοπό όμως; Ένα Fortnite battle royale 300 fps; Τον Απρίλιο Έγραψα: «Αυτά τα τέρατα πρέπει να εξημερωθούν, να εκπαιδευτούν και να δουλέψουν». Η τεχνολογία απεχθάνεται το κενό – τέσσερις δεκαετίες στον τομέα αυτό με έχουν διδάξει. Όπου υπάρχει χωρητικότητα, κάτι θα έρθει για να το αξιοποιήσει.

Αυτό το άλλο παπούτσι έπεσε στις αρχές Σεπτεμβρίου, όταν HuggingFace AI – κυκλοφόρησε μια ιδιωτική εταιρεία που δημιουργεί εργαλεία λογισμικού που εκμεταλλεύονται τεχνικές τεχνητής νοημοσύνης αιχμής Σταθερή Διάχυση.

Παρόμοια με συστήματα όπως το DALL•E και Μεσοταξίδι, Το Stable Diffusion ανεβαίνει και στη συνέχεια μειώνει δισεκατομμύρια εικόνες σε συμβολικά σταθμισμένα διακριτικά που μπορούν να δημιουργηθούν ξανά στην ορατότητα με μια κατάλληλα διαμορφωμένη προτροπή κειμένου. Το όλο θέμα βρίσκεται ακριβώς σε αυτήν την πλευρά της μαγείας – ωστόσο λειτουργεί εξαιρετικά καλά.

Σε αντίθεση με το DALL•E ή το Midjourney, το Stable Diffusion είναι αμφότερα εντελώς αυτόνομο – ικανό να λειτουργεί σε οποιοδήποτε αρκετά ισχυρό μηχάνημα – και καθαρό FOSS. Αυτό σήμαινε ότι, παρόλο που η αρχική έκδοση απαιτούσε ορισμένες από τις υψηλότερες GPU της Nvidia, μέσα σε μια εβδομάδα οι συνεργάτες του έργου είχαν αφαίρεσε τον κωδικό του και μείωσε τις απαιτήσεις του σε υλικό. Η τρέχουσα έκδοση μπορεί να τρέξει αρκετά άνετα στον γευστικό υπολογιστή που αγόρασα πριν από έξι χρόνια για να εξερευνήσω τον πρόσφατα αναγεννημένο κόσμο της εικονικής πραγματικότητας – καθώς και σχεδόν σε οποιονδήποτε Mac που βασίζεται σε M1. Πολλοί υπολογιστές παιχνιδιών και φορητοί υπολογιστές μπορούν να εκτελούν το Stable Diffusion αρκετά καλά ώστε να το χρησιμοποιούν για δημιουργικές ανάγκες που βασίζονται σε έργα – ή απλώς για διασκέδαση.

Στη συνέχεια μια ομάδα ερευνητών δημοσίευσε ένα έγγραφο σε κάτι που ονόμασαν Dreamfusion - ικανό να δημιουργήσει μια άπειρη σειρά από πλήρως υλοποιημένα τρισδιάστατα μοντέλα από μηνύματα κειμένου. Πληκτρολογήστε pineapple, και ο υπολογιστής θα σκεφτεί και στη συνέχεια θα δημιουργήσει την καλύτερη προσέγγιση για το πώς θα πρέπει να μοιάζει αυτό το μοντέλο. Αν και αυτή η ομάδα δεν έχει κυκλοφορήσει ακόμη τον κώδικά της, το έγγραφο παρείχε αρκετό σχέδιο για έναν φιλόδοξο κωδικοποιητή να προσαρμόσει τη βάση κώδικα Stable Diffusion για να δημιουργήσει Stable Dreamfusion – το οποίο, πάλι, απαιτεί αρκετά ισχυρό υλικό.

Μια εικόνα που παράγεται από το Stable Diffusion από το μήνυμα κειμένου "Ένα ρομπότ ζωγραφίζει μια εικόνα ενώ τρέχει σε διάδρομο" … Κάντε κλικ για μεγέθυνση

Για να μην περιορίζομαι, μια άλλη ομάδα στο Πανεπιστήμιο του Τελ Αβίβ κατέπληξε τον κόσμο με το Μοντέλο διάχυσης ανθρώπινης κίνησης. Αυτό το έγγραφο έδειξε πώς οι ερευνητές είχαν χρησιμοποιήσει τεχνικές τεχνητής νοημοσύνης που βασίζονται στη διάχυση για να μετατρέψουν μια προτροπή όπως "the person walks forward two steps and does a cartwheel” σε ένα ανθρωπόμορφο animation. Μια εβδομάδα αργότερα, οι ίδιοι οι ερευνητές κυκλοφόρησαν τον κωδικό τους ως FOSS.

Είμαστε ακόμα λίγο νωρίς σε αυτήν την εκθετική ανάπτυξη των δυνατοτήτων τεχνητής νοημοσύνης για να ξέρουμε πού θα οδηγήσει κάποια από αυτές. Ήδη, τόσο η Canva όσο και η Microsoft έχουν ενσωματώσει γεννήτριες εικόνων που βασίζονται σε προτροπές στα δημιουργικά τους εργαλεία. Meta, Google, και άλλοι έχουν επιδείξει ιδιόκτητες γεννήτριες προτροπής για βίντεο. Σύμφωνα με την τρέχουσα τάση, δεν θα χρειαστεί να περιμένουμε πολύ μέχρι να έχουμε ισοδύναμα FOSS για να παίξουμε.

Οι εικαστικές τέχνες έχουν ισχυρά νέα εργαλεία που δεν είναι αποκλειστικός τομέας κολοσσών όπως η Google ή η OpenAI – η τελευταία είναι μια εταιρεία που υποσχέθηκε να εκδημοκρατίσει την τεχνητή νοημοσύνη στα ιδρύματά της, αλλά φαίνεται ότι επικεντρώθηκε στη δημιουργία της δικής της ιδιόκτητης αυτοκρατορίας με τη Microsoft ως ανεπίσημος ιδιοκτήτης.

Σε μια από τις πρώτες μου στήλες για Το μητρώο έδειξα το τέλος του ατελείωτου κύκλου αναβάθμισης για υπολογιστές. Όχι άλλος διάδρομος: αρκετά καλός, θα αντικαθιστώνται μόνο όταν φθαρούν. Με εξαίρεση μια αναταραχή αναβαθμίσεων για να φιλοξενήσει τηλεδιάσκεψη με γνώμονα την πανδημία αυτή η πρόβλεψη έχει αποδειχθεί σωστή.

Όμως, ο προσωπικός υπολογιστής έχει χάσει το δέρμα του, αποκαλύπτοντας τη νέα του μορφή ως δημιουργικός υπερυπολογιστής: τροφοδοτούμενος με διάχυση και δημιουργικά ικανός με τρόπους που ο υπολογιστής του παλιού δεν μπορούσε να αρχίσει να προσεγγίζει. Αντί να προσφέρουν μια άλλη νέα γραφίδα ή πινέλο, αυτά τα ποιοτικά διαφορετικά εργαλεία σφυρηλατούν ένα νέο είδος δημιουργικής συνεργασίας.

Τον Ιούνιο αγόρασα έναν φορητό υπολογιστή υψηλών προδιαγραφών – και ένιωσα αμέσως ένοχος γι' αυτό, νομίζοντας ότι δεν θα το έβαζα ποτέ πραγματικά σε λειτουργία. Σήμερα, χρησιμοποιώ πλήρως ένα μηχάνημα που μπορεί να κάνει και το καθημερινό και το απίστευτο. Εκ των υστέρων, αυτή η αγορά μοιάζει με μια έξυπνη συμφωνία – προάγγελος μιας πραγματικής αναγέννησης – καθώς το PC, αναγεννημένο, αρχίζει να λειτουργεί. ®

Σφραγίδα ώρας:

Περισσότερα από Το μητρώο