Τι μπορεί να μας διδάξει η αρχιτεκτονική για τα συστήματα αυτοθεραπείας

Τι μπορεί να μας διδάξει η αρχιτεκτονική για τα συστήματα αυτοθεραπείας

Κόμβος πηγής: 1988904

Ομάδες DevOps και μηχανικοί αξιοπιστίας ιστότοπου (SRE) ασχολούνται με κώδικα καθημερινά. Κάνοντας αυτό τους διδάσκει να εξετάζουν εξονυχιστικά τον κόσμο τους, να κάνουν οξυδερκείς παρατηρήσεις και να δημιουργούν απροσδόκητες συνδέσεις. Εξάλλου, αν και είναι εξαιρετικά λογικό και μαθηματικό από τη φύση του, η ανάπτυξη λογισμικού είναι, τουλάχιστον εν μέρει, μορφή τέχνης. 

Δεν πείστηκες από αυτή τη δήλωση; Εξετάστε τους παραλληλισμούς μεταξύ των πιο αξιοσημείωτων αρχιτεκτονικών επιτευγμάτων της ιστορίας και της σύγχρονης μηχανικής λογισμικού. Είναι μια εύστοχη σύγκριση: Ακριβώς όπως η μηχανική λογισμικού, η αρχιτεκτονική χρησιμοποιεί πολύπλοκους μαθηματικούς υπολογισμούς για να δημιουργήσει κάτι όμορφο. Και στους δύο κλάδους, ένας μικρός λάθος υπολογισμός μπορεί να οδηγήσει σε σημαντικές συνέπειες. Συναρπαστικά, πολλά διάσημα αρχιτεκτονικά λάθη είναι ανάλογα με ζητήματα που βρίσκουμε στον κώδικα.

Θυμηθείτε, η έμπνευση είναι παντού – αρκεί να ξέρετε πού να κοιτάξετε. Εδώ είναι μερικά μαθήματα που μπορούν να μάθουν οι μηχανικοί λογισμικού από τις αρχιτεκτονικές επιφανείες ανά τους αιώνες, ειδικά όσον αφορά το μέλλον των συστημάτων αυτοίασης.

Μάθημα 1: Οι περιπτώσεις Edge θα εκμεταλλεύονται πάντα τα τρωτά σημεία του συστήματος

Ο Πύργος Citicorp – που τώρα ονομάζεται 601 Lexington – ολοκλήρωσε την κατασκευή στη Νέα Υόρκη το 1977, οπότε ήταν το έβδομο ψηλότερο κτίριο στον κόσμο. Ο υπερσύγχρονος σχεδιασμός του ουρανοξύστη περιελάμβανε τρεις ξυλοπόδαρους μήκους 100 και πλέον ποδιών. Ήταν ένα θαύμα στην ολοκλήρωση. Ωστόσο, ένας προπτυχιακός φοιτητής σύντομα ανακάλυψε κάτι τρομακτικό: Ισχυρούς ανέμους μπορεί να θέσει σε κίνδυνο την ακεραιότητα του κτιρίου. Συγκεκριμένα, εάν ισχυροί άνεμοι τέταρτο χτυπούσαν στις γωνίες του Πύργου Citicorp, η κατασκευή υπόκειται σε κατάρρευση - κυριολεκτικά ακραία θήκη.

Ο πύργος είχε μία στις 16 πιθανότητες να καταρρεύσει κάθε χρόνο. Αυτές οι πιθανότητες μπορεί να δελεάσουν κάποιον που κάθεται σε ένα τραπέζι τυχερών παιχνιδιών, αλλά οι προοπτικές ήταν ζοφερές για τους αρχιτέκτονες και τους δομικούς μηχανικούς πίσω από τον πύργο Citicorp. Ευτυχώς, οι τεχνικοί κατάφεραν να ενισχύσουν τις βιδωμένες αρθρώσεις του κτιρίου. Η καταστροφή αποφεύχθηκε.

Οι δομικοί μηχανικοί γνώριζαν ότι ο πύργος Citicorp θα αντιμετώπιζε τελικά έναν άνεμο αρκετά δυνατό ώστε να θέσει σε κίνδυνο τα ρουλεμάν του. Ομοίως, οι έμπειροι μηχανικοί λογισμικού γνωρίζουν ότι η ισχυρή παρακολούθηση απόδοσης εφαρμογών (APM) και η διαχείριση συμβάντων δεν αρκούν για να προστατεύσουν ένα σύστημα από τις αναπόφευκτες ακραίες περιπτώσεις. Αυτό συμβαίνει γιατί στατικά συστήματα χωρίς μηχανική εκμάθηση (ML) Οι ικανότητες δεν μπορούν να χειριστούν απροσδόκητες και απρογραμμάτιστες νέες καταστάσεις, όπως οι άνεμοι τεταρτημορίου. Όταν βασίζεται αποκλειστικά σε εργαλεία παρακολούθησης, ένας ανθρώπινος διαχειριστής πρέπει να αποκρυπτογραφήσει τα σφάλματα και να κλιμακώσει τη διαδικασία διαχείρισης περιστατικών.

Για να μειωθεί ο μέσος χρόνος ανάκτησης (MTTR)/μέσος χρόνος ανίχνευσης (MTTD), οι ομάδες DevOps πρέπει να αποδεχτούν την υψηλή πιθανότητα εμφάνισης περιπτώσεων ακραίας θέσης και να εργαστούν για την προληπτική ανάπτυξη λύσεων αυτομάθησης. Αυτό το μάθημα πηγαίνει πολύ μακριά, καθώς η προνοητικότητα είναι κρίσιμη στη μηχανική.

Μάθημα 2: «Η κατασκευή του αεροπλάνου καθώς πετάει» δημιουργεί έναν ατελείωτο κύκλο

Τραγικά γεγονότα έχουν παραδώσει πολλά από τα πιο σημαντικά μαθήματα στην ιστορία της αεροπορίας. Όταν ένα αεροπλάνο υπέστη τεράστια αποσυμπίεση κατά τη διάρκεια της πτήσης και συνετρίβη το 1954, οι μηχανικοί διαπίστωσαν ότι τα τετράγωνα παράθυρα των επιβατών ήταν ένα περιττό σημείο πίεσης. Στο εξής, τα αεροπλάνα ήταν εξοπλισμένα με στρογγυλεμένα παράθυρα. Οι πυρκαγιές στο πλοίο οδήγησαν σε νέες ρυθμίσεις καθισμάτων με προτεραιότητα την ευκολία εκκένωσης. Αυτές οι αλλαγές έχουν σώσει αμέτρητες ζωές.

Σε πολλές βιομηχανίες – συμπεριλαμβανομένης της αεροπορίας – δεν υπάρχει τρόπος εξαντλητικής δοκιμής ακραίων καταστάσεων ενός προϊόντος. Όπως αναφέρθηκε προηγουμένως, οι ακραίες περιπτώσεις είναι αναπόφευκτες. Το μεγαλύτερο πλεονέκτημα εδώ είναι ότι οι μηχανικοί λογισμικού πρέπει να προσέχουν τα τρωτά σημεία του συστήματός τους όταν παρουσιάζονται. Από εκεί και πέρα ​​πρέπει να τους αντιμετωπίσουν εύστοχα. Για να γίνει αυτό απαιτούνται δύο πράγματα: (1) εντοπισμός και παρακολούθηση των σωστών βασικών δεικτών απόδοσης (KPI) και (2) επένδυση χρόνου και πόρων για τη βελτίωση των συστημάτων που βασίζονται σε σχετικές μετρήσεις.

Η μέση ομάδα μηχανικών επενδύει σε 16 έως 40 εργαλεία παρακολούθησης, ωστόσο συχνά χάνει το σημάδι στο οποίο οι μετρήσεις δείχνουν επιτυχία. Λιγότερες από το 15% των ομάδων παρακολουθούν το MTTD, επομένως χάνουν το 66% του κύκλου ζωής του περιστατικού. Και το ένα τέταρτο των ομάδων αναφέρουν λείπουν οι συμφωνίες επιπέδου υπηρεσιών (SLA) παρά τις σημαντικές επενδύσεις στην παρακολούθηση διαθεσιμότητας. Αυτό μας λέει ότι η συλλογή δεδομένων χρειάζεται ενδελεχή, συστηματική ανάλυση για να περικοπεί, οι λύσεις δεν είναι πλέον αρκετές.

Οι μηχανικοί λογισμικού, οι ομάδες DevOps και οι SRE πρέπει να δώσουν προτεραιότητα σε διαδικασίες και εργαλεία που εξάγουν αξία από συντριπτικές ποσότητες πληροφοριών σχετικά με τη διαθεσιμότητα. Αντί να παρατηρούν απλώς ένα κρίσιμο σφάλμα, πρέπει να πάρουν μια σελίδα από το βιβλίο ενός μηχανικού αεροπορίας και να λάβουν κρίσιμες αποφάσεις, γρήγορα. Το μυστικό για να το κάνετε αυτό βρίσκεται στο AI.

Μάθημα 3: Η τεχνητή νοημοσύνη είναι ένα θεμελιώδες δομικό στοιχείο για συστήματα αυτοίασης

Ένα πλήρως αυτόνομο, άψογα λειτουργικό σύστημα αυτοίασης είναι ιδανικό για κάθε μηχανικό λογισμικού. Τα συστήματα που επιδιορθώνουν τα ίδια είναι καλά για την ικανοποίηση των πελατών, καθώς εξαλείφουν το δαπανηρό χρόνο διακοπής λειτουργίας που αντιμετωπίζει ο καταναλωτής. Επιπλέον, είναι απίστευτα ωφέλιμα για τις λειτουργίες διαχείρισης υπηρεσιών πληροφορικής (ITSM), καθώς μειώνουν σημαντικά την ανάγκη για κουραστική διαχείριση εισιτηρίων. Η κατασκευή ενός τέτοιου συστήματος απαιτεί πολλά εξαρτήματα, πολλά από τα οποία είναι προς το παρόν απρόσιτα. Αλλά είμαστε πιο κοντά σε μια πραγματικότητα που αυτοθεραπεύεται από ό,τι κάποιοι μπορεί να αντιληφθούν.

Η έλλειψη ευρείας υιοθέτησης της τεχνητής νοημοσύνης παραμένει το μεγαλύτερο εμπόδιο που αντιμετωπίζουν σήμερα τα συστήματα αυτοίασης. Αν και πολλές επιχειρήσεις έχουν υιοθετήσει στοιχειώδη εργαλεία AI ή ML, η ακεραιότητα αυτών των εργαλείων είναι αμφίβολη. Δηλαδή ασχολούνται πολλοί μηχανικοί τεχνητή νοημοσύνη για λειτουργίες πληροφορικής Τεχνολογίες (AIOps) που ακολουθούν τη λογική αυτοματισμού που βασίζεται σε κανόνες αντί για αυτόνομους αλγόριθμους τεχνητής νοημοσύνης. Η διάκριση μπορεί να φαίνεται μικρή, αλλά στην πράξη, είναι η διαφορά μεταξύ ωρών χαμένης παραγωγικότητας και εκατομμυρίων σε πιθανές απώλειες.

Το θέμα είναι ότι τα εργαλεία AIOps που βασίζονται σε κανόνες αναλύουν τις αλληλεπιδράσεις μεταξύ διαφορετικών λύσεων σημείων και μπορούν πιθανότατα να εντοπίσουν κοινά σφάλματα δεδομένων. Όμως τα συστήματα που βασίζονται στον αυτοματισμό δεν μπορούν να επεξεργαστούν την εξέλιξη εντελώς νέων σφαλμάτων με την πάροδο του χρόνου, ούτε μπορούν να προβλέψουν νέες δυσλειτουργίες στα δεδομένα. Αυτό συμβαίνει επειδή οι ανθρώπινοι διαχειριστές που κωδικοποιούν αυτές τις λειτουργίες ζητούν από το σύστημα να ακολουθήσει ένα αν αυτό, τότε αυτό λογικό μοτίβο. Τα πραγματικά αποτελεσματικά εργαλεία AIOps μετριάζουν τα σφάλματα που προκύπτουν και στα τέσσερα κλασικά σημεία τηλεμετρίας – από την ανίχνευση έως την επίλυση – ταξινομώντας νέα και προβληματικά μοτίβα προτού καν οι ανθρώπινοι τεχνικοί αντιληφθούν την ύπαρξή τους. 

Όσο περιμένουμε το επικείμενο τρίτο κύμα AI, αυτή η έκδοση του AIOps είναι ό,τι πιο κοντά έχουμε σε συστήματα αυτοίασης. Θα είναι ενδιαφέρον να παρακολουθήσουμε πώς οι τρέχουσες εφαρμογές AIOps εισχωρούν στο μέλλον της τεχνητής νοημοσύνης, το οποίο θα περιλαμβάνει πλήρως υλοποιημένες δυνατότητες αυτοματισμού και ανεξάρτητης σκέψης. Ίσως τότε οι δομικοί μηχανικοί, επίσης, να καρπωθούν τα οφέλη ενός συστήματος αυτοθεραπείας που βασίζεται στην τεχνητή νοημοσύνη.

Σφραγίδα ώρας:

Περισσότερα από ΔΕΔΟΜΕΝΟΤΗΤΑ