Αποκτήστε τη μέγιστη αξία από την αποθήκη δεδομένων cloud με το Amazon Redshift

Αποκτήστε τη μέγιστη αξία από την αποθήκη δεδομένων cloud με το Amazon Redshift

Κόμβος πηγής: 2064267

Καθημερινά, οι πελάτες έρχονται αντιμέτωποι με το πώς να διαχειριστούν τους αυξανόμενους όγκους δεδομένων και το λειτουργικό τους κόστος για να ξεκλειδώσουν την αξία των δεδομένων για έγκαιρες πληροφορίες και καινοτομία, διατηρώντας παράλληλα σταθερή απόδοση. Η δημιουργία, η κατανάλωση και η αποθήκευση δεδομένων προβλέπεται να αυξηθούν στα 175 zettabyte έως το 2025, όπως προβλέπεται από την αναφορά του 2022 IDC Global DataSphere.

Καθώς ο φόρτος εργασίας δεδομένων αυξάνεται, το κόστος κλιμάκωσης και διαχείρισης της χρήσης δεδομένων με τη σωστή διακυβέρνηση συνήθως αυξάνεται επίσης. Πώς λοιπόν οι ηγέτες οργανώσεων οδηγούν την επιχείρησή τους προς τα εμπρός με υψηλή απόδοση, ελεγχόμενο κόστος και υψηλή ασφάλεια; Με τη σωστή προσέγγιση ανάλυσης, αυτό είναι δυνατό.

Σε αυτήν την ανάρτηση, εξετάζουμε τρεις βασικές προκλήσεις που αντιμετωπίζουν οι πελάτες με τα αυξανόμενα δεδομένα και πώς αρέσει μια σύγχρονη αποθήκη δεδομένων και σύστημα ανάλυσης Amazon RedShift μπορεί να ανταποκριθεί σε αυτές τις προκλήσεις σε όλους τους κλάδους και τους τομείς.

Δημιουργία ενός βέλτιστου συστήματος δεδομένων

Καθώς τα δεδομένα αυξάνονται με ασυνήθιστο ρυθμό, ο πολλαπλασιασμός δεδομένων στις αποθήκες δεδομένων, την αποθήκη δεδομένων και τις λίμνες δεδομένων σας μπορεί να γίνει πρόκληση. Διαφορετικά τμήματα σε έναν οργανισμό μπορούν να τοποθετήσουν δεδομένα σε μια λίμνη δεδομένων ή στην αποθήκη δεδομένων τους ανάλογα με τον τύπο των δεδομένων και τα πρότυπα χρήσης αυτού του τμήματος. Οι ομάδες μπορούν να τοποθετήσουν τα μη δομημένα δεδομένα τους, όπως ροές μέσων κοινωνικής δικτύωσης μέσα τους Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) λίμνη δεδομένων και ιστορικά δομημένα δεδομένα εντός της αποθήκης δεδομένων Amazon Redshift. Οι ομάδες χρειάζονται πρόσβαση τόσο στη λίμνη δεδομένων όσο και στην αποθήκη δεδομένων για να εργαστούν απρόσκοπτα για καλύτερες πληροφορίες, απαιτώντας μια βέλτιστη υποδομή δεδομένων που μπορεί να κλιμακωθεί σχεδόν σε άπειρη κλίμακα για να φιλοξενήσει έναν αυξανόμενο αριθμό ταυτόχρονων χρηστών δεδομένων χωρίς να επηρεάζει την απόδοση—όλα αυτά διατηρώντας το κόστος υπό έλεγχο.

Ένα ουσιαστικό παράδειγμα μιας εταιρείας που διαχειρίζεται αναλυτικά στοιχεία σε δισεκατομμύρια σημεία δεδομένων στη λίμνη δεδομένων και την αποθήκη σε ένα κρίσιμο για την αποστολή επιχειρηματικό περιβάλλον είναι Nasdaq, ένα αμερικανικό χρηματιστήριο. Μέσα σε 2 χρόνια μετά τη μετανάστευση στο Amazon Redshift, ο Nasdaq διαχειριζόταν 30–70 δισεκατομμύρια αρχεία, που αυξάνονταν καθημερινά σε αξία πάνω από 4 terabyte.

Με το Amazon Redshift, ο Nasdaq μπόρεσε να ρωτήσει την αποθήκη και τη χρήση του Φάσμα Amazon Redshift, μια δυνατότητα γρήγορης αναζήτησης των δεδομένων στη θέση τους χωρίς φόρτωση δεδομένων, από τις λίμνες δεδομένων S3 τους. Ο Nasdaq ελαχιστοποίησε τον χρόνο για πληροφορίες με τη δυνατότητα αναζήτησης 15 terabytes δεδομένων στο Amazon S3 αμέσως χωρίς επιπλέον φόρτωση δεδομένων μετά την εγγραφή δεδομένων στο Amazon S3. Αυτή η καινοτομία απόδοσης επιτρέπει στον Nasdaq να έχει μια λίμνη δεδομένων πολλαπλών χρήσεων μεταξύ των ομάδων.

Ο Robert Hunt, Αντιπρόεδρος Μηχανικής Λογισμικού για τον Nasdaq, μοιράστηκε: «Πρέπει να φορτώσουμε και να καταναλώσουμε τα 30 δισεκατομμύρια αρχεία σε μια χρονική περίοδο μεταξύ του κλεισίματος της αγοράς και του επόμενου πρωινού. Η φόρτωση δεδομένων καθυστέρησε την παράδοση των αναφορών μας. Χρειαζόμασταν να μπορούμε να γράφουμε ή να φορτώνουμε δεδομένα στη λύση αποθήκευσης δεδομένων μας πολύ γρήγορα χωρίς να παρεμβαίνουμε στην ανάγνωση και την αναζήτηση των δεδομένων ταυτόχρονα.»

Η τεράστια ανάπτυξη δεδομένων του Nasdaq σήμαινε ότι έπρεπε να εξελίξουν την αρχιτεκτονική δεδομένων τους για να συμβαδίσουν. Έφτιαξαν τα θεμέλια μιας νέας λίμνης δεδομένων στο Amazon S3, ώστε να μπορούν να παρέχουν αναλυτικά στοιχεία χρησιμοποιώντας το Amazon Redshift ως υπολογιστικό επίπεδο. Ο μέγιστος όγκος ημερήσιας απορρόφησης δεδομένων του Nasdaq έφτασε τα 113 δισεκατομμύρια εγγραφές και ολοκλήρωσαν τη φόρτωση δεδομένων για αναφορές 5 ώρες πιο γρήγορα, ενώ εκτελούσαν 32% ταχύτερα ερωτήματα.

Ενεργοποίηση νεότερων προσώπων με αποθήκευση δεδομένων και αναλυτικά στοιχεία

Μια άλλη πρόκληση είναι να δοθεί η δυνατότητα σε νεότερους χρήστες δεδομένων και πρόσωπα με ισχυρά αναλυτικά στοιχεία να επιτύχουν τους επιχειρηματικούς στόχους και να εκτελούν κρίσιμες αποφάσεις. Εκεί που παραδοσιακά ήταν ο μηχανικός δεδομένων και ο διαχειριστής της βάσης δεδομένων που δημιούργησαν και διαχειρίζονταν την αποθήκη, σήμερα σειρά αναλυτών επιχειρηματικών δεδομένων, επιστημόνων δεδομένων και προγραμματιστών χρησιμοποιούν όλοι την αποθήκη δεδομένων για να φτάσουν στη λήψη επιχειρηματικών αποφάσεων σε σχεδόν πραγματικό χρόνο.
Αυτά τα πρόσωπα που δεν έχουν εξειδικευμένες δεξιότητες διαχείρισης δεδομένων ή μηχανικής δεδομένων δεν θέλουν να ασχολούνται με τη διαχείριση της ικανότητας των συστημάτων ανάλυσης τους να χειρίζονται απρόβλεπτους ή αιχμηρούς φόρτους εργασίας δεδομένων ή να περιμένουν τη βελτιστοποίηση του IT ως προς το κόστος και τη χωρητικότητα. Οι πελάτες θέλουν να ξεκινήσουν με αναλυτικά στοιχεία σε μεγάλους όγκους δεδομένων άμεσα και να κλιμακώσουν τα αναλυτικά στοιχεία γρήγορα και οικονομικά χωρίς διαχείριση υποδομής.

Πάρτε την περίπτωση της εταιρείας τυχερών παιχνιδιών για κινητά playrix. Μπόρεσαν να χρησιμοποιήσουν Χωρίς διακομιστή Amazon Redshift για να εξυπηρετήσουν τα βασικά ενδιαφερόμενα μέρη τους με πίνακες εργαλείων με οικονομικά δεδομένα για γρήγορη λήψη αποφάσεων.

Ο Igor Ivanov, Τεχνικός Διευθυντής της Playrix, δήλωσε: «Το Amazon Redshift Serverless είναι εξαιρετικό για την επίτευξη της υψηλής απόδοσης κατά απαίτηση που χρειαζόμαστε για τεράστια ερωτήματα».

Η Playrix είχε έναν διπλό επιχειρηματικό στόχο, συμπεριλαμβανομένου του μάρκετινγκ στους τελικούς χρήστες της (παίκτες παιχνιδιών) με δεδομένα σχεδόν σε πραγματικό χρόνο, ενώ παράλληλα ανέλυε τα ιστορικά τους δεδομένα για τα τελευταία 4-5 χρόνια. Αναζητώντας μια λύση, η Playrix ήθελε να αποφύγει τη διακοπή άλλων τεχνικών διαδικασιών, αυξάνοντας παράλληλα την εξοικονόμηση κόστους. Η εταιρεία μετεγκαταστάθηκε στο Redshift Serverless και κλιμάκωσε για να χειριστεί πιο περίπλοκα αναλυτικά στοιχεία σε 600 TB τα τελευταία 5 χρόνια, όλα αυτά χωρίς να αποθηκεύσει δύο αντίγραφα των δεδομένων ή να διαταράξει άλλες εργασίες ανάλυσης. Με το Redshift Serverless, η Playrix πέτυχε μια πιο ευέλικτη αρχιτεκτονική και εξοικονόμησε συνολικά 20% στο κόστος της στοίβας μάρκετινγκ, μειώνοντας το κόστος απόκτησης πελατών.

«Χωρίς γενικά έξοδα και διαχείριση υποδομής», δήλωσε ο Ivanov, «έχουμε πλέον περισσότερο χρόνο για πειραματισμούς, ανάπτυξη λύσεων και σχεδιασμό νέας έρευνας».

Διάσπαση σιλό δεδομένων

Οι οργανισμοί πρέπει να έχουν εύκολη πρόσβαση και να αναλύουν διάφορους τύπους δομημένων και μη δομημένων δεδομένων, συμπεριλαμβανομένων αρχείων καταγραφής, ροών κλικ, φωνής και βίντεο. Ωστόσο, αυτοί οι τύποι δεδομένων μεγάλου εύρους συνήθως αποθηκεύονται σε σιλό σε πολλαπλές αποθήκες δεδομένων. Για να ξεκλειδώσουν τις πραγματικές δυνατότητες των δεδομένων, οι οργανισμοί πρέπει να διασπάσουν αυτά τα σιλό για να ενοποιήσουν και να ομαλοποιήσουν όλους τους τύπους δεδομένων και να διασφαλίσουν ότι τα σωστά άτομα έχουν πρόσβαση στα σωστά δεδομένα.

Η ενοποίηση δεδομένων μπορεί να είναι δαπανηρή γρήγορα, με χρόνο και κόστος να δαπανηθεί για την κατασκευή αγωγών συγκροτήματος, προσαρμοσμένης εξαγωγής, μετασχηματισμού, φόρτωσης (ETL) που μετακινούν ή αντιγράφουν δεδομένα από σύστημα σε σύστημα. Εάν δεν γίνει σωστά, μπορεί να καταλήξετε με ζητήματα καθυστέρησης δεδομένων, ανακρίβειες και πιθανούς κινδύνους ασφάλειας και διακυβέρνησης δεδομένων. Αντίθετα, οι ομάδες αναζητούν τρόπους για να μοιράζονται συναλλακτικά συνεπή, ζωντανά δεδομένα πρώτου μέρους και τρίτων μεταξύ τους ή με τους τελικούς πελάτες τους, χωρίς μετακίνηση δεδομένων ή αντιγραφή δεδομένων.

Η Stripe, μια πλατφόρμα επεξεργασίας πληρωμών για επιχειρήσεις, είναι πελάτης του Amazon Redshift και συνεργάτης με χιλιάδες τελικούς πελάτες που απαιτούν πρόσβαση στα δεδομένα Stripe για τις εφαρμογές τους. Stripe έχτισε το Stripe Data Pipeline, μια λύση για τους πελάτες Stripe να έχουν πρόσβαση σε σύνολα δεδομένων Stripe στις αποθήκες δεδομένων Amazon Redshift, χωρίς να χρειάζεται να δημιουργήσουν, να διατηρήσουν ή να κλιμακώσουν προσαρμοσμένες εργασίες ETL. Το Stripe Data Pipeline τροφοδοτείται από τη δυνατότητα κοινής χρήσης δεδομένων του Amazon Redshift. Οι πελάτες λαμβάνουν μια ενιαία πηγή αλήθειας, με πρόσβαση σε δεδομένα χαμηλής καθυστέρησης, για να επιταχύνουν το οικονομικό κλείσιμο και να λάβουν καλύτερες πληροφορίες, αναλύοντας μεθόδους πληρωμής με την καλύτερη απόδοση, απάτες ανά τοποθεσία και πολλά άλλα. Η μείωση του χρόνου και της προσπάθειας της μηχανικής δεδομένων για πρόσβαση σε ενοποιημένα δεδομένα δημιουργεί νέες επιχειρηματικές ευκαιρίες από ολοκληρωμένες πληροφορίες και εξοικονομεί κόστος.

Μια σύγχρονη αρχιτεκτονική δεδομένων με το Amazon Redshift

Αυτές οι ιστορίες σχετικά με την αξιοποίηση της μέγιστης αξίας από τα δεδομένα απορρόφησης σε ολόκληρο τον οργανισμό και την εφαρμογή ισχυρών αναλυτικών στοιχείων για επιχειρηματικές πληροφορίες με οικονομικά αποδοτικό τρόπο είναι δυνατές λόγω της προσέγγισης της AWS σε μια σύγχρονη αρχιτεκτονική δεδομένων για τους πελάτες της. Μέσα σε αυτήν την αρχιτεκτονική, η λύση αποθήκευσης δεδομένων της AWS Amazon Redshift είναι ένα σύστημα κλίμακας petabyte πλήρως διαχειριζόμενο, βαθιά ενσωματωμένο με υπηρεσίες βάσης δεδομένων AWS, αναλυτικά στοιχεία και μηχανική μάθηση (ML). Δεκάδες χιλιάδες πελάτες χρησιμοποιούν το Amazon Redshift κάθε μέρα για να εκτελέσουν αποθήκευση δεδομένων και αναλυτικά στοιχεία στο cloud και να επεξεργαστούν exabyte δεδομένων για επιχειρηματικές πληροφορίες. Οι πελάτες που αναζητούν μια λύση αποθήκευσης δεδομένων cloud με υψηλή απόδοση, βελτιστοποιημένη ως προς το κόστος, επιλέγουν το Amazon Redshift για τους ακόλουθους λόγους:

  • Η ηγετική της θέση στην τιμή-απόδοση
  • Η ικανότητα διάσπασης των σιλό δεδομένων για ουσιαστικές γνώσεις
  • Εύκολες δυνατότητες ανάλυσης που περιορίζουν τις απαιτήσεις μηχανικής και διοικητικής διαχείρισης δεδομένων
  • Λειτουργίες ασφάλειας και αξιοπιστίας που προσφέρονται εκτός συσκευασίας, χωρίς επιπλέον κόστος

Η μέτρηση τιμής-απόδοσης σε μια μέτρηση αναφοράς αποθήκης δεδομένων cloud ορίζεται απλώς ως το κόστος εκτέλεσης ενός συγκεκριμένου φόρτου εργασίας. Το να γνωρίζετε πόσο θα κοστίσει η αποθήκη δεδομένων σας και πώς αλλάζει η απόδοση καθώς αυξάνεται η βάση χρηστών και η επεξεργασία δεδομένων σας είναι ζωτικής σημασίας για τον σχεδιασμό, τον προϋπολογισμό και τη λήψη αποφάσεων σχετικά με την επιλογή της καλύτερης αποθήκης δεδομένων.

Το Amazon Redshift είναι σε θέση να επιτύχει το καλύτερη τιμή-απόδοση για τους πελάτες (έως και πέντε φορές καλύτερα από άλλες αποθήκες δεδομένων cloud) βελτιστοποιώντας τον κώδικα για υλικό AWS, υπολογιστικό υλικό υψηλής απόδοσης και απόδοσης ισχύος, νέους αλγόριθμους συμπίεσης και προσωρινής αποθήκευσης και αυτόνομες (βελτιστοποιήσεις που βασίζονται σε ML) εντός της αποθήκης για την αφαίρεση του διαχειριστικές δραστηριότητες μακριά από τον χρήστη, εξοικονομώντας χρόνο και βελτιώνοντας την απόδοση. Ευέλικτες επιλογές τιμολόγησης, όπως pay-as-you-go με Redshift Serverless, διαχωρισμός αποθηκευτικού χώρου και υπολογιστική κλιμάκωση και υπολογιστικές κρατήσεις 1–3 ετών με μεγάλες εκπτώσεις, διατηρούν τις τιμές χαμηλές.

Η εγγενείς ενσωματώσεις στο Amazon Redshift με βάσεις δεδομένων, λίμνες δεδομένων, υπηρεσίες δεδομένων ροής και υπηρεσίες ML, χρησιμοποιώντας προσεγγίσεις μηδενικού ETL σάς βοηθούν να έχετε πρόσβαση σε δεδομένα στη θέση τους χωρίς μετακίνηση δεδομένων και να εισάγετε εύκολα δεδομένα στην αποθήκη χωρίς να δημιουργείτε περίπλοκες αγωγούς. Αυτό διατηρεί το κόστος μηχανικής δεδομένων χαμηλό και επεκτείνει τα αναλυτικά στοιχεία για περισσότερους χρήστες.

Για παράδειγμα, η ενσωμάτωση στο Amazon Redshift με Amazon Sage Maker επιτρέπει στους αναλυτές δεδομένων να παραμένουν εντός της αποθήκης δεδομένων και να δημιουργούν, να εκπαιδεύουν και να δημιουργούν μοντέλα ML σε SQL χωρίς να χρειάζονται εργασίες ETL ή εκμάθηση νέων γλωσσών για ML (βλ. Jobcase Scales ML Workflows για υποστήριξη δισεκατομμυρίων ημερήσιων προβλέψεων χρησιμοποιώντας το Amazon Redshift ML για παράδειγμα). Κάθε εβδομάδα, πάνω από 80 δισεκατομμύρια προβλέψεις γίνονται στην αποθήκη με Amazon Redshift ML.

Τέλος, οι πελάτες δεν χρειάζεται να πληρώσουν περισσότερα για να εξασφαλίσουν τα κρίσιμα στοιχεία δεδομένων τους. Χαρακτηριστικά ασφαλείας προσφέρει ολοκληρωμένη διαχείριση ταυτότητας με κρυπτογράφηση δεδομένων, λεπτομερείς ελέγχους πρόσβασης σε επίπεδο σειρών και στηλών και δυνατότητες απόκρυψης δεδομένων για την προστασία ευαίσθητων δεδομένων και εξουσιοδοτήσεων για τους κατάλληλους χρήστες ή ομάδες. Αυτά τα χαρακτηριστικά είναι διαθέσιμα εκτός συσκευασίας, στο τυπικό μοντέλο τιμολόγησης.

Συμπέρασμα

Συνολικά, οι πελάτες που επιλέγουν το Amazon Redshift καινοτομούν σε μια νέα πραγματικότητα όπου η αποθήκη δεδομένων κλιμακώνεται αυτόματα καθώς αλλάζει ο φόρτος εργασίας και μεγιστοποιεί την αξία των δεδομένων για όλους τους ακρογωνιαίους λίθους της επιχείρησής τους.

Για τους ηγέτες της αγοράς όπως ο Nasdaq, είναι σε θέση να απορροφούν δισεκατομμύρια σημεία δεδομένων καθημερινά για συναλλαγές και πωλήσεις σε υψηλό όγκο και ταχύτητα, εγκαίρως για σωστή τιμολόγηση και διαπραγμάτευση την επόμενη εργάσιμη ημέρα. Για πελάτες όπως η Playrix, η επιλογή Redshift Serverless σημαίνει μάρκετινγκ στους πελάτες με ολοκληρωμένα αναλυτικά στοιχεία σε σχεδόν πραγματικό χρόνο, χωρίς να κολλάτε από συντήρηση και γενικά έξοδα. Για το Stripe, σημαίνει επίσης αφαίρεση της πολυπλοκότητας και του TCO από το ETL, αφαίρεση σιλό και ενοποίηση δεδομένων.

Παρόλο που τα δεδομένα θα συνεχίσουν να αυξάνονται με πρωτοφανή ποσά, το τελικό αποτέλεσμα δεν χρειάζεται να υποφέρει. Ενώ οι ηγέτες οργανώσεων αντιμετωπίζουν τις πιέσεις της επίλυσης για βελτιστοποίηση κόστους σε όλους τους τύπους οικονομικών περιβαλλόντων, το Amazon Redshift δίνει στους ηγέτες της αγοράς τον χώρο να καινοτομούν χωρίς να θέτει σε κίνδυνο την αξία δεδομένων, την απόδοση και τους προϋπολογισμούς της αποθήκης δεδομένων cloud τους.

Μάθε περισσότερα σχετικά με τη μεγιστοποίηση της αξίας των δεδομένων σας με μια σύγχρονη αποθήκη δεδομένων όπως το Amazon Redshift. Για περισσότερες πληροφορίες σχετικά με την ηγεσία τιμής-απόδοσης του Amazon Redshift και για να ελέγξετε τα σημεία αναφοράς σε σχέση με άλλους προμηθευτές, βλ. Η Amazon Redshift συνεχίζει την ηγετική της θέση στην τιμή-απόδοση. Επιπλέον, μπορείτε να βελτιστοποιήσετε το κόστος χρησιμοποιώντας διάφορους μοχλούς απόδοσης και κόστους, συμπεριλαμβανομένου του ευέλικτου Amazon Redshift μοντέλα τιμολόγησης, οι οποίες καλύπτουν τις τιμές πληρωμής για μεταβλητούς φόρτους εργασίας, δωρεάν δοκιμές και κρατήσεις για φόρτους εργασίας σταθερής κατάστασης.


Σχετικά με τους συγγραφείς

Σάνα Αχμέντ είναι Διευθυντής μάρκετινγκ προϊόντων Sr. για το Amazon Redshift. Είναι παθιασμένη με τους ανθρώπους, τα προϊόντα και την επίλυση προβλημάτων με το μάρκετινγκ προϊόντων. Ως Product Marketer, έχει πάρει 50+ προϊόντα στην αγορά και έχει εργαστεί σε διάφορες διαφορετικές εταιρείες, συμπεριλαμβανομένων των Sprinklr, PayPal και Facebook. Τα χόμπι της περιλαμβάνουν τένις, μουσεία και διασκεδαστικές συζητήσεις με φίλους και οικογένεια.

Sunaina AbdulSalah οδηγεί το μάρκετινγκ προϊόντων για το Amazon Redshift. Επικεντρώνεται στην εκπαίδευση των πελατών σχετικά με τον αντίκτυπο της αποθήκευσης δεδομένων και των αναλυτικών στοιχείων και στην κοινή χρήση ιστοριών πελατών AWS. Έχει βαθύ υπόβαθρο στο μάρκετινγκ και τις λειτουργίες GTM στους τομείς της τεχνολογίας B2B και του cloud computing. Εκτός δουλειάς, περνά χρόνο με την οικογένεια και τους φίλους της και απολαμβάνει τα ταξίδια.

Σφραγίδα ώρας:

Περισσότερα από Μεγάλα δεδομένα AWS