Αυτό το άρθρο δημοσιεύθηκε ως μέρος του Επιστήμη δεδομένων Blogathon
Απαιτούνται εικονικά δεδομένα για διάφορους σκοπούς. Η εύρεση των απαιτούμενων δεδομένων σε μια συγκεκριμένη μορφή μπορεί να είναι δύσκολη. Αυτό το άρθρο διερευνά τους διαφορετικούς τρόπους δημιουργίας εικονικών δεδομένων χρησιμοποιώντας το πακέτο Faker Python.
Τα θέματα που καλύπτονται σε αυτό το άρθρο είναι τα εξής:
- Τι είναι τα εικονικά δεδομένα;
- Γιατί χρειαζόμαστε εικονικά δεδομένα;
- Πώς να εγκαταστήσετε το πακέτο Faker;
- Πώς να δημιουργήσετε και να αρχικοποιήσετε ένα Faker Generator;
- Πώς να δημιουργήσετε ένα όνομα, μια διεύθυνση και ένα τυχαίο κείμενο χρησιμοποιώντας το Faker;
- Πώς να δημιουργήσετε τα ίδια εικονικά δεδομένα;
- Πώς να δημιουργήσετε μοναδικά εικονικά δεδομένα;
- Πώς να δημιουργήσετε εικονικά δεδομένα που σχετίζονται με το νόμισμα χρησιμοποιώντας το Faker;
- Πώς να δημιουργήσετε τοπικά εικονικά δεδομένα χρησιμοποιώντας το Faker;
- Πώς να δημιουργήσετε ένα εικονικό σύνολο δεδομένων χρησιμοποιώντας το Faker;
- Τι είναι οι Πάροχοι;
- Χρήση γραμμής εντολών του Faker Package
- Εναλλακτικοί τρόποι δημιουργίας εικονικών δεδομένων στην Python
Τι είναι τα Dummy Data;
Τα εικονικά δεδομένα ονομάζονται επίσης τυχαία δεδομένα. Όπως υποδηλώνει το όνομα, είναι πλαστά δεδομένα που παράγονται τυχαία. Λειτουργεί ως υποκατάστατο ή σύμβολο κράτησης θέσης για τα ζωντανά δεδομένα.
Γιατί χρειαζόμαστε εικονικά δεδομένα;
Τα εικονικά δεδομένα χρησιμοποιούνται για δοκιμές και λειτουργικούς σκοπούς. Χρησιμοποιείται για να ελέγξει τι έχετε αναπτύξει και πώς ο κώδικάς σας αντιδρά σε διαφορετικά είδη εισόδων.
Στην Python, μπορεί κανείς να δημιουργήσει τα εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker. Είναι μια βιβλιοθήκη ανοιχτού κώδικα που δημιουργεί εικονικά δεδομένα πολλών διαφορετικών τύπων.
Πώς να εγκαταστήσετε το πακέτο Faker για Dummy Data;
Κάποιος μπορεί να εγκαταστήσει το πακέτο Faker χρησιμοποιώντας την εντολή pip ως εξής:
Pip install Faker
Πώς να δημιουργήσετε και να αρχικοποιήσετε μια γεννήτρια Faker;
Κάποιος μπορεί να χρησιμοποιήσει τη μέθοδο Faker() για να δημιουργήσει και να προετοιμάσει ένα Faker Generator.
από εισαγωγή faker Faker fake = Faker()
Τώρα, καθώς είστε έτοιμοι με την εγκατάσταση και την προετοιμασία μιας γεννήτριας Faker, μπορείτε να δημιουργήσετε όσα δεδομένα θέλετε.
Πώς να δημιουργήσετε ένα όνομα, μια διεύθυνση και ένα τυχαίο κείμενο χρησιμοποιώντας το Faker;
Η μέθοδος name() μπορεί να χρησιμοποιηθεί για τη δημιουργία ενός πλήρους ονόματος. Εάν θέλετε το μοναδικό όνομα ή επώνυμο αντί για το πλήρες όνομα, μπορείτε να χρησιμοποιήσετε τις μεθόδους first_name() και last_name().
Κάθε κλήση σε αυτές τις μεθόδους θα δημιουργήσει ένα τυχαίο όνομα.
Ας μεταβούμε στον κώδικα για να δούμε πώς λειτουργούν αυτές οι μέθοδοι.
fake.first_name() 'Danny'
fake.last_name() 'Riley'
fake.name() 'John Martinez'
Για τη δημιουργία διεύθυνσης και τυχαίου κειμένου, μπορείτε να χρησιμοποιήσετε τις μεθόδους διεύθυνσης() και κειμένου().
fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Εμπόριο παιχνιδιών είναι διαφορετικό. Μπορεί να υπάρχει μεταξύ του προγράμματος. Εκατομμύρια προϊόντα πιστεύουν ότι είναι μικρά και στα δύο. Ευχή φαγητού μέσα στο μακρινό βράδυ μου. Απλή μύγα διάλειμμα καριέρα ίσως».
Η παραπάνω μέθοδος text() δημιούργησε μια ενιαία παράγραφο.
Για τη δημιουργία πολλών ονομάτων, μπορείτε να βάλετε τη μέθοδο name() σε έναν βρόχο for ως εξής:
για _ στην περιοχή (10): print(fake.name())
Δρ Marissa Valencia DDS
Τζέσικα Μπερντ
Άννα Μέντεζ
Τζέσικα Ρόμπερτσον
Μάρβιν Ντάνκαν
Ρόμπερτ Γκουντ
Βαρβάρα Τζάκσον
James Faulkner
Destiny Harvey
Κριστίν Χιουζ
Πώς να δημιουργήσετε τα ίδια εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;
Σε ορισμένες περιπτώσεις, μπορεί να θέλετε να αναπαράγετε το ίδιο σύνολο δεδομένων. Είναι δυνατό με τη σπορά της γεννήτριας. Μπορείτε να χρησιμοποιήσετε τη μέθοδο seed() για να δημιουργήσετε τα ίδια εικονικά δεδομένα ως εξής:
Faker.seed(111) print(fake.first_name()) 'Κρίστι Μπέντερ'
Πώς να δημιουργήσετε μοναδικά εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;
Για να διασφαλίσετε ότι τα δημιουργούμενα εικονικά δεδομένα είναι μοναδικά, μπορείτε να χρησιμοποιήσετε την ιδιότητα .unique της γεννήτριας.
names = [fake.unique.first_name() for i in εύρος (100)]
Κάθε φορά που θα εκτελείται ο παραπάνω κώδικας, θα δημιουργεί μοναδικά 100 ονόματα.
Πώς να δημιουργήσετε εικονικά δεδομένα που σχετίζονται με το νόμισμα χρησιμοποιώντας το πακέτο Faker;
Μπορείτε να χρησιμοποιήσετε τις ακόλουθες ιδιότητες Faker() για τη δημιουργία εικονικών δεδομένων που σχετίζονται με κρυπτονομίσματα
cryptocurrency() – Δημιουργεί το όνομα του κρυπτονομίσματος και τον αντίστοιχο κωδικό του.
cryptocurrency_name() – Δημιουργεί όνομα κρυπτονομίσματος.
cryptocurrency_code() – Δημιουργεί κώδικα κρυπτονομίσματος.
Ας εφαρμόσουμε μερικές από αυτές τις ιδιότητες και ας δούμε τα αποτελέσματα.
fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ("ETC", "Ethereum Classic")
Μπορείτε να χρησιμοποιήσετε τις ακόλουθες ιδιότητες Faker() για τη δημιουργία εικονικών δεδομένων που σχετίζονται με το νόμισμα
currency() – Δημιουργεί το όνομα νομίσματος και τον αντίστοιχο κωδικό.
currency_name() – Δημιουργεί όνομα νομίσματος.
currency_code() – Δημιουργεί κωδικό νομίσματος.
fake.currency() ("TZS", "σελίνι Τανζανίας")
fake.currency_name() 'Τουρκική λίρα'
Χρήση της γραμμής εντολών του πακέτου Faker
Μετά την εγκατάσταση του πακέτου Faker, μπορείτε επίσης να το καλέσετε από τη γραμμή εντολών. Μπορείτε να γράψετε απευθείας τον κώδικα στη γραμμή εντολών.
Τι είναι οι πάροχοι;
Μέχρι στιγμής έχουμε χρησιμοποιήσει ιδιότητες γεννήτριας Faker όπως name(), first_name, last_name, address, κ.λπ. Υπάρχουν πολλές τέτοιες ιδιότητες συσκευασμένες στο 'Providers'. Ορισμένοι είναι Τυπικοί Πάροχοι ενώ άλλοι είναι Πάροχοι Κοινότητας που αναπτύχθηκαν από την κοινότητα.
Υπάρχουν πολλοί Τυπικοί πάροχοι όπως πιστωτική_κάρτα, ημερομηνία_ώρα, διαδίκτυο, άτομο, προφίλ, τράπεζα κ.λπ. που βοηθά στη δημιουργία των σχετικών εικονικών δεδομένων.
Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με την πλήρη λίστα των Τυπικών Παρόχων και τις ιδιότητές τους εδώ.
Υπάρχουν πολλοί πάροχοι κοινότητας όπως Credit Score, Air Travel, Vehicle, Music, Microservice κ.λπ. Μπορείτε επίσης να δημιουργήσετε τον πάροχο σας και να τον προσθέσετε στο πακέτο Faker.
Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με την πλήρη λίστα των παρόχων κοινότητας και τις ιδιότητές τους εδώ.
Πώς να δημιουργήσετε τοπικά εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;
Μπορείτε να δημιουργήσετε τα προσαρμοσμένα εικονικά δεδομένα παρέχοντας την απαιτούμενη τοπική ρύθμιση ως όρισμα στο Faker Generator.
Υποστηρίζει επίσης πολλαπλές τοπικές ρυθμίσεις. Σε αυτήν την περίπτωση, όλες οι τοπικές ρυθμίσεις πρέπει να παρέχονται στον τύπο δεδομένων της λίστας python.
Η προεπιλεγμένη τοπική ρύθμιση είναι "en_US", δηλαδή Αγγλικά ΗΠΑ.
Ας κωδικοποιήσουμε για να δημιουργήσουμε 10 ονόματα Χίντι.
από εισαγωγή faker Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाा मानत कुमारी खान हासन काले विक्रम रान न मंगल इन्दु गायकवाड श्री महाराज
Πώς να δημιουργήσετε ένα εικονικό σύνολο δεδομένων χρησιμοποιώντας το πακέτο Faker;
Θα δημιουργήσουμε ένα εικονικό σύνολο δεδομένων 100 ατόμων με χαρακτηριστικά όπως εργασία, εταιρεία, κατοικία, όνομα χρήστη, όνομα, διεύθυνση, τρέχουσα τοποθεσία, αλληλογραφία κ.λπ. Θα χρησιμοποιήσουμε τα "Προφίλ" τυπικού παρόχου για να δημιουργήσουμε αυτά τα δεδομένα και θα χρησιμοποιήσουμε Pandas Dataframes για αποθήκευση το.
από faker import Faker panda εισαγωγή ως pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df
Εναλλακτικοί τρόποι δημιουργίας εικονικών δεδομένων στην Python
Υπάρχουν κάποιοι άλλοι τρόποι για να δημιουργήσετε τα εικονικά δεδομένα. Είναι οι εξής:
- Fauxfactory
Μπορεί να χρησιμοποιηθεί όταν χρειάζεστε κάποια τυχαία πλαστά δεδομένα, όπως συμβολοσειρές, αριθμούς, ημερομηνίες, ώρες, IP, διευθύνσεις email κ.λπ. για γρήγορη δοκιμή του κώδικά σας. Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με αυτό εδώ.
- Χρήση τυχαίας μονάδας από τη βιβλιοθήκη Numpy στην Python
Εάν θέλετε μόνο ψευδοτυχαίους αριθμούς, τότε μπορούν να δημιουργηθούν χρησιμοποιώντας το τυχαίο πακέτο. Έχει διαφορετικές συναρτήσεις όπως rand(), randint() και Choice().
Συμπέρασμα
Μάθαμε πώς να χρησιμοποιούμε το πακέτο Faker στην Python για να δημιουργήσουμε διάφορους τύπους δεδομένων. Εξερευνήσαμε πώς να δημιουργήσουμε ονόματα, προσωπικά προφίλ, δεδομένα που σχετίζονται με το νόμισμα. Μάθαμε επίσης πώς να αναπαράγουμε τα ίδια εικονικά δεδομένα καθώς και πώς να δημιουργήσουμε τα μοναδικά δεδομένα. Εξερευνήσαμε τους παρόχους και μάθαμε επίσης ότι είναι δυνατή η δημιουργία δεδομένων για συγκεκριμένες τοπικές ρυθμίσεις.
Υπάρχουν πολλά περισσότερα που μπορούμε να κάνουμε με αυτό το πακέτο. Έχω μοιραστεί μερικά παραδείγματα δημιουργίας πλαστών δεδομένων. Ελπίζω ότι θα είναι χρήσιμο για τη δοκιμή της εφαρμογής σας και θα μειώσει τα έξοδα εύρεσης πραγματικών δεδομένων.
αναφορές:
Για περισσότερες πληροφορίες σχετικά με το Faker Package, μπορείτε να επισκεφτείτε εδώ.
Τα μέσα που εμφανίζονται σε αυτό το άρθρο δεν ανήκουν στο Analytics Vidhya και χρησιμοποιούνται κατά την κρίση του Συντάκτη.
- 100
- αεροπορικό ταξίδι
- Όλα
- analytics
- Εφαρμογή
- άρθρο
- εξουσία
- Τράπεζα
- ΚΑΛΎΤΕΡΟΣ
- κλήση
- κεφάλαιο
- Σταδιοδρομία
- περιπτώσεις
- κωδικός
- κοινότητα
- εταίρα
- δημιουργία
- μονάδες
- cryptocurrency
- Νόμισμα
- Ρεύμα
- ημερομηνία
- σύνολο δεδομένων
- Ημερομηνίες
- ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
- Αγγλικά
- κ.λπ.
- ethereum
- Ethereum Classic
- απομίμηση
- Όνομα
- τροφή
- μορφή
- πλήρη
- Πως
- Πώς να
- HTTPS
- πληροφορίες
- Internet
- IP
- IT
- Δουλειά
- άλμα
- μάθει
- Βιβλιοθήκη
- γραμμή
- Λίστα
- τοποθεσία
- Εικόνες / Βίντεο
- εκατομμύριο
- Μουσική
- ονόματα
- αριθμοί
- ΑΛΛΑ
- Άλλα
- People
- Προφίλ ⬇️
- προφίλ
- Πρόγραμμα
- περιουσία
- Python
- μείωση
- Αποτελέσματα
- Επιστήμη
- σειρά
- Shared
- Απλούς
- small
- Υποστηρίζει
- δοκιμή
- Δοκιμές
- ώρα
- εμπόριο
- ταξίδι
- us
- όχημα
- εβδομάδα
- Εργασία