Πώς να δημιουργήσετε εικονικά δεδομένα στην Python χρησιμοποιώντας το πακέτο Faker

Κόμβος πηγής: 1100261

Αυτό το άρθρο δημοσιεύθηκε ως μέρος του Επιστήμη δεδομένων Blogathon

Απαιτούνται εικονικά δεδομένα για διάφορους σκοπούς. Η εύρεση των απαιτούμενων δεδομένων σε μια συγκεκριμένη μορφή μπορεί να είναι δύσκολη. Αυτό το άρθρο διερευνά τους διαφορετικούς τρόπους δημιουργίας εικονικών δεδομένων χρησιμοποιώντας το πακέτο Faker Python.

Τα θέματα που καλύπτονται σε αυτό το άρθρο είναι τα εξής:

  • Τι είναι τα εικονικά δεδομένα;
  • Γιατί χρειαζόμαστε εικονικά δεδομένα;
  • Πώς να εγκαταστήσετε το πακέτο Faker;
  • Πώς να δημιουργήσετε και να αρχικοποιήσετε ένα Faker Generator;
  • Πώς να δημιουργήσετε ένα όνομα, μια διεύθυνση και ένα τυχαίο κείμενο χρησιμοποιώντας το Faker;
  • Πώς να δημιουργήσετε τα ίδια εικονικά δεδομένα;
  • Πώς να δημιουργήσετε μοναδικά εικονικά δεδομένα;
  • Πώς να δημιουργήσετε εικονικά δεδομένα που σχετίζονται με το νόμισμα χρησιμοποιώντας το Faker;
  • Πώς να δημιουργήσετε τοπικά εικονικά δεδομένα χρησιμοποιώντας το Faker;
  • Πώς να δημιουργήσετε ένα εικονικό σύνολο δεδομένων χρησιμοποιώντας το Faker;
  • Τι είναι οι Πάροχοι;
  • Χρήση γραμμής εντολών του Faker Package
  • Εναλλακτικοί τρόποι δημιουργίας εικονικών δεδομένων στην Python

 

Τι είναι τα Dummy Data;

Τα εικονικά δεδομένα ονομάζονται επίσης τυχαία δεδομένα. Όπως υποδηλώνει το όνομα, είναι πλαστά δεδομένα που παράγονται τυχαία. Λειτουργεί ως υποκατάστατο ή σύμβολο κράτησης θέσης για τα ζωντανά δεδομένα.

 

Γιατί χρειαζόμαστε εικονικά δεδομένα;

Τα εικονικά δεδομένα χρησιμοποιούνται για δοκιμές και λειτουργικούς σκοπούς. Χρησιμοποιείται για να ελέγξει τι έχετε αναπτύξει και πώς ο κώδικάς σας αντιδρά σε διαφορετικά είδη εισόδων.

Στην Python, μπορεί κανείς να δημιουργήσει τα εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker. Είναι μια βιβλιοθήκη ανοιχτού κώδικα που δημιουργεί εικονικά δεδομένα πολλών διαφορετικών τύπων.

 

Πώς να εγκαταστήσετε το πακέτο Faker για Dummy Data;

Κάποιος μπορεί να εγκαταστήσει το πακέτο Faker χρησιμοποιώντας την εντολή pip ως εξής:

Pip install Faker

 

Πώς να δημιουργήσετε και να αρχικοποιήσετε μια γεννήτρια Faker;

Κάποιος μπορεί να χρησιμοποιήσει τη μέθοδο Faker() για να δημιουργήσει και να προετοιμάσει ένα Faker Generator.

από εισαγωγή faker Faker fake = Faker()

Τώρα, καθώς είστε έτοιμοι με την εγκατάσταση και την προετοιμασία μιας γεννήτριας Faker, μπορείτε να δημιουργήσετε όσα δεδομένα θέλετε.

 

Πώς να δημιουργήσετε ένα όνομα, μια διεύθυνση και ένα τυχαίο κείμενο χρησιμοποιώντας το Faker;

Η μέθοδος name() μπορεί να χρησιμοποιηθεί για τη δημιουργία ενός πλήρους ονόματος. Εάν θέλετε το μοναδικό όνομα ή επώνυμο αντί για το πλήρες όνομα, μπορείτε να χρησιμοποιήσετε τις μεθόδους first_name() και last_name().

Κάθε κλήση σε αυτές τις μεθόδους θα δημιουργήσει ένα τυχαίο όνομα.

Ας μεταβούμε στον κώδικα για να δούμε πώς λειτουργούν αυτές οι μέθοδοι.

fake.first_name() 'Danny'
fake.last_name() 'Riley' 
fake.name() 'John Martinez'

Για τη δημιουργία διεύθυνσης και τυχαίου κειμένου, μπορείτε να χρησιμοποιήσετε τις μεθόδους διεύθυνσης() και κειμένου().

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Εμπόριο παιχνιδιών είναι διαφορετικό. Μπορεί να υπάρχει μεταξύ του προγράμματος. Εκατομμύρια προϊόντα πιστεύουν ότι είναι μικρά και στα δύο. Ευχή φαγητού μέσα στο μακρινό βράδυ μου. Απλή μύγα διάλειμμα καριέρα ίσως».

Η παραπάνω μέθοδος text() δημιούργησε μια ενιαία παράγραφο.

Για τη δημιουργία πολλών ονομάτων, μπορείτε να βάλετε τη μέθοδο name() σε έναν βρόχο for ως εξής:

για _ στην περιοχή (10): print(fake.name())

Δρ Marissa Valencia DDS
Τζέσικα Μπερντ
Άννα Μέντεζ
Τζέσικα Ρόμπερτσον
Μάρβιν Ντάνκαν
Ρόμπερτ Γκουντ
Βαρβάρα Τζάκσον
James Faulkner
Destiny Harvey
Κριστίν Χιουζ


 

Πώς να δημιουργήσετε τα ίδια εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;

Σε ορισμένες περιπτώσεις, μπορεί να θέλετε να αναπαράγετε το ίδιο σύνολο δεδομένων. Είναι δυνατό με τη σπορά της γεννήτριας. Μπορείτε να χρησιμοποιήσετε τη μέθοδο seed() για να δημιουργήσετε τα ίδια εικονικά δεδομένα ως εξής:

Faker.seed(111) print(fake.first_name())
'Κρίστι Μπέντερ'

 

Πώς να δημιουργήσετε μοναδικά εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;

Για να διασφαλίσετε ότι τα δημιουργούμενα εικονικά δεδομένα είναι μοναδικά, μπορείτε να χρησιμοποιήσετε την ιδιότητα .unique της γεννήτριας.

names = [fake.unique.first_name() for i in εύρος (100)]

Κάθε φορά που θα εκτελείται ο παραπάνω κώδικας, θα δημιουργεί μοναδικά 100 ονόματα.

 

Πώς να δημιουργήσετε εικονικά δεδομένα που σχετίζονται με το νόμισμα χρησιμοποιώντας το πακέτο Faker;

Μπορείτε να χρησιμοποιήσετε τις ακόλουθες ιδιότητες Faker() για τη δημιουργία εικονικών δεδομένων που σχετίζονται με κρυπτονομίσματα

cryptocurrency() – Δημιουργεί το όνομα του κρυπτονομίσματος και τον αντίστοιχο κωδικό του.

cryptocurrency_name() – Δημιουργεί όνομα κρυπτονομίσματος.

cryptocurrency_code() – Δημιουργεί κώδικα κρυπτονομίσματος.

Ας εφαρμόσουμε μερικές από αυτές τις ιδιότητες και ας δούμε τα αποτελέσματα.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ("ETC", "Ethereum Classic")

Μπορείτε να χρησιμοποιήσετε τις ακόλουθες ιδιότητες Faker() για τη δημιουργία εικονικών δεδομένων που σχετίζονται με το νόμισμα

currency() – Δημιουργεί το όνομα νομίσματος και τον αντίστοιχο κωδικό.

currency_name() – Δημιουργεί όνομα νομίσματος.

currency_code() – Δημιουργεί κωδικό νομίσματος.

fake.currency() ("TZS", "σελίνι Τανζανίας")
fake.currency_name() 'Τουρκική λίρα'

 

Χρήση της γραμμής εντολών του πακέτου Faker

Μετά την εγκατάσταση του πακέτου Faker, μπορείτε επίσης να το καλέσετε από τη γραμμή εντολών. Μπορείτε να γράψετε απευθείας τον κώδικα στη γραμμή εντολών.

 

Τι είναι οι πάροχοι;

Μέχρι στιγμής έχουμε χρησιμοποιήσει ιδιότητες γεννήτριας Faker όπως name(), first_name, last_name, address, κ.λπ. Υπάρχουν πολλές τέτοιες ιδιότητες συσκευασμένες στο 'Providers'. Ορισμένοι είναι Τυπικοί Πάροχοι ενώ άλλοι είναι Πάροχοι Κοινότητας που αναπτύχθηκαν από την κοινότητα.

Υπάρχουν πολλοί Τυπικοί πάροχοι όπως πιστωτική_κάρτα, ημερομηνία_ώρα, διαδίκτυο, άτομο, προφίλ, τράπεζα κ.λπ. που βοηθά στη δημιουργία των σχετικών εικονικών δεδομένων.

Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με την πλήρη λίστα των Τυπικών Παρόχων και τις ιδιότητές τους εδώ.

Υπάρχουν πολλοί πάροχοι κοινότητας όπως Credit Score, Air Travel, Vehicle, Music, Microservice κ.λπ. Μπορείτε επίσης να δημιουργήσετε τον πάροχο σας και να τον προσθέσετε στο πακέτο Faker.

Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με την πλήρη λίστα των παρόχων κοινότητας και τις ιδιότητές τους εδώ.

 

Πώς να δημιουργήσετε τοπικά εικονικά δεδομένα χρησιμοποιώντας το πακέτο Faker;

Μπορείτε να δημιουργήσετε τα προσαρμοσμένα εικονικά δεδομένα παρέχοντας την απαιτούμενη τοπική ρύθμιση ως όρισμα στο Faker Generator.

Υποστηρίζει επίσης πολλαπλές τοπικές ρυθμίσεις. Σε αυτήν την περίπτωση, όλες οι τοπικές ρυθμίσεις πρέπει να παρέχονται στον τύπο δεδομένων της λίστας python.

Η προεπιλεγμένη τοπική ρύθμιση είναι "en_US", δηλαδή Αγγλικά ΗΠΑ.

Ας κωδικοποιήσουμε για να δημιουργήσουμε 10 ονόματα Χίντι.

από εισαγωγή faker Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाा मानत कुमारी खान हासन काले विक्रम रान न मंगल इन्दु गायकवाड श्री महाराज

 

Πώς να δημιουργήσετε ένα εικονικό σύνολο δεδομένων χρησιμοποιώντας το πακέτο Faker;

Θα δημιουργήσουμε ένα εικονικό σύνολο δεδομένων 100 ατόμων με χαρακτηριστικά όπως εργασία, εταιρεία, κατοικία, όνομα χρήστη, όνομα, διεύθυνση, τρέχουσα τοποθεσία, αλληλογραφία κ.λπ. Θα χρησιμοποιήσουμε τα "Προφίλ" τυπικού παρόχου για να δημιουργήσουμε αυτά τα δεδομένα και θα χρησιμοποιήσουμε Pandas Dataframes για αποθήκευση το.

από faker import Faker panda εισαγωγή ως pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Ψεύτικα δεδομένα με χρήση του πακέτου Faker 1
Πηγή εικόνας: Δημιουργήθηκε από τον συγγραφέα

 

 

Εναλλακτικοί τρόποι δημιουργίας εικονικών δεδομένων στην Python

Υπάρχουν κάποιοι άλλοι τρόποι για να δημιουργήσετε τα εικονικά δεδομένα. Είναι οι εξής:

  • Fauxfactory

    Μπορεί να χρησιμοποιηθεί όταν χρειάζεστε κάποια τυχαία πλαστά δεδομένα, όπως συμβολοσειρές, αριθμούς, ημερομηνίες, ώρες, IP, διευθύνσεις email κ.λπ. για γρήγορη δοκιμή του κώδικά σας. Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με αυτό εδώ.

  • Χρήση τυχαίας μονάδας από τη βιβλιοθήκη Numpy στην Python

    Εάν θέλετε μόνο ψευδοτυχαίους αριθμούς, τότε μπορούν να δημιουργηθούν χρησιμοποιώντας το τυχαίο πακέτο. Έχει διαφορετικές συναρτήσεις όπως rand(), randint() και Choice().

Συμπέρασμα

Μάθαμε πώς να χρησιμοποιούμε το πακέτο Faker στην Python για να δημιουργήσουμε διάφορους τύπους δεδομένων. Εξερευνήσαμε πώς να δημιουργήσουμε ονόματα, προσωπικά προφίλ, δεδομένα που σχετίζονται με το νόμισμα. Μάθαμε επίσης πώς να αναπαράγουμε τα ίδια εικονικά δεδομένα καθώς και πώς να δημιουργήσουμε τα μοναδικά δεδομένα. Εξερευνήσαμε τους παρόχους και μάθαμε επίσης ότι είναι δυνατή η δημιουργία δεδομένων για συγκεκριμένες τοπικές ρυθμίσεις.

Υπάρχουν πολλά περισσότερα που μπορούμε να κάνουμε με αυτό το πακέτο. Έχω μοιραστεί μερικά παραδείγματα δημιουργίας πλαστών δεδομένων. Ελπίζω ότι θα είναι χρήσιμο για τη δοκιμή της εφαρμογής σας και θα μειώσει τα έξοδα εύρεσης πραγματικών δεδομένων.

 

αναφορές:

Για περισσότερες πληροφορίες σχετικά με το Faker Package, μπορείτε να επισκεφτείτε εδώ.

Τα μέσα που εμφανίζονται σε αυτό το άρθρο δεν ανήκουν στο Analytics Vidhya και χρησιμοποιούνται κατά την κρίση του Συντάκτη.

Πηγή: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Σφραγίδα ώρας:

Περισσότερα από Ανάλυση Vidhya