Cum se creează date false în Python utilizând pachetul Faker

Nodul sursă: 1100261

Acest articol a fost publicat ca parte a Blogathon Data Science

Datele fictive sunt necesare pentru o varietate de scopuri. Găsirea datelor necesare într-un anumit format poate fi dificilă. Acest articol explorează diferitele modalități de a crea date fictive folosind pachetul Faker în Piton.

Subiectele abordate în acest articol sunt următoarele:

  • Ce sunt datele fictive?
  • De ce avem nevoie de date false?
  • Cum se instalează pachetul Faker?
  • Cum să creați și să inițializați un generator Faker?
  • Cum se creează un nume, o adresă și un text aleatoriu folosind Faker?
  • Cum se creează aceleași date false?
  • Cum se creează date inactiv unice?
  • Cum se creează date fictive legate de monedă folosind Faker?
  • Cum se creează date fictive localizate folosind Faker?
  • Cum se creează un set de date inactiv folosind Faker?
  • Ce sunt Furnizorii?
  • Utilizarea liniei de comandă a pachetului Faker
  • Modalități alternative de a crea date fictive în Python

 

Ce sunt datele false?

Datele fictive se mai numesc și date aleatorii. După cum sugerează și numele, datele false sunt generate aleatoriu. Acesta acționează ca un substitut sau substituent pentru datele live.

 

De ce avem nevoie de date false?

Datele fictive sunt utilizate în scopuri de testare și operaționale. Este folosit pentru a testa ceea ce ați dezvoltat și modul în care codul dumneavoastră reacționează la diferite tipuri de intrări.

În Python, se pot crea date fictive folosind pachetul Faker. Este o bibliotecă open-source care generează date fictive de multe tipuri diferite.

 

Cum se instalează pachetul Faker pentru date false?

Se poate instala pachetul Faker folosind comanda pip după cum urmează:

Pip instalează Faker

 

Cum să creați și să inițializați un generator fals?

Se poate folosi metoda Faker() pentru a crea și inițializa un Generator Faker.

din import fals Fals fals = Fals()

Acum, pe măsură ce sunteți gata cu instalarea și inițializarea unui generator Faker, puteți crea orice date doriți.

 

Cum să creezi un nume, o adresă și un text aleatoriu folosind Faker?

Metoda name() poate fi folosită pentru a crea un nume complet. Dacă doriți un singur prenume sau prenume în loc de numele complet, puteți utiliza metodele first_name() și last_name().

Fiecare apel la aceste metode va genera un nume aleatoriu.

Să intrăm în cod pentru a vedea cum funcționează aceste metode.

fake.first_name() „Danny”
fake.last_name() „Riley” 
fake.name() „John Martinez”

Pentru a crea adrese și text aleatoriu, puteți utiliza metodele address() și text().

fake.address() „4843 Gordon Field Suite 617nSouth Karen, SC 39850”
fake.text() „Comerțul jocului este diferit. Există între programe. Milioane de produse cred că sunt mici de-a lungul ambelor. Dorință de mâncare în seara mea. Poate o carieră simplă de pauză.

Metoda text() de mai sus a creat un singur paragraf.

Pentru a crea mai multe nume, puteți pune metoda name() într-o buclă for după cum urmează:

pentru _ în interval (10): print(fake.name())

Dr. Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Robert Bun
Barbara Jackson
James Faulkner
Destinul Harvey
Christine Hughes


 

Cum să creezi aceleași date false folosind pachetul Faker?

În unele cazuri, este posibil să doriți să reproduceți același set de date. Este posibil prin însămânțarea generatorului. Puteți utiliza metoda seed() pentru a produce aceleași date fictive, după cum urmează:

Faker.seed(111) print(fake.first_name())
'Christy Bender'

 

Cum se creează date unice dumy folosind pachetul Faker?

Pentru a vă asigura că datele fictive generate sunt unice, puteți utiliza proprietatea .unique a generatorului.

nume = [fake.unique.first_name() pentru i in interval (100)]

De fiecare dată, codul de mai sus va fi executat, acesta va genera 100 de nume unice.

 

Cum se creează date simulate legate de monedă folosind pachetul Faker?

Puteți utiliza următoarele proprietăți Faker() pentru a crea date fictive legate de criptomonede

cryptocurrency() – creează numele criptomonedei și codul corespunzător.

cryptocurrency_name() – creează numele criptomonedei.

cryptocurrency_code() – creează codul criptomonedei.

Să implementăm unele dintre aceste proprietăți și să vedem rezultatele.

fake.cryptocurrency_name() „Bitcoin”
fake.cryptocurrency() („ETC”, „Ethereum Classic”)

Puteți utiliza următoarele proprietăți Faker() pentru a crea date fictive legate de monedă

currency() – creează numele monedei și codul corespunzător.

currency_name() – Creează un nume de monedă.

currency_code() – creează codul monedei.

fake.currency() („TZS”, „șiling tanzanian”)
fake.currency_name() „liră turcească”

 

Utilizarea în linia de comandă a pachetului Faker

După instalarea pachetului Faker, îl puteți invoca și din linia de comandă. Puteți scrie direct codul la promptul de comandă.

 

Ce sunt furnizorii?

Până acum am folosit proprietăți ale generatorului Faker, cum ar fi name(), first_name, last_name, address, etc. Există multe astfel de proprietăți ambalate în „Providers”. Unii sunt furnizori standard, în timp ce alții sunt furnizori comunitari dezvoltați de comunitate.

Există mulți Furnizori standard, cum ar fi credit_card, data_time, internet, person, profile, bank etc., care ajută la crearea datelor false relevante.

Puteți găsi mai multe informații despre lista completă a Furnizorilor standard și proprietățile acestora aici.

Există mulți Furnizori comunitari, cum ar fi Scorul de credit, Călătoriile aeriene, Vehiculele, Muzica, Microserviciul etc. Puteți, de asemenea, să vă creați furnizorul și să îl adăugați la pachetul Faker.

Puteți găsi mai multe informații despre lista completă a Furnizorilor comunitari și proprietățile acestora aici.

 

Cum se creează date false localizate folosind pachetul Faker?

Puteți crea datele fictive localizate furnizând localitatea necesară ca argument pentru Faker Generator.

De asemenea, acceptă mai multe locații. În acest caz, toate localitățile trebuie furnizate în tipul de date python list.

Localitatea implicită este „en_US”, adică engleza SUA.

Să codificăm pentru a crea 10 nume hindi.

din import fals Fals fals = Faker('hi_IN') pentru _ în interval (10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु ग्रमाड श्री महासन

 

Cum se creează un set de date simulat folosind pachetul Faker?

Vom crea un set de date inactiv de 100 de persoane cu atribute precum job, companie, reședință, nume de utilizator, nume, adresă, locația curentă, e-mail etc. Vom folosi „Profile” furnizorului standard pentru a crea aceste date și vom folosi Pandas Dataframes pentru a salva aceasta.

de la import fals Importați panda falși ca pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Date fictive folosind pachetul Faker 1
Sursa imagine: Creat de autor

 

 

Modalități alternative de a crea date false în Python

Există și alte modalități de a crea datele fictive. Acestea sunt după cum urmează:

  • Fauxfactory

    Poate fi folosit atunci când aveți nevoie de date false aleatorii, cum ar fi șiruri, numere, date, ore, IP, adrese de e-mail etc. pentru testarea rapidă a codului. Puteți găsi mai multe informații despre acesta aici.

  • Folosind modul aleatoriu din biblioteca Numpy în Python

    Dacă doriți doar numere pseudoaleatoare, atunci acestea pot fi generate folosind pachetul aleatoriu. Are diferite funcții precum rand(), randint() și choice().

Concluzie

Am învățat cum să folosim pachetul Faker în Python pentru a crea diferite tipuri de date. Am explorat cum să creăm nume, profiluri personale, date legate de monedă. De asemenea, am învățat cum să reproducem aceleași date fictive, precum și cum să generăm datele unice. Am explorat furnizorii și am aflat, de asemenea, că este posibil să creăm date specifice locației.

Putem face mult mai multe cu acest pachet. Am împărtășit câteva exemple de generare de date false. Sper că va fi util pentru testarea aplicației dvs. și pentru a reduce cheltuielile generale legate de găsirea datelor reale.

 

Referinte:

Pentru mai multe informații despre pachetul Faker, puteți vizita aici.

Mediile prezentate în acest articol nu sunt deținute de Analytics Vidhya și sunt utilizate la discreția autorului.

Sursa: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Timestamp-ul:

Mai mult de la Analize Vidhya