Kako ustvariti lažne podatke v Pythonu z uporabo paketa Faker

Izvorno vozlišče: 1100261

Ta članek je bil objavljen kot del Blogathon o znanosti o podatkih

Lažni podatki so potrebni za različne namene. Iskanje zahtevanih podatkov v določeni obliki je lahko težavno. Ta članek raziskuje različne načine ustvarjanja lažnih podatkov s paketom Faker v Python.

V tem članku so obravnavane naslednje teme:

  • Kaj so lažni podatki?
  • Zakaj potrebujemo lažne podatke?
  • Kako namestiti Faker paket?
  • Kako ustvariti in inicializirati generator ponaredkov?
  • Kako ustvariti ime, naslov in naključno besedilo s pomočjo Fakerja?
  • Kako ustvariti iste lažne podatke?
  • Kako ustvariti edinstvene lažne podatke?
  • Kako ustvariti lažne podatke, povezane z valuto, s pomočjo Fakerja?
  • Kako ustvariti lokalizirane lažne podatke z uporabo Fakerja?
  • Kako ustvariti lažni nabor podatkov s pomočjo Fakerja?
  • Kaj so ponudniki?
  • Uporaba paketa Faker v ukazni vrstici
  • Nadomestni načini ustvarjanja lažnih podatkov v Pythonu

 

Kaj so lažni podatki?

Lažne podatke imenujemo tudi naključni podatki. Kot že ime pove, so naključno ustvarjeni lažni podatki. Deluje kot nadomestek ali namestnik za podatke v živo.

 

Zakaj potrebujemo lažne podatke?

Lažni podatki se uporabljajo za preskušanje in operativne namene. Uporablja se za testiranje tega, kar ste razvili, in kako se vaša koda odziva na različne vrste vnosov.

V Pythonu lahko lažne podatke ustvarite s paketom Faker. Je odprtokodna knjižnica, ki ustvarja lažne podatke različnih vrst.

 

Kako namestiti Faker paket za lažne podatke?

Paket Faker lahko namestite z ukazom pip na naslednji način:

Pip namestitev Faker

 

Kako ustvariti in inicializirati generator ponaredkov?

Za ustvarjanje in inicializacijo generatorja ponaredkov lahko uporabite metodo Faker ().

iz lažnega uvoza Faker fake = Faker ()

Zdaj, ko ste pripravljeni na namestitev in inicializacijo generatorja Faker, lahko ustvarite poljubne podatke.

 

Kako ustvariti ime, naslov in naključno besedilo s pomočjo Fakerja?

Metodo name () lahko uporabite za ustvarjanje polnega imena. Če želite edino ime ali priimek namesto polnega imena, lahko uporabite metodi first_name () in priimek ().

Vsak klic teh metod bo ustvaril naključno ime.

Pojdimo v kodo, da vidimo, kako te metode delujejo.

fake.first_name () 'Danny'
fake.last_name () 'Riley' 
fake.name () 'John Martinez'

Za ustvarjanje naslova in naključnega besedila lahko uporabite metode naslov () in besedilo ().

fake.address () '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text () 'Trgovina z igrami je drugačna. Med programi je lahko. Milijon pridelkov je v obeh primerih majhen. N Najboljši teden povejte kapitalski oblasti. Moja želja po hrani daleč zvečer. Morda enostavna kariera muhe. '

Zgoraj navedena metoda text () je ustvarila en sam odstavek.

Za ustvarjanje več imen lahko metodo name () vstavite v zanko for na naslednji način:

za _ v dosegu (10): print (fake.name ())

Dr. Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Robert Dobro
Barbara Jackson
James Faulkner
Usoda Harvey
Christine Hughes


 

Kako z lažnim paketom ustvariti iste lažne podatke?

V nekaterih primerih boste morda želeli reproducirati isti nabor podatkov. To je mogoče s setvijo generatorja. Za izdelavo istih lažnih podatkov lahko uporabite metodo seed ():

Faker.seed (111) print (fake.first_name ())
'Christy Bender'

 

Kako ustvariti edinstvene lažne podatke z uporabo paketa Faker?

Če želite zagotoviti, da so ustvarjeni lažni podatki edinstveni, lahko uporabite lastnost .unique generatorja.

imena = [fake.unique.first_name () za i in obseg (100)]

Vsakič, ko bo zgornja koda izvedena, bo ustvarila edinstvenih 100 imen.

 

Kako z lažnim paketom ustvariti lažne podatke, povezane z valuto?

Za ustvarjanje lažnih podatkov, povezanih s kriptovalutami, lahko uporabite naslednje lastnosti Faker ()

cryptocurrency () - Ustvari ime kriptovalute in ustrezno kodo.

cryptocurrency_name () - Ustvari ime cryptocurrency.

cryptocurrency_code () - Ustvari kodo cryptocurrency.

Izvedimo nekatere od teh lastnosti in poglejmo rezultate.

fake.cryptocurrency_name () 'Bitcoin'
fake.cryptocurrency () ('ETC', 'Ethereum Classic')

Za ustvarjanje lažnih podatkov, povezanih z valutami, lahko uporabite naslednje lastnosti Faker ()

currency () - Ustvari ime valute in ustrezno kodo.

currency_name () - Ustvari ime valute.

currency_code () - Ustvari kodo valute.

fake.currency () ('TZS', 'Tanzanijski šiling')
fake.currency_name () 'turška lira'

 

Uporaba paketa Faker v ukazni vrstici

Po namestitvi paketa Faker ga lahko prikličete tudi iz ukazne vrstice. Kodo lahko neposredno napišete v ukazni poziv.

 

Kaj so ponudniki?

Doslej smo uporabljali lastnosti generatorja Faker, kot so ime (), ime_priimka, priimek, naslov itd. Obstaja veliko takih lastnosti, zapakiranih v 'Ponudniki'. Nekateri so standardni ponudniki, drugi pa ponudniki skupnosti, ki jih je razvila skupnost.

Obstaja veliko standardnih ponudnikov, kot so kreditna kartica, datum_čas, internet, oseba, profil, banka itd., Ki pomagajo pri ustvarjanju ustreznih lažnih podatkov.

Več informacij o celotnem seznamu standardnih ponudnikov in njihovih lastnostih lahko najdete tukaj.

Obstaja veliko ponudnikov skupnosti, kot so kreditna ocena, letalska potovanja, vozila, glasba, mikro storitve itd. Lahko tudi ustvarite svojega ponudnika in ga dodate v paket Faker.

Več informacij o celotnem seznamu ponudnikov skupnosti in njihovih lastnostih lahko najdete tukaj.

 

Kako ustvariti lokalizirane lažne podatke z uporabo paketa Faker?

Lokalizirane lažne podatke lahko ustvarite tako, da podate zahtevano področno nastavitev kot argument Faker Generatorju.

Podpira tudi več področij. V tem primeru je treba vse področne nastavitve navesti v podatkovnem tipu seznama python.

Privzeta področna nastavitev je "en_US", tj. Ameriška angleščina.

Kodirajmo, da ustvarimo 10 hindujskih imen.

iz lažnega uvoza Faker fake = Faker ('hi_IN') za _ v obsegu (10): print (fake.name ())
्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगलइ गायकव

 

Kako z lažnim paketom ustvariti lažne nabore podatkov?

Ustvarili bomo lažni nabor podatkov 100 ljudi z atributi, kot so služba, podjetje, prebivališče, uporabniško ime, ime, naslov, trenutna lokacija, pošta itd. Za ustvarjanje teh podatkov bomo uporabili standardne ponudnike 'Profili' in za shranjevanje uporabili podatkovne okvire Pandas to.

iz lažnega uvoza Faker uvoz pand kot pd ponaredek = Faker () profileData = [fake.profile () za i v območju (100)] df = pd.DataFrame (profileData) df

 

Lažni podatki z uporabo paketa Faker 1
Vir slike: Ustvaril avtor

 

 

Nadomestni načini ustvarjanja lažnih podatkov v Pythonu

Obstaja še nekaj drugih načinov za ustvarjanje lažnih podatkov. Ti so naslednji:

  • Fauxfactory

    Uporabite ga lahko, ko potrebujete nekaj naključnih ponarejenih podatkov, kot so nizovi, številke, datumi, časi, IP, e -poštni naslovi itd., Za hitro testiranje kode. Več informacij o tem lahko najdete tukaj.

  • Uporaba modula Random iz knjižnice Numpy v Pythonu

    Če želite le psevdonaključna števila, jih lahko ustvarite s pomočjo naključnega paketa. Ima različne funkcije, kot so rand (), randint () in choice ().

zaključek

Naučili smo se, kako uporabiti paket Faker v Pythonu za ustvarjanje različnih vrst podatkov. Raziskali smo, kako ustvariti imena, osebne profile, podatke o valuti. Naučili smo se tudi, kako reproducirati iste lažne podatke in kako ustvariti edinstvene podatke. Raziskali smo ponudnike in tudi izvedeli, da je mogoče ustvariti podatke, značilne za določeno lokacijo.

S tem paketom lahko storimo še veliko več. Delil sem nekaj primerov ustvarjanja lažnih podatkov. Upam, da bo koristno za preizkušanje vaše aplikacije in zmanjšalo stroške iskanja resničnih podatkov.

 

Reference:

Za več informacij o paketu Faker obiščite tukaj.

Mediji, prikazani v tem članku, niso v lasti Analytics Vidhya in se uporabljajo po presoji avtorja.

Vir: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Časovni žig:

Več od Analitika Vidhya