Kuidas luua Pythonis näivaid andmeid võltsimispaketi abil

Allikasõlm: 1100261

See artikkel avaldati osana Andmeteaduse ajaveebi

Näidisandmeid on vaja erinevatel eesmärkidel. Vajalike andmete leidmine kindlas vormingus võib olla keeruline. Selles artiklis uuritakse erinevaid viise näivate andmete loomiseks, kasutades Fakeri paketti Python.

Selles artiklis käsitletavad teemad on järgmised:

  • Mis on näivandmed?
  • Miks me vajame näivaid andmeid?
  • Kuidas võltsimispaketti installida?
  • Kuidas võltsimisgeneraatorit luua ja lähtestada?
  • Kuidas luua Fakeri abil nime, aadressi ja juhuslikku teksti?
  • Kuidas luua samu näivaid andmeid?
  • Kuidas luua ainulaadseid näivaid andmeid?
  • Kuidas luua valuutaga seotud näivaid andmeid Fakeri abil?
  • Kuidas luua fakeri abil lokaliseeritud näivaid andmeid?
  • Kuidas luua näivat andmestikku Fakeri abil?
  • Mis on pakkujad?
  • Faker Package'i käsurea kasutamine
  • Alternatiivsed viisid näivate andmete loomiseks Pythonis

 

Mis on näivandmed?

Näilikke andmeid nimetatakse ka juhuslikeks andmeteks. Nagu nimigi ütleb, genereeritakse juhuslikult võltsandmed. See toimib reaalajas andmete asendajana või kohahoidjana.

 

Miks me vajame näivaid andmeid?

Näidisandmeid kasutatakse testimiseks ja tööks. Seda kasutatakse selleks, et testida, mida olete välja töötanud ja kuidas teie kood reageerib erinevat tüüpi sisenditele.

Pythonis saab näivaid andmeid luua paketi Faker abil. See on avatud lähtekoodiga teek, mis genereerib mitut erinevat tüüpi näivaid andmeid.

 

Kuidas installida valeandmete võltsimispaketti?

Fakeri paketi saab installida pip käsu abil järgmiselt:

Pip install Faker

 

Kuidas luua ja initsialiseerida võltsimisgeneraatorit?

Fakeri generaatori loomiseks ja lähtestamiseks saab kasutada meetodit Faker().

võltsitud impordist Faker fake = võlts()

Nüüd, kui olete Fakeri generaatori installimiseks ja lähtestamiseks valmis, saate luua mis tahes soovitud andmeid.

 

Kuidas luua võltsimise abil nime, aadressi ja juhuslikku teksti?

Meetodit name() saab kasutada täisnime loomiseks. Kui soovite täisnime asemel ainsat ees- või perekonnanime, võite kasutada meetodeid ees_nimi() ja perekonnanimi().

Iga kõne nendele meetoditele loob juhusliku nime.

Hüppame koodi sisse, et näha, kuidas need meetodid töötavad.

fake.first_name() 'Danny'
fake.last_name() 'Riley' 
fake.name() 'John Martinez'

Aadressi ja juhusliku teksti loomiseks saate kasutada aadressi () ja text () meetodeid.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Mängukaubandus ta erinev. Saab programmide vahel. Miljon toodangut usun, et väike mööda nii.nCost parim nädal öelda kapitali ametiasutus. Toidusoov minu sees kaugel õhtul. Lihtne kärbestõus karjäär võib-olla.

Ülaltoodud meetod text() lõi ühe lõigu.

Mitme nime loomiseks saate meetodi name() tsüklisse panna järgmiselt:

_ jaoks vahemikus (10): print(fake.name())

Dr Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Robert Hea
Barbara Jackson
James Faulkner
Saatus Harvey
Christine Hughes


 

Kuidas luua samu näivaid andmeid võltsimispaketi abil?

Mõnel juhul võite soovida sama andmestiku taasesitada. See on võimalik generaatori külvamisega. Saate kasutada meetodit seed() samade näivate andmete saamiseks järgmiselt.

Faker.seed(111) print(fake.first_name())
'Christy Bender'

 

Kuidas luua unikaalseid näivandmeid võltsimispaketi abil?

Tagamaks, et loodud näivandmed on kordumatud, võite kasutada generaatori atribuuti .unique.

nimed = [võlts.unikaalne.eesnimi() eest i in vahemik(100)]

Iga kord, kui ülaltoodud kood käivitatakse, genereerib see korduma 100 nime.

 

Kuidas luua valuutaga seotud näivaid andmeid võltsimispaketi abil?

Krüptovaluutaga seotud näivate andmete loomiseks saate kasutada järgmisi Faker() atribuute

cryptocurrency() – loob krüptovaluuta nime ja sellele vastava koodi.

cryptocurrency_name() – loob krüptovaluuta nime.

cryptocurrency_code() – see loob krüptovaluuta koodi.

Rakendame mõnda neist omadustest ja vaatame tulemusi.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

Valuutaga seotud näivate andmete loomiseks saate kasutada järgmisi Faker() atribuute

valuuta() – loob valuuta nime ja sellele vastava koodi.

valuuta_nimi() – loob valuuta nime.

valuuta_kood() – loob valuutakoodi.

fake.currency() ('TZS', 'Tansaania šilling')
fake.currency_name() 'Türgi liir'

 

Faker-paketi käsurea kasutamine

Pärast Fakeri paketi installimist saate selle käivitada ka käsurealt. Saate koodi otse käsureale kirjutada.

 

Mis on pakkujad?

Siiani oleme kasutanud Fakeri generaatori atribuute nagu nimi(), eesnimi, perekonnanimi, aadress jne. Selliseid atribuute on 'Pakkujad' pakitud palju. Mõned neist on standardsed pakkujad, teised aga kogukonna välja töötatud kogukonna pakkujad.

On palju standardteenuse pakkujaid, nagu krediitkaart, kuupäeva_kellaaeg, internet, isik, profiil, pank jne, mis aitavad luua asjakohaseid näivaid andmeid.

Lisateavet standardpakkujate ja nende atribuutide täieliku loendi kohta leiate siin.

On palju kogukonnateenuse pakkujaid, nagu krediidiskoor, lennureisid, sõiduk, muusika, mikroteenus jne. Samuti saate luua oma teenusepakkuja ja lisada selle Fakeri paketti.

Lisateavet kogukonna pakkujate ja nende atribuutide täieliku loendi kohta leiate siin.

 

Kuidas luua võltsimispaketi abil lokaliseeritud näivaid andmeid?

Lokaliseeritud näivaid andmeid saate luua, esitades võltsimisgeneraatorile argumendina vajaliku lokaadi.

See toetab ka mitut asukohta. Sel juhul tuleb pythoni loendi andmetüübis esitada kõik lokaadid.

Vaikimisi lokaat on 'en_US' ehk USA inglise keel.

Kodeerime, et luua 10 hindi nime.

from faker import Faker fake = Faker('hi_IN') for _ vahemikus (10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महानराा मानत कुमारी खान हासन काले विक्रम राऍरम र඾त न मंगल इन्दु गायकवाड श्री महाराज

 

Kuidas luua näiv andmestik võltsimispaketi abil?

Loome 100 inimesest koosneva näiva andmekogumi atribuutidega nagu töökoht, ettevõte, elukoht, kasutajanimi, nimi, aadress, praegune asukoht, post jne. Kasutame nende andmete loomiseks standardpakkuja 'profiile' ja salvestamiseks Pandase andmekaare seda.

from faker import Faker import pandad pd-na fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Näidisandmed, kasutades võltsimispaketti 1
Pildi allikas: Autor: Autor

 

 

Alternatiivsed viisid näivate andmete loomiseks Pythonis

Näidisandmete loomiseks on ka teisi viise. Need on järgmised:

  • Fauxfactory

    Seda saab kasutada, kui vajate oma koodi kiireks testimiseks juhuslikke võltsandmeid, nagu stringid, numbrid, kuupäevad, kellaajad, IP, e-posti aadressid jne. Selle kohta leiate lisateavet siin.

  • Juhusliku mooduli kasutamine Pythonis Numpy teegist

    Kui soovite ainult pseudojuhuslikke numbreid, saab need genereerida juhusliku paketi abil. Sellel on erinevad funktsioonid, nagu rand(), randint() ja choice().

Järeldus

Õppisime kasutama Pythonis Fakeri paketti erinevat tüüpi andmete loomiseks. Uurisime, kuidas luua nimesid, isiklikke profiile ja valuutaga seotud andmeid. Samuti õppisime, kuidas reprodutseerida samu näivaid andmeid ja kuidas genereerida ainulaadseid andmeid. Uurisime pakkujaid ja saime ka teada, et on võimalik luua lokaadipõhiseid andmeid.

Selle paketiga saame veel palju teha. Olen jaganud paar näidet võltsandmete genereerimisest. Loodan, et see on kasulik teie rakenduse testimisel ja vähendab tegelike andmete leidmise kulusid.

 

viited:

Fakeri paketi kohta lisateabe saamiseks külastage siin.

Selles artiklis näidatud meediumid ei kuulu Analytics Vidhyale ja neid kasutatakse autori äranägemisel.

Allikas: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Ajatempel:

Veel alates Analüütika Vidhya