Dummy adatok létrehozása Pythonban a Faker csomag használatával

Forrás csomópont: 1100261

Ez a cikk részeként jelent meg Adattudományi Blogaton

Az áladatokra különféle célokra van szükség. Egy adott formátumban nehéz lehet megtalálni a szükséges adatokat. Ez a cikk az áladatok létrehozásának különböző módjait mutatja be a Faker csomag használatával Piton.

A cikkben tárgyalt témák a következők:

  • Mi az a hamis adat?
  • Miért van szükségünk áladatokra?
  • Hogyan telepítsem a Faker csomagot?
  • Hogyan lehet létrehozni és inicializálni egy Faker Generatort?
  • Hogyan lehet nevet, címet és véletlenszerű szöveget létrehozni a Faker segítségével?
  • Hogyan lehet létrehozni ugyanazokat a dummy adatokat?
  • Hogyan készítsünk egyedi áladatokat?
  • Hogyan készítsünk pénznemhez kapcsolódó áladatokat a Faker segítségével?
  • Hogyan készítsünk honosított áladatokat a Faker használatával?
  • Hogyan lehet áladatkészletet létrehozni a Faker segítségével?
  • Mik azok a Szolgáltatók?
  • A Faker Package parancssori használata
  • Alternatív módjai az áladatok létrehozásának Pythonban

 

Mi az a Dummy Data?

Az áladatokat véletlenszerű adatoknak is nevezik. Ahogy a neve is sugallja, hamis adatokról van szó, amelyeket véletlenszerűen generálnak. Az élő adatok helyettesítőjeként vagy helyőrzőjeként működik.

 

Miért van szükségünk áladatokra?

Az áladatokat tesztelési és működési célokra használjuk. Arra használják, hogy teszteljék, mit fejlesztettek ki, és hogyan reagál a kód a különböző típusú bemenetekre.

A Pythonban az áladatokat a Faker csomag segítségével lehet létrehozni. Ez egy nyílt forráskódú könyvtár, amely sokféle típusú áladatot állít elő.

 

Hogyan kell telepíteni a hamisító csomagot a Dummy Data számára?

A Faker csomag a pip paranccsal a következőképpen telepíthető:

Pip telepítés Faker

 

Hogyan lehet létrehozni és inicializálni egy hamisító generátort?

A Faker() metódus használható Faker Generator létrehozására és inicializálására.

from faker import Faker fake = Faker()

Most, amikor készen áll a Faker generátor telepítésére és inicializálására, bármilyen kívánt adatot létrehozhat.

 

Hogyan hozzunk létre nevet, címet és véletlenszerű szöveget a Faker használatával?

A name() metódussal teljes név hozható létre. Ha a teljes név helyett az egyetlen keresztnevet vagy vezetéknevet szeretné használni, használhatja a keresztnév() és vezetéknév() metódusokat.

Ezeknek a metódusoknak minden hívása véletlenszerű nevet generál.

Ugorjunk bele a kódba, hogy lássuk, hogyan működnek ezek a módszerek.

fake.first_name() 'Danny'
fake.last_name() 'Riley' 
fake.name() 'John Martinez'

Cím és véletlenszerű szöveg létrehozásához az address() és text() metódusokat használhatjuk.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'A játékkereskedelem más. Lehet program között. Millió termés hisz kicsi mentén mind.nKöltség legjobb hét mondani tőkehatóság. Élelmiszer kívánság belsejében messzi estém. Talán egy egyszerű repülési karrier.

A fenti text() metódus egyetlen bekezdést hozott létre.

Több név létrehozásához a name() metódust for ciklusba helyezheti az alábbiak szerint:

_ tartományban(10): print(fake.name())

Dr. Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Robert Good
Barbara Jackson
James Faulkner
Destiny Harvey
Christine Hughes


 

Hogyan lehet létrehozni ugyanazokat a dummy adatokat a Faker Package használatával?

Bizonyos esetekben előfordulhat, hogy ugyanazt az adatkészletet szeretné reprodukálni. Ez a generátor vetésével lehetséges. A seed() metódussal ugyanazokat a fiktív adatokat állíthatja elő az alábbiak szerint:

Faker.seed(111) print(fake.first_name())
'Christy Bender'

 

Hogyan készítsünk egyedi dummy adatokat a hamisító csomag használatával?

Annak biztosítására, hogy a generált áladatok egyediek legyenek, használhatja a generátor .unique tulajdonságát.

nevek = [hamis.unique.first_name() mert i in tartomány(100)]

Minden alkalommal, amikor a fenti kód végrehajtásra kerül, egyedi 100 nevet generál.

 

Hogyan készítsünk pénznemhez kapcsolódó áladatokat hamisító csomag használatával?

A következő Faker() tulajdonságokat használhatja a kriptovalutákkal kapcsolatos áladatok létrehozásához

cryptocurrency() – létrehozza a kriptovaluta nevét és a hozzá tartozó kódot.

cryptocurrency_name() – létrehoz egy kriptovaluta nevet.

cryptocurrency_code() – kriptovaluta kódot hoz létre.

Valósítsunk meg néhány ilyen tulajdonságot, és nézzük meg az eredményeket.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

A következő Faker() tulajdonságokat használhatja pénznemekkel kapcsolatos áladatok létrehozásához

currency() – Létrehozza a pénznem nevét és a hozzá tartozó kódot.

pénznem_neve() – Létrehozza a pénznemnevet.

valuta_kód() – Pénznemkódot hoz létre.

fake.currency() ('TZS', 'tanzániai shilling')
fake.currency_name() 'török ​​líra'

 

A hamisító csomag parancssori használata

A Faker csomag telepítése után a parancssorból is meghívhatja. A kódot közvetlenül a parancssorba írhatja.

 

Mik azok a szolgáltatók?

Eddig olyan Faker generátor tulajdonságokat használtunk, mint a name(), keresztnév, vezetéknév, cím stb. Sok ilyen tulajdonság van a „szolgáltatók”-ban csomagolva. Egyesek szabványos szolgáltatók, míg mások közösségi szolgáltatók, amelyeket a közösség fejlesztett ki.

Számos szabványos szolgáltató létezik, mint például a hitelkártya, dátum_idő, internet, személy, profil, bank stb., amelyek segítik a releváns áladatok létrehozását.

További információkat talál a szabványos szolgáltatók teljes listájáról és tulajdonságaikról itt.

Számos közösségi szolgáltató létezik, mint például a Credit Score, a Air Travel, a Vehicle, a Music, a Microservice stb. Létrehozhatja saját szolgáltatóját, és hozzáadhatja a Faker csomaghoz.

További információkat talál a Közösségi Szolgáltatók teljes listájáról és tulajdonságaikról itt.

 

Hogyan hozzunk létre honosított áladatokat hamisító csomag használatával?

A honosított áladatokat úgy hozhatja létre, hogy argumentumként megadja a szükséges területi beállítást a Faker Generatornak.

Több területet is támogat. Ebben az esetben az összes területi beállítást meg kell adni a python lista adattípusában.

Az alapértelmezett nyelvi beállítás 'en_US', azaz amerikai angol.

Kódoljunk 10 hindi név létrehozásához.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महानराा मानत कुमारी खान हासन काले विक्रम राऍரुरात न मंगल इन्दु गायकवाड श्री महाराज

 

Hogyan készítsünk hamis adatkészletet hamisító csomag használatával?

Létrehozunk egy 100 emberből álló ál-adatkészletet olyan attribútumokkal, mint munka, cég, lakóhely, felhasználónév, név, cím, aktuális tartózkodási hely, levelezés stb. Az adatok létrehozásához a szabványos szolgáltatói „profilokat”, a mentéshez pedig a Pandas adatkereteket használjuk. azt.

from faker import Faker import panda as pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Dummy Data Faker Package 1 használatával
Kép forrása: Készítette: Szerző

 

 

Alternatív módok a hamis adatok létrehozására Pythonban

Vannak más módok is a vak adatok létrehozására. Ezek a következők:

  • Fauxfactory

    Akkor használható, ha véletlenszerű hamis adatokra van szüksége, például karakterláncokra, számokra, dátumokra, időpontokra, IP-címekre, e-mail címekre stb. a kód gyors teszteléséhez. További információt találsz róla itt.

  • Véletlenszerű modul használata a Numpy könyvtárból a Pythonban

    Ha csak pszeudo-véletlen számokat szeretne, akkor azokat a véletlenszerű csomag segítségével generálhatja. Különféle funkciói vannak, mint például a rand(), a randint() és a choice().

Következtetés

Megtanultuk, hogyan használhatjuk a Faker csomagot Pythonban különféle típusú adatok létrehozására. Megvizsgáltuk, hogyan hozhatunk létre neveket, személyes profilokat, pénznemhez kapcsolódó adatokat. Megtanultuk azt is, hogyan reprodukáljuk ugyanazokat a fiktív adatokat, és hogyan állítsuk elő az egyedi adatokat. Feltérképeztük a szolgáltatókat, és azt is megtudtuk, hogy lehet terület-specifikus adatokat is létrehozni.

Sokkal többet tehetünk ezzel a csomaggal. Megosztottam néhány példát a hamis adatok generálására. Remélem, hasznos lesz az alkalmazás teszteléséhez, és csökkenti a valós adatok keresésének többletköltségét.

 

Referenciák:

A Hamisító-csomaggal kapcsolatos további információkért látogasson el a következő oldalra itt.

Az ebben a cikkben bemutatott médiák nem az Analytics Vidhya tulajdonát képezik, és a Szerző belátása szerint használják azokat.

Forrás: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Időbélyeg:

Még több Analytics Vidhya