Sådan oprettes dummy-data i Python ved hjælp af Faker Package

Genudgivet af Platon

Abonnenter: 0

Denne artikel blev offentliggjort som en del af Data Science Blogathon

Dummy-data er nødvendige til en række forskellige formål. Det kan være svært at finde de nødvendige data i et bestemt format. Denne artikel udforsker de forskellige måder at oprette dummy-data på ved hjælp af Faker-pakken i Python.

Emner dækket i denne artikel er som følger:

Hvad er dummy-data?
Hvorfor har vi brug for dummy-data?
Hvordan installeres Faker-pakken?
Hvordan opretter og initialiserer man en Faker Generator?
Hvordan opretter man et navn, adresse og tilfældig tekst ved hjælp af Faker?
Hvordan opretter man de samme dummy-data?
Hvordan opretter man unikke dummy-data?
Hvordan opretter man valutarelaterede dummy-data ved hjælp af Faker?
Hvordan opretter man lokaliserede dummy-data ved hjælp af Faker?
Hvordan opretter man et dummy-datasæt ved hjælp af Faker?
Hvad er udbydere?
Kommandolinjebrug af Faker Package
Alternative måder at oprette dummy-data på i Python

Hvad er Dummy Data?

Dummy-data kaldes også tilfældige data. Som navnet antyder, er det falske data, der genereres tilfældigt. Det fungerer som en erstatning eller pladsholder for livedataene.

Hvorfor har vi brug for dummy-data?

Dummy-data bruges til test- og driftsformål. Den bruges til at teste, hvad du har udviklet, og hvordan din kode reagerer på forskellige slags input.

I Python kan man oprette dummy-dataene ved hjælp af Faker-pakken. Det er et open source-bibliotek, der genererer dummy-data af mange forskellige typer.

Sådan installeres Faker-pakken til Dummy-data?

Man kan installere Faker-pakken ved at bruge pip-kommandoen som følger:

Pip installer Faker

Hvordan oprettes og initialiseres en Faker Generator?

Man kan bruge Faker() metoden til at oprette og initialisere en Faker Generator.

fra falsk import Faker fake = Faker()

Nu, som du er klar med din installation og initialisering af en Faker-generator, kan du oprette alle de data, du ønsker.

Hvordan oprettes et navn, adresse og tilfældig tekst ved hjælp af Faker?

Metoden name() kan bruges til at oprette et fuldt navn. Hvis du vil have det eneste fornavn eller efternavn i stedet for det fulde navn, kan du bruge metoderne fornavn() og efternavn().

Hvert kald til disse metoder vil generere et tilfældigt navn.

Lad os springe ind i koden for at se, hvordan disse metoder fungerer.

fake.first_name() 'Danny'

fake.last_name() 'Riley'

fake.name() 'John Martinez'

Til oprettelse af adresse og tilfældig tekst kan du bruge metoderne adresse() og text().

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'

fake.text() 'Spilhandel er anderledes. Der kan mellem program. Million producere tror små langs både.nCost bedste uge fortælle kapital myndighed. Mad ønske inde langt aften min. Simpel flue pause karriere måske.'

Text()-metoden ovenfor skabte et enkelt afsnit.

For at oprette flere navne kan du sætte metoden name() i en for-løkke som følger:

for _ i området(10): print(fake.name())

Dr. Marissa Valencia DDS
Jessica Byrd
Anna Mendez
Jessica Robertson
Marvin Duncan
Robert Godt
Barbara Jackson
James Faulkner
Skæbne Harvey
Christine Hughes

Hvordan opretter man de samme dummydata ved hjælp af Faker Package?

I nogle tilfælde vil du måske reproducere det samme datasæt. Det er muligt ved at udså generatoren. Du kan bruge seed()-metoden til at producere de samme dummy-data som følger:

Faker.seed(111) print(fake.first_name())
'Christy Bender'

Hvordan oprettes unikke dummy-data ved hjælp af Faker Package?

For at sikre, at de genererede dummy-data er unikke, kan du bruge generatorens .unique-egenskab.

navne = [fake.unique.first_name() forum i in range(100)]

Hver gang ovenstående kode vil blive udført, vil den generere unikke 100 navne.

Hvordan opretter man valutarelaterede dummy-data ved hjælp af Faker Package?

Du kan bruge følgende Faker()-egenskaber til at oprette cryptocurrency-relaterede dummy-data

cryptocurrency() – Det opretter cryptocurrency-navnet og dets tilsvarende kode.

cryptocurrency_name() – Det opretter cryptocurrency navn.

cryptocurrency_code() – Det opretter cryptocurrency-kode.

Lad os implementere nogle af disse egenskaber og se resultaterne.

fake.cryptocurrency_name() 'Bitcoin'

fake.cryptocurrency() ('ETC', 'Ethereum Classic')

Du kan bruge følgende Faker()-egenskaber til at oprette valutarelaterede dummy-data

valuta() – Det opretter valutanavnet og dets tilsvarende kode.

valuta_navn() – Det opretter valutanavn.

valuta_kode() – Det opretter valutakode.

fake.currency() ('TZS', 'Tanzanian shilling')

fake.currency_name() 'Tyrkisk lira'

Kommandolinjebrug af Faker-pakken

Efter installation af Faker-pakken kan du også kalde den fra kommandolinjen. Du kan skrive koden direkte ved kommandoprompten.

Hvad er udbydere?

Indtil videre har vi brugt Faker generator egenskaber som navn(), fornavn, efternavn, adresse osv. Der er mange sådanne egenskaber pakket i 'Providers'. Nogle er standardudbydere, mens andre er fællesskabsudbydere udviklet af fællesskabet.

Der er mange standardudbydere som kreditkort, dato_tid, internet, person, profil, bank osv., som hjælper med at skabe de relevante dummy-data.

Du kan finde mere information om den komplette liste over standardudbydere og deres egenskaber link..

Der er mange Community Providers som Credit Score, Air Travel, Vehicle, Music, Microservice osv. Du kan også oprette din udbyder og tilføje den til Faker-pakken.

Du kan finde flere oplysninger om den komplette liste over fællesskabsudbydere og deres egenskaber link..

Hvordan oprettes lokaliserede dummy-data ved hjælp af Faker Package?

Du kan oprette de lokaliserede dummy-data ved at angive den nødvendige lokalitet som et argument til Faker Generator.

Det understøtter også flere lokaliteter. I så fald skal alle lokaliteter angives i python-listens datatype.

Standardlokaliteten er 'en_US', dvs. amerikansk engelsk.

Lad os kode for at oprette 10 hindi-navne.

fra falsk import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())

अद्वैत दयाल देन्यल अब्बासी हासन मरतइ मानत कुमारी खान हासन काले विक्रममशरमशर न मंगल इन्दु गायकवाड श्री महाराज

Hvordan opretter man et dummy-datasæt ved hjælp af Faker Package?

Vi vil oprette et dummy-datasæt på 100 personer med attributter som job, virksomhed, bopæl, brugernavn, navn, adresse, nuværende placering, mail osv. Vi vil bruge standardudbyderens 'Profiler' til at oprette disse data og bruge Pandas Dataframes til at gemme det.

fra falsk import Faker importer pandaer som pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

Dummy-data ved hjælp af Faker-pakke 1 — Billedkilde: Skabt af forfatter

Alternative måder at skabe dummy-data på i Python

Der er nogle andre måder at oprette dummy-dataene på. De er som følger:

Fauxfactory
Det kan bruges, når du har brug for nogle tilfældige falske data såsom strenge, tal, datoer, klokkeslæt, IP, e-mailadresser osv. til hurtig test af din kode. Du kan finde mere information om det link..

Brug af Random-modul fra Numpy-biblioteket i Python

Hvis du kun ønsker pseudo-tilfældige tal, kan de genereres ved hjælp af den tilfældige pakke. Den har forskellige funktioner som rand(), randint() og valg().

Konklusion

Vi lærte, hvordan man bruger Faker-pakken i Python til at skabe forskellige typer data. Vi undersøgte, hvordan man opretter navne, personlige profiler, valutarelaterede data. Vi lærte også, hvordan man reproducerer de samme dummy-data, samt hvordan man genererer de unikke data. Vi udforskede udbyderne og lærte også, at det er muligt at oprette lokalitetsspecifikke data.

Der er meget mere, vi kan gøre med denne pakke. Jeg har delt et par eksempler på generering af falske data. Jeg håber, det vil være nyttigt til at teste din applikation og reducere omkostningerne ved at finde rigtige data.