Faker Paketini Kullanarak Python'da Sahte Veri Nasıl Oluşturulur

Kaynak Düğüm: 1100261

Bu makale, Veri Bilimi Blogathon

Sahte verilere çeşitli amaçlar için ihtiyaç duyulur. Gerekli verileri belirli bir biçimde bulmak zor olabilir. Bu makale, içinde Faker paketini kullanarak sahte veri oluşturmanın farklı yollarını araştırıyor. Python.

Bu makalede ele alınan konular aşağıdaki gibidir:

  • Sahte veri nedir?
  • Neden sahte verilere ihtiyacımız var?
  • Faker Paketi nasıl kurulur?
  • Faker Jeneratör nasıl oluşturulur ve başlatılır?
  • Faker kullanarak bir ad, adres ve rastgele metin nasıl oluşturulur?
  • Aynı kukla veriler nasıl oluşturulur?
  • Benzersiz kukla veriler nasıl oluşturulur?
  • Faker kullanarak para birimiyle ilgili sahte veriler nasıl oluşturulur?
  • Faker Kullanarak yerelleştirilmiş yapay veriler nasıl oluşturulur?
  • Faker kullanarak sahte bir veri kümesi nasıl oluşturulur?
  • Sağlayıcılar nedir?
  • Faker Paketinin komut satırı kullanımı
  • Python'da yapay veri oluşturmanın alternatif yolları

 

Kukla Veri Nedir?

Kukla verilere rastgele veriler de denir. Adından da anlaşılacağı gibi, rastgele oluşturulan sahte verilerdir. Canlı veriler için bir yedek veya yer tutucu görevi görür.

 

Neden Kukla Verilere İhtiyacımız Var?

Sahte veriler, test ve operasyonel amaçlar için kullanılır. Ne geliştirdiğinizi ve kodunuzun farklı girdi türlerine nasıl tepki verdiğini test etmek için kullanılır.

Python'da, Faker paketi kullanılarak sahte veriler oluşturulabilir. Birçok farklı türde yapay veri üreten açık kaynaklı bir kitaplıktır.

 

Dummy Data İçin Faker Paketi Nasıl Kurulur?

Faker paketi pip komutu kullanılarak aşağıdaki şekilde kurulabilir:

Pip kurulum Faker

 

Faker Jeneratör Nasıl Oluşturulur ve Başlatılır?

Bir Faker Jeneratör oluşturmak ve başlatmak için Faker() yöntemi kullanılabilir.

faker'den import Faker fake = Faker()

Artık bir Faker jeneratörünün kurulumuna ve başlatılmasına hazır olduğunuza göre, istediğiniz herhangi bir veriyi oluşturabilirsiniz.

 

Faker Kullanarak İsim, Adres ve Rastgele Metin Nasıl Oluşturulur?

name() yöntemi, tam bir ad oluşturmak için kullanılabilir. Tam ad yerine yalnızca ad veya soyadı istiyorsanız, first_name() ve last_name() yöntemlerini kullanabilirsiniz.

Bu yöntemlere yapılan her çağrı rastgele bir isim üretecektir.

Bu yöntemlerin nasıl çalıştığını görmek için koda geçelim.

fake.first_name() 'Danny'
fake.last_name() 'Riley' 
fake.name() 'John Martinez'

Adres ve rastgele metin oluşturmak için address() ve text() yöntemlerini kullanabilirsiniz.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Oyun ticareti farklı. Program arasında olabilir. Milyonlarca ürün her ikisi de küçük olduğuna inanıyor. nMaliyet en iyi hafta sermaye otoritesine söyle. Uzak akşam içinde yemek dilek benim. Basit bir sinek molası kariyeri belki.'

Yukarıdaki text() yöntemi tek bir paragraf oluşturdu.

Birden çok ad oluşturmak için, name() yöntemini bir for döngüsüne aşağıdaki gibi koyabilirsiniz:

(10) aralığındaki _ için: print(fake.name())

Marissa Valencia DDS
jessica byrd
anna mendez
jessica robertson
marvin duncan
Robert İyi
Barbara Jackson
James Faulkner
kader harvey
Christine Hughes


 

Faker Paketi ile Aynı Kukla Veri Nasıl Oluşturulur?

Bazı durumlarda, aynı veri setini yeniden oluşturmak isteyebilirsiniz. Jeneratörü tohumlayarak mümkündür. Aynı yapay verileri aşağıdaki gibi üretmek için seed() yöntemini kullanabilirsiniz:

Faker.seed(111) print(fake.first_name())
'Christy Bender'

 

Faker Paketi ile Eşsiz Kukla Veriler Nasıl Oluşturulur?

Oluşturulan yapay verilerin benzersiz olduğundan emin olmak için oluşturucunun .unique özelliğini kullanabilirsiniz.

isimler = [sahte.benzersiz.first_name() için i in aralık(100)]

Yukarıdaki kod her çalıştırıldığında benzersiz 100 ad üretecektir.

 

Faker Paketini Kullanarak Para Birimi İle İlgili Sahte Veriler Nasıl Oluşturulur?

Kripto para birimiyle ilgili sahte veriler oluşturmak için aşağıdaki Faker() özelliklerini kullanabilirsiniz.

cryptocurrency() – Kripto para birimi adını ve buna karşılık gelen kodu oluşturur.

cryptocurrency_name() - Kripto para birimi adını oluşturur.

cryptocurrency_code() – Kripto para birimi kodu oluşturur.

Bu özelliklerden bazılarını uygulayalım ve sonuçları görelim.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

Para birimiyle ilgili sahte veriler oluşturmak için aşağıdaki Faker() özelliklerini kullanabilirsiniz.

para birimi() – Para birimi adını ve buna karşılık gelen kodu oluşturur.

para birimi_adı() – Para birimi adını oluşturur.

para birimi_kodu() – Para birimi kodu oluşturur.

fake.currency() ('TZS', 'Tanzanya şilini')
fake.currency_name() 'Türk Lirası'

 

Faker Paketinin Komut Satırında Kullanımı

Faker paketini kurduktan sonra komut satırından da çağırabilirsiniz. Kodu doğrudan komut istemine yazabilirsiniz.

 

Sağlayıcılar Nelerdir?

Şimdiye kadar name(), first_name, last_name, address vb. gibi Faker oluşturucu özelliklerini kullandık. 'Sağlayıcılar' içinde paketlenmiş bu tür birçok özellik vardır. Bazıları Standart Sağlayıcılar, diğerleri ise topluluk tarafından geliştirilen Topluluk Sağlayıcılarıdır.

İlgili sahte verilerin oluşturulmasına yardımcı olan kredi kartı, tarih_saat, internet, kişi, profil, banka vb. gibi birçok Standart Sağlayıcı vardır.

Standart Sağlayıcıların tam listesi ve özellikleri hakkında daha fazla bilgi bulabilirsiniz. okuyun.

Kredi Puanı, Hava Yolculuğu, Araç, Müzik, Mikroservis vb. gibi birçok Topluluk Sağlayıcı vardır. Ayrıca sağlayıcınızı oluşturabilir ve Faker paketine ekleyebilirsiniz.

Topluluk Sağlayıcılarının tam listesi ve özellikleri hakkında daha fazla bilgi bulabilirsiniz. okuyun.

 

Faker Paketi ile Lokalize Dummy Data Nasıl Oluşturulur?

Faker Generator'a bir argüman olarak gerekli yerel ayarı sağlayarak yerelleştirilmiş sahte verileri oluşturabilirsiniz.

Ayrıca birden çok yerel ayarı destekler. Bu durumda, tüm yerel ayarların python liste veri türünde sağlanması gerekir.

Varsayılan yerel ayar 'en_US', yani ABD İngilizcesidir.

10 Hintçe isim oluşturmak için kod yazalım.

faker'den import Faker fake = Faker('hi_IN') için aralık(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासासन मंगल यनीवकरदु

 

Faker Paketi Kullanarak Sahte Veri Kümesi Nasıl Oluşturulur?

İş, şirket, ikametgah, kullanıcı adı, ad, adres, mevcut konum, posta vb. niteliklere sahip 100 kişilik sahte bir veri kümesi oluşturacağız. Bu verileri oluşturmak için Standart Sağlayıcı 'Profillerini' kullanacağız ve kaydetmek için Pandas Veri Çerçevelerini kullanacağız. o.

faker'den import Faker pandaları pd olarak içe aktar fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Faker Paketini Kullanan Sahte Veriler 1
Resim Kaynağı: Yazar Tarafından Oluşturuldu

 

 

Python'da Sahte Veri Oluşturmanın Alternatif Yolları

Sahte verileri oluşturmanın başka yolları da vardır. Bunlar aşağıdaki gibidir:

  • sahte fabrika

    Kodunuzun hızlı bir şekilde test edilmesi için dizeler, sayılar, tarihler, saatler, IP, e-posta adresleri vb. gibi bazı rastgele sahte verilere ihtiyaç duyduğunuzda kullanılabilir. Bununla ilgili daha fazla bilgi bulabilirsiniz okuyun.

  • Python'da Numpy kitaplığından Random modülünü kullanma

    Yalnızca sözde rasgele sayılar istiyorsanız, bunlar rasgele paket kullanılarak oluşturulabilir. Rand(), randint() ve options() gibi farklı işlevleri vardır.

Sonuç

Çeşitli veri türleri oluşturmak için Python'da Faker paketinin nasıl kullanılacağını öğrendik. İsimlerin, kişisel profillerin, para birimiyle ilgili verilerin nasıl oluşturulacağını araştırdık. Aynı yapay verilerin nasıl yeniden üretileceğini ve benzersiz verilerin nasıl oluşturulacağını da öğrendik. Sağlayıcıları araştırdık ve ayrıca yerel ayara özel veriler oluşturmanın mümkün olduğunu öğrendik.

Bu paketle yapabileceğimiz daha çok şey var. Sahte veri üretmenin birkaç örneğini paylaştım. Uygulamanızı test etmek ve gerçek verileri bulma ek yükünü azaltmak için faydalı olacağını umuyorum.

 

Referanslar:

Faker Paketi hakkında daha fazla bilgi için adresini ziyaret edebilirsiniz. okuyun.

Bu makalede gösterilen medya Analytics Vidhya'ya ait değildir ve Yazarın takdirine bağlı olarak kullanılır.

Kaynak: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Zaman Damgası:

Den fazla Analitik Vidhya