Comment créer des données factices en Python à l'aide du package Faker

Nœud source: 1100261

Cet article a été publié dans le cadre du Blogathon sur la science des données

Les données factices sont nécessaires à diverses fins. Trouver les données requises dans un format spécifique peut être difficile. Cet article explore les différentes manières de créer les données factices à l'aide du package Faker dans Python.

Les sujets abordés dans cet article sont les suivants :

  • Qu'est-ce que les données factices ?
  • Pourquoi avons-nous besoin de données factices ?
  • Comment installer le paquet Faker ?
  • Comment créer et initialiser un Faker Generator ?
  • Comment créer un nom, une adresse et un texte aléatoire à l'aide de Faker ?
  • Comment créer les mêmes données factices ?
  • Comment créer des données factices uniques ?
  • Comment créer des données factices liées aux devises à l'aide de Faker ?
  • Comment créer des données factices localisées à l'aide de Faker ?
  • Comment créer un jeu de données factice à l'aide de Faker ?
  • Que sont les fournisseurs ?
  • Utilisation de la ligne de commande de Faker Package
  • Autres façons de créer des données factices en Python

 

Qu'est-ce que les données factices ?

Les données factices sont également appelées données aléatoires. Comme son nom l'indique, ce sont de fausses données qui sont générées aléatoirement. Il agit comme un substitut ou un espace réservé pour les données en direct.

 

Pourquoi avons-nous besoin de données factices ?

Les données factices sont utilisées à des fins de test et d'exploitation. Il est utilisé pour tester ce que vous avez développé et comment votre code réagit aux différents types d'entrées.

En Python, on peut créer les données factices à l'aide du package Faker. Il s'agit d'une bibliothèque open source qui génère des données factices de nombreux types différents.

 

Comment installer le package Faker pour les données factices ?

On peut installer le package Faker à l'aide de la commande pip comme suit :

Pip installer Faker

 

Comment créer et initialiser un générateur de faux ?

On peut utiliser la méthode Faker() pour créer et initialiser un Faker Generator.

de l'import de faux Faux faux = faux ()

Maintenant que vous êtes prêt pour l'installation et l'initialisation d'un générateur Faker, vous pouvez créer toutes les données que vous souhaitez.

 

Comment créer un nom, une adresse et un texte aléatoire à l'aide de Faker ?

La méthode name() peut être utilisée pour créer un nom complet. Si vous voulez le seul prénom ou nom au lieu du nom complet, vous pouvez utiliser les méthodes first_name() et last_name().

Chaque appel à ces méthodes générera un nom aléatoire.

Passons au code pour voir comment ces méthodes fonctionnent.

fake.first_name() 'Danny'
fake.last_name() 'Riley' 
fake.name() 'John Martinez'

Pour créer une adresse et du texte aléatoire, vous pouvez utiliser les méthodes address() et text().

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Le commerce du jeu est différent. Il peut entre programme. Millions de produits croient petit le long des deux. Souhait de nourriture à l'intérieur du soir mon. Une simple carrière de briseur de mouches peut-être.

La méthode text() ci-dessus a créé un seul paragraphe.

Pour créer plusieurs noms, vous pouvez mettre la méthode name() dans une boucle for comme suit :

pour _ dans la plage (10) : print(fake.name())

Dr Marissa Valencia DDS
Jessica Byrd
Anna Méndez
Jessica Robertson
Marvin Duncan
Robert Bon
Barbara Jackson
James Faulkner
Destin Harvey
Christine Hugues


 

Comment créer les mêmes données factices à l'aide du package Faker ?

Dans certains cas, vous souhaiterez peut-être reproduire le même ensemble de données. C'est possible en ensemençant le générateur. Vous pouvez utiliser la méthode seed() pour produire les mêmes données factices comme suit :

Faker.seed(111) print(fake.first_name())
'Christy Bender'

 

Comment créer des données factices uniques à l'aide de Faker Package ?

Pour vous assurer que les données factices générées sont uniques, vous pouvez utiliser la propriété .unique du générateur.

noms = [fake.unique.first_name() en i in plage (100)]

Chaque fois que le code ci-dessus sera exécuté, il générera 100 noms uniques.

 

Comment créer des données factices liées aux devises à l'aide du package Faker ?

Vous pouvez utiliser les propriétés Faker() suivantes pour créer des données factices liées à la crypto-monnaie

cryptocurrency() - Il crée le nom de la crypto-monnaie et son code correspondant.

cryptocurrency_name() - Il crée un nom de crypto-monnaie.

cryptocurrency_code() - Il crée un code de crypto-monnaie.

Implémentons certaines de ces propriétés et voyons les résultats.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

Vous pouvez utiliser les propriétés Faker() suivantes pour créer des données factices liées aux devises

devise () - Il crée le nom de la devise et son code correspondant.

currency_name () - Il crée le nom de la devise.

currency_code() - Il crée un code de devise.

fake.currency() ('TZS', 'shilling tanzanien')
fake.currency_name() 'Lire turque'

 

Utilisation en ligne de commande du package Faker

Après l'installation du package Faker, vous pouvez également l'invoquer à partir de la ligne de commande. Vous pouvez directement écrire le code à l'invite de commande.

 

Que sont les fournisseurs ?

Jusqu'à présent, nous avons utilisé les propriétés du générateur Faker telles que name(), first_name, last_name, address, etc. Il existe de nombreuses propriétés de ce type emballées dans 'Providers'. Certains sont des fournisseurs standard tandis que d'autres sont des fournisseurs communautaires développés par la communauté.

Il existe de nombreux fournisseurs standard tels que credit_card, date_time, Internet, personne, profil, banque, etc., qui aident à créer les données factices pertinentes.

Vous pouvez trouver plus d'informations sur la liste complète des fournisseurs standard et leurs propriétés ici.

Il existe de nombreux fournisseurs communautaires tels que Credit Score, Air Travel, Vehicle, Music, Microservice, etc. Vous pouvez également créer votre fournisseur et l'ajouter au package Faker.

Vous pouvez trouver plus d'informations sur la liste complète des fournisseurs de communauté et leurs propriétés ici.

 

Comment créer des données factices localisées à l'aide du package Faker ?

Vous pouvez créer les données factices localisées en fournissant les paramètres régionaux requis en tant qu'argument à Faker Generator.

Il prend également en charge plusieurs paramètres régionaux. Dans ce cas, tous les paramètres régionaux doivent être fournis dans le type de données de la liste python.

La locale par défaut est 'en_US', c'est-à-dire l'anglais américain.

Codons pour créer 10 noms hindis.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु श्री महाराज

 

Comment créer un jeu de données factice à l'aide du package Faker ?

Nous allons créer un ensemble de données factice de 100 personnes avec des attributs tels que le travail, l'entreprise, la résidence, le nom d'utilisateur, le nom, l'adresse, l'emplacement actuel, le courrier, etc. ce.

de faker importer Faker importer des pandas en tant que pd fake = Faker() profileData = [fake.profile() for i in range (100)] df = pd.DataFrame(profileData) df

 

Données factices à l'aide de Faker Package 1
Source de l'image : créé par l'auteur

 

 

Autres façons de créer des données factices en Python

Il existe d'autres façons de créer les données factices. Ils sont les suivants :

  • Fausse usine

    Il peut être utilisé lorsque vous avez besoin de fausses données aléatoires telles que des chaînes, des nombres, des dates, des heures, des adresses IP, des adresses e-mail, etc. pour un test rapide de votre code. Vous pouvez trouver plus d'informations à ce sujet ici.

  • Utilisation du module Random de la bibliothèque Numpy en Python

    Si vous ne voulez que des nombres pseudo-aléatoires, ils peuvent être générés à l'aide du package aléatoire. Il a différentes fonctions comme rand(), randint() et choice().

Conclusion

Nous avons appris à utiliser le package Faker en Python pour créer différents types de données. Nous avons exploré comment créer des noms, des profils personnels, des données liées aux devises. Nous avons également appris à reproduire les mêmes données factices ainsi qu'à générer les données uniques. Nous avons exploré les fournisseurs et avons également appris qu'il est possible de créer des données spécifiques aux paramètres régionaux.

Il y a beaucoup plus que nous pouvons faire avec ce package. J'ai partagé quelques exemples de génération de fausses données. J'espère qu'il sera utile pour tester votre application et réduira la surcharge de recherche de données réelles.

 

Références:

Pour plus d'informations sur le forfait Faker, vous pouvez visiter ici.

Les médias présentés dans cet article ne sont pas la propriété d'Analytics Vidhya et sont utilisés à la discrétion de l'auteur.

Source : https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Horodatage:

Plus de Analytique Vidhya