Cómo crear datos ficticios en Python usando el paquete Faker

Nodo de origen: 1100261

Este artículo fue publicado como parte del Blogatón de ciencia de datos

Los datos ficticios son necesarios para una variedad de propósitos. Encontrar los datos necesarios en un formato específico puede resultar complicado. Este artículo explora las diferentes formas de crear los datos ficticios utilizando el paquete Faker en Python.

Los temas cubiertos en este artículo son los siguientes:

  • ¿Qué son los datos ficticios?
  • ¿Por qué necesitamos datos ficticios?
  • ¿Cómo instalar el paquete Faker?
  • ¿Cómo crear e inicializar un generador de falsificaciones?
  • ¿Cómo crear un nombre, una dirección y un texto aleatorio usando Faker?
  • ¿Cómo crear los mismos datos ficticios?
  • ¿Cómo crear datos ficticios únicos?
  • ¿Cómo crear datos ficticios relacionados con la moneda usando Faker?
  • ¿Cómo crear datos ficticios localizados con Faker?
  • ¿Cómo crear un conjunto de datos ficticio usando Faker?
  • ¿Qué son los proveedores?
  • Uso de la línea de comandos del paquete Faker
  • Formas alternativas de crear datos ficticios en Python

 

¿Qué son los datos ficticios?

Los datos ficticios también se denominan datos aleatorios. Como sugiere el nombre, son datos falsos que se generan aleatoriamente. Actúa como sustituto o marcador de posición de los datos en vivo.

 

¿Por qué necesitamos datos ficticios?

Los datos ficticios se utilizan con fines operativos y de prueba. Se utiliza para probar lo que ha desarrollado y cómo reacciona su código a diferentes tipos de entradas.

En Python, uno puede crear los datos ficticios usando el paquete Faker. Es una biblioteca de código abierto que genera datos ficticios de muchos tipos diferentes.

 

¿Cómo instalar el paquete Faker para datos ficticios?

Uno puede instalar el paquete Faker usando el comando pip de la siguiente manera:

Pip instalar Faker

 

¿Cómo crear e inicializar un generador falso?

Se puede utilizar el método Faker () para crear e inicializar un generador de falsificaciones.

de la importación de falsificadores Faker fake = Faker ()

Ahora, cuando esté listo con la instalación e inicialización de un generador Faker, puede crear los datos que desee.

 

¿Cómo crear un nombre, una dirección y un texto aleatorio usando Faker?

El método name () se puede utilizar para crear un nombre completo. Si desea el único nombre o apellido en lugar del nombre completo, puede utilizar los métodos first_name () y last_name ().

Cada llamada a estos métodos generará un nombre aleatorio.

Saltemos al código para ver cómo funcionan estos métodos.

fake.first_name () 'Danny'
fake.last_name () 'Riley' 
fake.name () 'John Martinez'

Para crear direcciones y texto aleatorio, puede utilizar los métodos address () y text ().

dirección.falsa () '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text () 'El comercio del juego es diferente. Puede entre programa. Millones de productos se creen pequeños a lo largo de ambos. Deseo de comida dentro de la noche lejana mi. Tal vez una simple carrera de fly break.

El método text () anterior creó un solo párrafo.

Para crear varios nombres, puede poner el método name () en un bucle for de la siguiente manera:

para _ en el rango (10): print (fake.name ())

Dra. Marissa Valencia DDS
Jessica Byrd
Anna Méndez
jessica robertson
marvin duncan
Robert bueno
Bárbara Jackson
James Faulkner
destino harvey
cristina hughes


 

¿Cómo crear los mismos datos ficticios usando el paquete Faker?

En algunos casos, es posible que desee reproducir el mismo conjunto de datos. Es posible sembrando el generador. Puede usar el método seed () para producir los mismos datos ficticios de la siguiente manera:

Faker.seed (111) print (fake.first_name ())
'dobladora christy'

 

¿Cómo crear datos ficticios únicos usando el paquete Faker?

Para asegurarse de que los datos ficticios generados sean únicos, puede utilizar la propiedad .unique del generador.

nombres = [fake.unique.first_name () para i in rango (100)]

Cada vez, se ejecutará el código anterior, generará 100 nombres únicos.

 

¿Cómo crear datos ficticios relacionados con la moneda utilizando el paquete Faker?

Puede utilizar las siguientes propiedades de Faker () para crear datos ficticios relacionados con la criptomoneda

cryptocurrency (): crea el nombre de la criptomoneda y su código correspondiente.

cryptocurrency_name (): crea el nombre de la criptomoneda.

cryptocurrency_code (): crea un código de criptomoneda.

Implementemos algunas de estas propiedades y veamos los resultados.

fake.cryptocurrency_name () 'Bitcoin'
fake.cryptocurrency () ('ETC', 'Ethereum Classic')

Puede utilizar las siguientes propiedades de Faker () para crear datos ficticios relacionados con la moneda

currency (): crea el nombre de la moneda y su código correspondiente.

currency_name (): crea el nombre de la moneda.

currency_code (): crea un código de moneda.

fake.currency () ('TZS', 'Chelín tanzano')
fake.currency_name () 'lira turca'

 

Uso de la línea de comandos del paquete Faker

Después de la instalación del paquete Faker, también puede invocarlo desde la línea de comandos. Puede escribir el código directamente en el símbolo del sistema.

 

¿Qué son los proveedores?

Hasta ahora hemos utilizado propiedades del generador de falsificadores como nombre (), nombre, apellido, dirección, etc. Hay muchas propiedades de este tipo empaquetadas en 'Proveedores'. Algunos son proveedores estándar, mientras que otros son proveedores comunitarios desarrollados por la comunidad.

Hay muchos proveedores estándar como credit_card, date_time, internet, persona, perfil, banco, etc. que ayudan a crear los datos ficticios relevantes.

Puede encontrar más información sobre la lista completa de proveedores estándar y sus propiedades esta página.

Hay muchos proveedores comunitarios como Credit Score, Air Travel, Vehicle, Music, Microservice, etc. También puede crear su proveedor y agregarlo al paquete Faker.

Puede encontrar más información sobre la lista completa de proveedores comunitarios y sus propiedades esta página.

 

¿Cómo crear datos ficticios localizados utilizando el paquete Faker?

Puede crear los datos ficticios localizados proporcionando la configuración regional requerida como argumento para el generador de falsificaciones.

También admite múltiples configuraciones regionales. En ese caso, todas las configuraciones regionales deben proporcionarse en el tipo de datos de la lista de Python.

La configuración regional predeterminada es 'en_US', es decir, inglés de EE. UU.

Vamos a codificar para crear 10 nombres en hindi.

from faker import Faker fake = Faker ('hi_IN') for _ in range (10): print (fake.name ())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन काले विक्रम रामशर्मा हासन मंगल इन्दु गायकवाड श्री महाराज

 

¿Cómo crear un conjunto de datos ficticio usando el paquete Faker?

Crearemos un conjunto de datos ficticios de 100 personas con atributos como trabajo, empresa, residencia, nombre de usuario, nombre, dirección, ubicación actual, correo, etc. Usaremos los 'Perfiles' de proveedores estándar para crear estos datos y usar Pandas Dataframes para guardar eso.

from faker import Faker import pandas como pd fake = Faker () profileData = [fake.profile () for i in range (100)] df = pd.DataFrame (profileData) df

 

Datos ficticios utilizando el paquete Faker 1
Fuente de la imagen: creado por el autor

 

 

Formas alternativas de crear datos ficticios en Python

Hay otras formas de crear datos ficticios. Son los siguientes:

  • fábrica falsa

    Puede usarse cuando necesite algunos datos falsos aleatorios, como cadenas, números, fechas, horas, IP, direcciones de correo electrónico, etc. para probar rápidamente su código. Puedes encontrar más información al respecto. esta página.

  • Usando el módulo aleatorio de la biblioteca Numpy en Python

    Si solo desea números pseudoaleatorios, entonces se pueden generar usando el paquete aleatorio. Tiene diferentes funciones como rand (), randint () y choice ().

Conclusión

Aprendimos a usar el paquete Faker en Python para crear varios tipos de datos. Exploramos cómo crear nombres, perfiles personales, datos relacionados con la moneda. También aprendimos cómo reproducir los mismos datos ficticios y cómo generar los datos únicos. Exploramos los proveedores y también aprendimos que es posible crear datos específicos de la configuración regional.

Podemos hacer mucho más con este paquete. He compartido algunos ejemplos de generación de datos falsos. Espero que sea útil para probar su aplicación y reducir la sobrecarga de encontrar datos reales.

 

Referencias:

Para obtener más información sobre el paquete Faker, puede visitar esta página.

Los medios que se muestran en este artículo no son propiedad de Analytics Vidhya y se utilizan a discreción del autor.

Fuente: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Sello de tiempo:

Mas de Analítica Vidhya