Як створити фіктивні дані на Python за допомогою пакета Faker

Вихідний вузол: 1100261

Ця стаття була опублікована як частина Блогатон науки про дані

Фіктивні дані потрібні для різних цілей. Знайти необхідні дані в певному форматі може бути важко. У цій статті розглядаються різні способи створення фіктивних даних за допомогою пакета Faker Python.

У цій статті розглядаються такі теми:

  • Що таке фіктивні дані?
  • Навіщо нам фіктивні дані?
  • Як встановити Faker Package?
  • Як створити та ініціалізувати Faker Generator?
  • Як створити ім'я, адресу та випадковий текст за допомогою Faker?
  • Як створити ті самі фіктивні дані?
  • Як створити унікальні фіктивні дані?
  • Як створити фіктивні дані, пов’язані з валютою, за допомогою Faker?
  • Як створити локалізовані фіктивні дані за допомогою Faker?
  • Як створити фіктивний набір даних за допомогою Faker?
  • Що таке провайдери?
  • Використання командного рядка Faker Package
  • Альтернативні способи створення фіктивних даних у Python

 

Що таке фіктивні дані?

Фіктивні дані також називаються випадковими даними. Як випливає з назви, це підроблені дані, які генеруються випадковим чином. Він діє як замінник або заповнювач для поточних даних.

 

Навіщо нам потрібні фіктивні дані?

Фіктивні дані використовуються для тестування та операційних цілей. Він використовується для перевірки того, що ви розробили, і того, як ваш код реагує на різні види вхідних даних.

У Python можна створити фіктивні дані за допомогою пакета Faker. Це бібліотека з відкритим кодом, яка генерує фіктивні дані багатьох різних типів.

 

Як встановити пакет Faker для фіктивних даних?

Пакет Faker можна встановити за допомогою команди pip наступним чином:

Pip встановити Faker

 

Як створити та ініціалізувати генератор підробок?

Можна використовувати метод Faker() для створення та ініціалізації генератора Faker.

з імпорту faker Faker fake = Faker()

Тепер, коли ви готові до встановлення та ініціалізації генератора Faker, ви можете створювати будь-які дані, які хочете.

 

Як створити ім’я, адресу та випадковий текст за допомогою Faker?

Метод name() можна використовувати для створення повного імені. Якщо вам потрібно лише ім’я чи прізвище замість повного імені, ви можете скористатися методами first_name() і last_name().

Кожен виклик цих методів генеруватиме випадкове ім’я.

Давайте перейдемо до коду, щоб побачити, як працюють ці методи.

fake.first_name() 'Денні'
fake.last_name() 'Райлі' 
fake.name() 'Джон Мартінес'

Для створення адреси та випадкового тексту можна використовувати методи address() і text().

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'Ігрова торгівля відрізняється. Можна між програмою. Мільйон продукції вважаю малим уздовж обох. Їжа бажання всередині далекий вечір мій. Можливо, це просто зрив кар'єри».

Метод text() вище створив один абзац.

Щоб створити кілька імен, ви можете розмістити метод name() у циклі наступним чином:

для _ в діапазоні (10): print(fake.name())

Доктор Марісса Валенсія DDS
Джессіка Берд
Анна Мендес
Джессіка Робертсон
Марвін Дункан
Роберт Гуд
Барбара Джексон
Джеймс Фолкнер
Дестіні Харві
Крістін Хьюз


 

Як створити ті самі фіктивні дані за допомогою Faker Package?

У деяких випадках ви можете відтворити той самий набір даних. Можна за допомогою засівки генератора. Ви можете використовувати метод seed() для отримання тих самих фіктивних даних, як описано нижче:

Faker.seed(111) print(fake.first_name())
'Крісті Бендер'

 

Як створити унікальні фіктивні дані за допомогою Faker Package?

Щоб гарантувати унікальність згенерованих фіктивних даних, ви можете використовувати властивість .unique генератора.

імена = [fake.unique.first_name() та цінності i in діапазон (100)]

Кожного разу, коли наведений вище код буде виконуватися, він генеруватиме 100 унікальних імен.

 

Як створити фіктивні дані, пов’язані з валютою, за допомогою пакета Faker?

Ви можете використовувати такі властивості Faker() для створення фіктивних даних, пов’язаних із криптовалютою

cryptocurrency() – створює назву криптовалюти та її відповідний код.

cryptocurrency_name() – створює назву криптовалюти.

cryptocurrency_code() – створює код криптовалюти.

Давайте реалізуємо деякі з цих властивостей і побачимо результати.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

Ви можете використовувати такі властивості Faker() для створення фіктивних даних, пов’язаних із валютою

currency() – створює назву валюти та відповідний код.

currency_name() – створює назву валюти.

currency_code() – створює код валюти.

fake.currency() ("TZS", "танзанійський шилінг")
fake.currency_name() 'Турецька ліра'

 

Використання пакета Faker у командному рядку

Після встановлення пакета Faker ви також можете викликати його з командного рядка. Ви можете написати код безпосередньо в командному рядку.

 

Що таке провайдери?

Досі ми використовували такі властивості генератора Faker, як name(), first_name, last_name, address тощо. Існує багато таких властивостей, упакованих у «Постачальники». Деякі є стандартними постачальниками, а інші є постачальниками спільноти, розробленими спільнотою.

Є багато стандартних постачальників, як-от credit_card, date_time, internet, person, profile, bank тощо, які допомагають у створенні відповідних фіктивних даних.

Ви можете знайти більше інформації про повний список стандартних постачальників та їхні властивості тут.

Є багато постачальників спільноти, як-от кредитний рейтинг, авіаперевезення, транспортні засоби, музика, мікропослуги тощо. Ви також можете створити свого постачальника та додати його до пакету Faker.

Ви можете знайти більше інформації про повний список постачальників спільноти та їхні властивості тут.

 

Як створити локалізовані фіктивні дані за допомогою Faker Package?

Ви можете створити локалізовані фіктивні дані, надавши необхідну мову як аргумент генератору підробок.

Він також підтримує кілька локалізацій. У цьому випадку всі локалі потрібно надати в типі даних списку python.

Мова за замовчуванням — «en_US», тобто американська англійська.

Давайте закодуємо 10 імен на хінді.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमाiglी खान हाले विकrean

 

Як створити фіктивний набір даних за допомогою Faker Package?

Ми створимо фіктивний набір даних із 100 осіб із такими атрибутами, як робота, компанія, місце проживання, ім’я користувача, ім’я, адреса, поточне місцезнаходження, пошта тощо. Ми використаємо «Профілі» стандартного постачальника для створення цих даних і використаємо Pandas Dataframes для збереження це.

from faker import Faker import pandas as pd fake = Faker() profileData = [fake.profile() for i in range(100)] df = pd.DataFrame(profileData) df

 

Фіктивні дані з використанням Faker Package 1
Джерело зображення: створено автором

 

 

Альтернативні способи створення фіктивних даних у Python

Існують інші способи створення фіктивних даних. Вони такі:

  • Fauxfactory

    Його можна використовувати, коли вам потрібні випадкові підроблені дані, такі як рядки, числа, дати, час, IP, адреси електронної пошти тощо для швидкого тестування вашого коду. Ви можете знайти більше інформації про це тут.

  • Використання модуля Random з бібліотеки Numpy у Python

    Якщо вам потрібні лише псевдовипадкові числа, їх можна згенерувати за допомогою випадкового пакету. Він має різні функції, такі як rand(), randint() і choice().

Висновок

Ми навчилися використовувати пакет Faker у Python для створення різних типів даних. Ми досліджували, як створювати імена, особисті профілі, дані, пов’язані з валютою. Ми також навчилися відтворювати ті самі фіктивні дані, а також як генерувати унікальні дані. Ми досліджували постачальників і також дізналися, що можна створювати дані для певної мови.

З цим пакетом ми можемо зробити багато іншого. Я поділився кількома прикладами створення фейкових даних. Я сподіваюся, що це буде корисно для тестування вашої програми та зменшить накладні витрати на пошук реальних даних.

 

Список використаної літератури:

Для отримання додаткової інформації про пакет Faker ви можете відвідати тут.

Носії, показані в цій статті, не належать Analytics Vidhya і використовуються на розсуд автора.

Джерело: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Часова мітка:

Більше від Аналітика Vidhya