Как создать фиктивные данные на Python с помощью пакета Faker

Исходный узел: 1100261

Эта статья была опубликована в рамках Блогатон по Data Science

Фиктивные данные нужны для различных целей. Найти требуемые данные в определенном формате может быть сложно. В этой статье рассматриваются различные способы создания фиктивных данных с помощью пакета Faker в Питон.

В этой статье рассматриваются следующие темы:

  • Что такое фиктивные данные?
  • Зачем нужны фиктивные данные?
  • Как установить пакет Faker?
  • Как создать и инициализировать генератор Faker?
  • Как создать имя, адрес и случайный текст с помощью Faker?
  • Как создать такие же фиктивные данные?
  • Как создать уникальные фиктивные данные?
  • Как создать фиктивные данные, связанные с валютой, с помощью Faker?
  • Как создать локализованные фиктивные данные с помощью Faker?
  • Как создать фиктивный набор данных с помощью Faker?
  • Что такое провайдеры?
  • Использование пакета Faker из командной строки
  • Альтернативные способы создания фиктивных данных в Python

 

Что такое фиктивные данные?

Фиктивные данные также называются случайными данными. Как следует из названия, это фальшивые данные, которые генерируются случайным образом. Он действует как заменитель или заполнитель для оперативных данных.

 

Зачем нужны фиктивные данные?

Фиктивные данные используются для тестирования и эксплуатации. Он используется для проверки того, что вы разработали, и того, как ваш код реагирует на различные типы входных данных.

В Python можно создать фиктивные данные с помощью пакета Faker. Это библиотека с открытым исходным кодом, которая генерирует фиктивные данные самых разных типов.

 

Как установить пакет Faker для фиктивных данных?

Установить пакет Faker можно с помощью команды pip следующим образом:

Пип установить Faker

 

Как создать и инициализировать генератор Faker?

Можно использовать метод Faker () для создания и инициализации генератора Faker.

из faker import Faker fake = Faker ()

Теперь, когда вы готовы к установке и инициализации генератора Faker, вы можете создавать любые данные, которые захотите.

 

Как создать имя, адрес и случайный текст с помощью Faker?

Метод name () может использоваться для создания полного имени. Если вы хотите использовать только имя или фамилию вместо полного имени, вы можете использовать методы first_name () и last_name ().

Каждый вызов этих методов генерирует случайное имя.

Давайте перейдем к коду, чтобы увидеть, как работают эти методы.

fake.first_name () 'Дэнни'
fake.last_name () 'Райли' 
fake.name () 'Джон Мартинес'

Для создания адреса и произвольного текста вы можете использовать методы address () и text ().

fake.address () '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text () 'Игра торгуется по-другому. Всё может между программой. Миллион продукции считают малым по обоим направлениям. Лучшая неделя по стоимости говорит властям столицы. Поесть желаю в дальний вечер мой. Может быть, просто перерыв в карьере.

Вышеупомянутый метод text () создал один абзац.

Для создания нескольких имен вы можете поместить метод name () в цикл for следующим образом:

для _ в диапазоне (10): print (fake.name ())

Доктор Марисса Валенсия DDS
Джессика Берд
Анна Мендес
Джессика Робертсон
Марвин Дункан
Роберт Гуд
Барбара Джексон
Джеймс Фолкнер
Судьба Харви
Кристин Хьюз


 

Как создать те же фиктивные данные с помощью пакета Faker?

В некоторых случаях может потребоваться воспроизвести тот же набор данных. Можно засевая генератор. Вы можете использовать метод seed () для создания тех же фиктивных данных следующим образом:

Faker.seed (111) print (fake.first_name ())
'Кристи Бендер'

 

Как создать уникальные фиктивные данные с помощью пакета Faker?

Чтобы гарантировать уникальность сгенерированных фиктивных данных, вы можете использовать свойство .unique генератора.

names = [fake.unique.first_name () для i in диапазон (100)]

Каждый раз, когда будет выполняться приведенный выше код, он будет генерировать 100 уникальных имен.

 

Как создать фиктивные данные, связанные с валютой, с помощью пакета Faker?

Вы можете использовать следующие свойства Faker () для создания фиктивных данных, связанных с криптовалютой.

cryptocurrency () - создает имя криптовалюты и соответствующий ей код.

cryptocurrency_name () - создает имя криптовалюты.

cryptocurrency_code () - создает код криптовалюты.

Давайте реализуем некоторые из этих свойств и посмотрим на результаты.

fake.cryptocurrency_name () 'Биткойн'
fake.cryptocurrency () ('ETC', 'Ethereum Classic')

Вы можете использовать следующие свойства Faker () для создания фиктивных данных, связанных с валютой.

currency () - создает название валюты и соответствующий ей код.

currency_name () - создает название валюты.

currency_code () - создает код валюты.

fake.currency () ('TZS', 'танзанийский шиллинг')
fake.currency_name () 'Турецкая лира'

 

Использование пакета Faker из командной строки

После установки пакета Faker вы также можете вызвать его из командной строки. Вы можете написать код прямо в командной строке.

 

Что такое провайдеры?

До сих пор мы использовали свойства генератора Faker, такие как name (), first_name, last_name, address и т. Д. Многие такие свойства упакованы в Providers. Некоторые из них являются стандартными поставщиками, а другие - поставщиками сообщества, разработанными сообществом.

Существует множество стандартных поставщиков, таких как кредитная карта, дата_время, Интернет, лицо, профиль, банк и т. Д., Которые помогают в создании соответствующих фиктивных данных.

Вы можете найти дополнительную информацию о полном списке стандартных поставщиков и их свойствах. здесь.

Существует множество провайдеров сообщества, таких как кредитный рейтинг, авиаперелеты, автомобили, музыка, микросервисы и т. Д. Вы также можете создать своего провайдера и добавить его в пакет Faker.

Вы можете найти дополнительную информацию о полном списке поставщиков сообщества и их свойствах. здесь.

 

Как создать локализованные фиктивные данные с помощью пакета Faker?

Вы можете создать локализованные фиктивные данные, указав требуемый языковой стандарт в качестве аргумента Faker Generator.

Он также поддерживает несколько языков. В этом случае все языковые стандарты должны быть указаны в типе данных списка Python.

Локаль по умолчанию - en_US, то есть английский (США).

Давайте создадим код, чтобы создать 10 имен на хинди.

from faker import Faker fake = Faker ('hi_IN') для _ в диапазоне (10): print (fake.name ())
अद्वैत दयाल देन्यल अब्बासी हासन महाराज इशान जमानत कुमारी खान हासन विक्रम रामशर्मा हासन मंगल इन्दु गायकवाड श्री महाराज

 

Как создать фиктивный набор данных с помощью пакета Faker?

Мы создадим фиктивный набор данных из 100 человек с такими атрибутами, как работа, компания, место жительства, имя пользователя, имя, адрес, текущее местоположение, почта и т. Д. Мы будем использовать стандартные профили провайдера для создания этих данных и использовать фреймы данных Pandas для сохранения. Это.

from faker import Faker import pandas as pd fake = Faker () profileData = [fake.profile () for i in range (100)] df = pd.DataFrame (profileData) df

 

Фиктивные данные с использованием пакета Faker 1
Источник изображения: Создано автором

 

 

Альтернативные способы создания фиктивных данных в Python

Есть и другие способы создания фиктивных данных. Вот они:

  • Фальшивая фабрика

    Его можно использовать, когда вам нужны случайные поддельные данные, такие как строки, числа, даты, время, IP, адреса электронной почты и т. Д., Для быстрого тестирования вашего кода. Вы можете найти больше информации об этом здесь.

  • Использование модуля Random из библиотеки Numpy в Python

    Если вам нужны только псевдослучайные числа, их можно сгенерировать с помощью пакета random. Он имеет разные функции, такие как rand (), randint () и choice ().

Заключение

Мы узнали, как использовать пакет Faker в Python для создания различных типов данных. Мы изучили, как создавать имена, личные профили и данные, связанные с валютой. Мы также узнали, как воспроизводить те же фиктивные данные, а также как создавать уникальные данные. Мы изучили поставщиков, а также узнали, что можно создавать данные для конкретных регионов.

С этим пакетом мы можем сделать гораздо больше. Я поделился несколькими примерами создания фейковых данных. Надеюсь, это будет полезно для тестирования вашего приложения и сократит накладные расходы на поиск реальных данных.

 

Ссылки:

Для получения дополнительной информации о пакете Faker вы можете посетить здесь.

Медиа, показанные в этой статье, не принадлежат Analytics Vidhya и используются по усмотрению автора.

Источник: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

Отметка времени:

Больше от Аналитика Видхья