Fakerパッケージを使用してPythonでダミーデータを作成する方法

プラトン再発行

フォロワー： 0

この記事は、の一部として公開されましたデータサイエンスブログソン

ダミーデータはさまざまな目的で必要です。特定の形式で必要なデータを見つけるのは難しい場合があります。この記事では、Fakerパッケージを使用してダミーデータを作成するさまざまな方法について説明します。 Python .

この記事で取り上げるトピックは次のとおりです。

ダミーデータとは？
なぜダミーデータが必要なのですか？
フェイカーパッケージをインストールするにはどうすればいいですか？
Faker Generatorを作成して初期化する方法は？
Fakerを使用して名前、住所、ランダムなテキストを作成するにはどうすればよいですか？
同じダミーデータを作成するにはどうすればよいですか？
一意のダミーデータを作成するにはどうすればよいですか？
Fakerを使用して通貨関連のダミーデータを作成するにはどうすればよいですか？
Fakerを使用してローカライズされたダミーデータを作成するにはどうすればよいですか？
Fakerを使用してダミーデータセットを作成するにはどうすればよいですか？
プロバイダーとは何ですか？
Fakerパッケージのコマンドラインでの使用
Pythonでダミーデータを作成する別の方法

ダミーデータとは何ですか？

ダミーデータはランダムデータとも呼ばれます。名前が示すように、ランダムに生成されるのは偽のデータです。ライブデータの代替またはプレースホルダーとして機能します。

なぜダミーデータが必要なのですか？

ダミーデータは、テストおよび運用の目的で使用されます。これは、開発したものと、コードがさまざまな種類の入力にどのように反応するかをテストするために使用されます。

Pythonでは、Fakerパッケージを使用してダミーデータを作成できます。これは、さまざまなタイプのダミーデータを生成するオープンソースライブラリです。

ダミーデータ用のFakerパッケージをインストールするにはどうすればよいですか？

次のようにpipコマンドを使用してFakerパッケージをインストールできます。

ピップインストールフェイカー

フェイカージェネレーターを作成して初期化する方法は？

Faker（）メソッドを使用して、FakerGeneratorを作成および初期化できます。

フェイカーからインポートフェイカーフェイク=フェイカー（）

これで、Fakerジェネレーターのインストールと初期化の準備ができたので、必要なデータを作成できます。

Fakerを使用して名前、住所、ランダムテキストを作成するにはどうすればよいですか？

name（）メソッドを使用して、フルネームを作成できます。フルネームの代わりにファーストネームまたはラストネームのみが必要な場合は、first_name（）メソッドとlast_name（）メソッドを使用できます。

これらのメソッドを呼び出すたびに、ランダムな名前が生成されます。

コードに飛び込んで、これらのメソッドがどのように機能するかを見てみましょう。

fake.first_name（） 'ダニー'

fake.last_name（） 'ライリー'

fake.name（） 'ジョンマルティネス'

アドレスとランダムテキストを作成するには、address（）メソッドとtext（）メソッドを使用できます。

fake.address（） '4843 Gordon Field Suite 617nSouth Karen、SC 39850'

fake.text（） 'ゲームトレードは彼とは異なります。 プログラムの間にできます。 百万の農産物は両方に沿って小さいと信じています。 夕方の私の中の食べ物の願い。 単純なフライブレイクのキャリアかもしれません。」

上記のtext（）メソッドは、単一の段落を作成しました。

複数の名前を作成する場合は、次のようにname（）メソッドをforループに入れることができます。

_ in range（10）の場合：print（fake.name（））

マリッサバレンシアDDS博士
ジェシカ・バード
アンナメンデス
ジェシカ・ロバートソン
マーヴィン・ダンカン
ロバート・グッド
バーバラ・ジャクソン
ジェームス・フォークナー
デスティニーハーベイ
クリスティンヒューズ

Fakerパッケージを使用して同じダミーデータを作成するにはどうすればよいですか？

場合によっては、同じデータセットを再現したいことがあります。ジェネレーターをシードすることで可能です。 seed（）メソッドを使用して、次のように同じダミーデータを生成できます。

Faker.seed（111）print（fake.first_name（））
'クリスティベンダー'

フェイカーパッケージを使用して一意のダミーデータを作成するにはどうすればよいですか？

生成されたダミーデータが一意であることを確認するには、ジェネレーターの.uniqueプロパティを使用できます。

名前= [fake.unique.first_name（） for i in range（100）]

上記のコードが実行されるたびに、一意の100個の名前が生成されます。

フェイカーパッケージを使用して通貨関連のダミーデータを作成するにはどうすればよいですか？

次のFaker（）プロパティを使用して、暗号通貨関連のダミーデータを作成できます

cryptocurrency（）–暗号通貨名とそれに対応するコードを作成します。

cryptocurrency_name（）–暗号通貨名を作成します。

cryptocurrency_code（）–暗号通貨コードを作成します。

これらのプロパティのいくつかを実装して、結果を見てみましょう。

fake.cryptocurrency_name（） 'ビットコイン'

fake.cryptocurrency（）（ 'ETC'、 'イーサリアムクラシック'）

次のFaker（）プロパティを使用して、通貨関連のダミーデータを作成できます

currency（）–通貨名とそれに対応するコードを作成します。

currency_name（）–通貨名を作成します。

currency_code（）–通貨コードを作成します。

fake.currency（）（ 'TZS'、 'タンザニアシリング'）

fake.currency_name（） 'トルコリラ'

フェイカーパッケージのコマンドライン使用法

Fakerパッケージのインストール後、コマンドラインから呼び出すこともできます。コマンドプロンプトで直接コードを書くことができます。

プロバイダーとは何ですか？

これまで、name（）、first_name、last_name、addressなどのFakerジェネレータープロパティを使用してきました。「プロバイダー」にパッケージ化されたそのようなプロパティは多数あります。標準プロバイダーもあれば、コミュニティによって開発されたコミュニティプロバイダーもあります。

クレジットカード、日付時刻、インターネット、個人、プロフィール、銀行など、関連するダミーデータの作成に役立つ多くの標準プロバイダーがあります。

標準プロバイダーとそのプロパティの完全なリストに関する詳細情報を見つけることができますこちら.

クレジットスコア、空の旅、乗り物、音楽、マイクロサービスなど、多くのコミュニティプロバイダーがあります。プロバイダーを作成して、Fakerパッケージに追加することもできます。

コミュニティプロバイダーとそのプロパティの完全なリストに関する詳細情報を見つけることができますこちら.

Fakerパッケージを使用してローカライズされたダミーデータを作成するにはどうすればよいですか？

必要なロケールをFakerGeneratorの引数として指定することにより、ローカライズされたダミーデータを作成できます。

また、複数のロケールをサポートします。その場合、すべてのロケールをpythonリストデータ型で指定する必要があります。

デフォルトのロケールは「en_US」、つまり米国英語です。

10個のヒンディー語の名前を作成するようにコーディングしましょう。

from faker import Faker fake = Faker（ 'hi_IN'）for _ in range（10）：print（fake.name（））

अद्वैतदयालदेन्यलअब्बासीहासनमहाराजइशानजमानतकुमारीखानहासनकालेविक्रमरामशर्माहासनमंगलइन्दुगायकवाडश्रीमहाराज

Fakerパッケージを使用してダミーデータセットを作成するにはどうすればよいですか？

仕事、会社、住居、ユーザー名、名前、住所、現在地、メールなどの属性を持つ100人のダミーデータセットを作成します。標準プロバイダーの「プロファイル」を使用してこのデータを作成し、Pandasデータフレームを使用して保存しますそれ。

from faker import Faker import pandas as pd fake = Faker（）profileData = [fake.profile（）for i in range（100）] df = pd.DataFrame（profileData）df

Pythonでダミーデータを作成する別の方法

ダミーデータを作成する方法は他にもいくつかあります。それらは次のとおりです。

フェイクファクトリー
コードをすばやくテストするために、文字列、数字、日付、時刻、IP、電子メールアドレスなどのランダムな偽のデータが必要な場合に使用できます。あなたはそれについてのより多くの情報を見つけることができますこちら.

PythonでNumpyライブラリのランダムモジュールを使用する

疑似乱数のみが必要な場合は、ランダムパッケージを使用して生成できます。 rand（）、randint（）、choice（）などのさまざまな関数があります。

まとめ

PythonでFakerパッケージを使用して、さまざまなタイプのデータを作成する方法を学びました。名前、個人プロファイル、通貨関連データを作成する方法を調査しました。また、同じダミーデータを再現する方法と、一意のデータを生成する方法も学びました。プロバイダーを調査し、ロケール固有のデータを作成できることも学びました。

このパッケージでできることは他にもたくさんあります。偽のデータを生成するいくつかの例を共有しました。アプリケーションのテストに役立ち、実際のデータを見つけるオーバーヘッドを減らすことができれば幸いです。