نحوه ایجاد داده های ساختگی در پایتون با استفاده از بسته Faker

گره منبع: 1100261

این مقاله به عنوان بخشی از بلاگاتون علم داده

داده های ساختگی برای اهداف مختلف مورد نیاز است. یافتن داده های مورد نیاز در یک قالب خاص می تواند دشوار باشد. این مقاله راه‌های مختلف ایجاد داده‌های ساختگی با استفاده از بسته Faker را بررسی می‌کند پــایتــون.

موضوعات مطرح شده در این مقاله به شرح زیر است:

  • داده های ساختگی چیست؟
  • چرا به داده های ساختگی نیاز داریم؟
  • چگونه پکیج Faker را نصب کنیم؟
  • چگونه یک Faker Generator ایجاد و مقداردهی اولیه کنیم؟
  • چگونه با استفاده از Faker یک نام، آدرس و متن تصادفی ایجاد کنیم؟
  • چگونه می توان همان داده های ساختگی را ایجاد کرد؟
  • چگونه داده های ساختگی منحصر به فرد ایجاد کنیم؟
  • چگونه داده های ساختگی مربوط به ارز را با استفاده از Faker ایجاد کنیم؟
  • چگونه با استفاده از Faker داده های ساختگی محلی ایجاد کنیم؟
  • چگونه با استفاده از Faker یک مجموعه داده ساختگی ایجاد کنیم؟
  • ارائه دهندگان چیست؟
  • استفاده از خط فرمان از بسته Faker
  • روش های جایگزین برای ایجاد داده های ساختگی در پایتون

 

Dummy Data چیست؟

به داده های ساختگی، داده های تصادفی نیز گفته می شود. همانطور که از نام آن پیداست، داده های جعلی هستند که به صورت تصادفی تولید می شوند. به عنوان یک جایگزین یا مکان نگهدار برای داده های زنده عمل می کند.

 

چرا به داده های ساختگی نیاز داریم؟

داده های ساختگی برای اهداف آزمایشی و عملیاتی استفاده می شود. از آن برای آزمایش آنچه توسعه داده اید و نحوه واکنش کد شما به انواع مختلف ورودی استفاده می شود.

در پایتون، می توان داده های ساختگی را با استفاده از بسته Faker ایجاد کرد. این یک کتابخانه منبع باز است که داده های ساختگی از انواع مختلف تولید می کند.

 

چگونه بسته Faker را برای Dummy Data نصب کنیم؟

می توان بسته Faker را با استفاده از دستور pip به صورت زیر نصب کرد:

Pip install Faker

 

چگونه یک ژنراتور Faker ایجاد و راه اندازی کنیم؟

می توان از متد Faker() برای ایجاد و مقداردهی اولیه یک Faker Generator استفاده کرد.

از واردات جعلی Faker Fake = Faker()

اکنون، همانطور که برای نصب و راه اندازی یک ژنراتور Faker آماده هستید، می توانید هر داده ای را که می خواهید ایجاد کنید.

 

چگونه با استفاده از Faker یک نام، آدرس و متن تصادفی ایجاد کنیم؟

از متد name() می توان برای ایجاد یک نام کامل استفاده کرد. اگر به جای نام کامل تنها نام یا نام خانوادگی را می خواهید، می توانید از روش های first_name() و last_name() استفاده کنید.

هر فراخوانی به این متدها یک نام تصادفی ایجاد می کند.

بیایید وارد کد شویم تا ببینیم این روش ها چگونه کار می کنند.

fake.first_name() 'دنی'
fake.last_name() 'Riley' 
fake.name() 'جان مارتینز'

برای ایجاد آدرس و متن تصادفی می توانید از متدهای address() و text() استفاده کنید.

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'تجارت بازی او متفاوت است. می تواند بین برنامه وجود دارد. میلیون‌ها محصول در طول هر دو ناچیز هستند. آرزوی غذا در عصر دور من. پرواز ساده شغلی ممکن است.

متد text() بالا یک پاراگراف واحد ایجاد کرد.

برای ایجاد چندین نام، می توانید متد name() را در حلقه for به صورت زیر قرار دهید:

برای _ در محدوده(10): print(fake.name())

دکتر ماریسا والنسیا DDS
جسیکا برد
آنا مندز
جسیکا رابرتسون
ماروین دانکن
رابرت گود
باربارا جکسون
جیمز فاکنر
سرنوشت هاروی
کریستین هیوز


 

چگونه می توان همان داده های ساختگی را با استفاده از بسته Faker ایجاد کرد؟

در برخی موارد، ممکن است بخواهید همان مجموعه داده را بازتولید کنید. با کاشت ژنراتور امکان پذیر است. می توانید از متد seed() برای تولید همان داده های ساختگی به صورت زیر استفاده کنید:

Faker.seed(111) print(fake.first_name())
'کریستی بندر'

 

چگونه با استفاده از بسته Faker داده های ساختگی منحصر به فرد ایجاد کنیم؟

برای اطمینان از منحصر به فرد بودن داده های ساختگی تولید شده، می توانید از ویژگی .unique ژنراتور استفاده کنید.

names = [fake.unique.first_name() برای i in محدوده (100)]

هر بار که کد فوق اجرا می شود، 100 نام منحصر به فرد ایجاد می کند.

 

چگونه با استفاده از بسته Faker داده‌های ساختگی مرتبط با ارز ایجاد کنیم؟

می‌توانید از ویژگی‌های Faker() زیر برای ایجاد داده‌های ساختگی مرتبط با ارزهای دیجیتال استفاده کنید

cryptocurrency() - نام رمز ارز و کد مربوطه را ایجاد می کند.

cryptocurrency_name() - نام ارز دیجیتال را ایجاد می کند.

cryptocurrency_code() - کد ارز دیجیتال را ایجاد می کند.

بیایید برخی از این ویژگی ها را پیاده سازی کنیم و نتایج را ببینیم.

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ("ETC"، "Ethereum Classic")

می توانید از ویژگی های Faker() زیر برای ایجاد داده های ساختگی مربوط به ارز استفاده کنید

currency() – نام واحد پول و کد مربوطه را ایجاد می کند.

Currency_name() – نام ارز را ایجاد می کند.

currency_code() – کد ارز را ایجاد می کند.

fake.currency ("TZS"، "شیلینگ تانزانیا")
fake.currency_name() 'لیره ترکیه'

 

استفاده از بسته Faker در خط فرمان

پس از نصب بسته Faker، می توانید آن را از خط فرمان نیز فراخوانی کنید. می توانید مستقیماً کد را در خط فرمان بنویسید.

 

ارائه دهندگان چیست؟

تاکنون از ویژگی‌های مولد Faker مانند name()، first_name، last_name، address و غیره استفاده کرده‌ایم. بسیاری از این ویژگی‌ها در «Providers» بسته‌بندی شده‌اند. برخی ارائه دهندگان استاندارد هستند در حالی که برخی دیگر ارائه دهندگان انجمن هستند که توسط انجمن توسعه یافته اند.

بسیاری از ارائه دهندگان استاندارد مانند اعتبار_کارت، تاریخ_زمان، اینترنت، شخص، نمایه، بانک و غیره وجود دارند که به ایجاد داده های ساختگی مربوطه کمک می کند.

می توانید اطلاعات بیشتری در مورد لیست کامل ارائه دهندگان استاندارد و ویژگی های آنها بیابید اینجا کلیک نمایید.

بسیاری از ارائه دهندگان انجمن مانند امتیاز اعتبار، سفر هوایی، وسیله نقلیه، موسیقی، میکروسرویس و غیره وجود دارند. همچنین می توانید ارائه دهنده خود را ایجاد کرده و آن را به بسته Faker اضافه کنید.

می توانید اطلاعات بیشتری در مورد لیست کامل ارائه دهندگان انجمن و ویژگی های آنها بیابید اینجا کلیک نمایید.

 

چگونه با استفاده از بسته Faker داده های ساختگی محلی ایجاد کنیم؟

شما می توانید با ارائه محلی مورد نیاز به عنوان آرگومان برای Faker Generator، داده های ساختگی محلی سازی شده را ایجاد کنید.

همچنین از چندین منطقه پشتیبانی می کند. در آن صورت، تمام محلی‌ها باید در نوع داده فهرست پایتون ارائه شوند.

محل پیش فرض "en_US" است، یعنی انگلیسی ایالات متحده.

بیایید برای ایجاد 10 نام هندی کدنویسی کنیم.

from faker import Faker fake = Faker('hi_IN') for _ in range(10): print(fake.name())
अद दयाल देन अब؟

 

چگونه با استفاده از بسته Faker یک مجموعه داده ساختگی ایجاد کنیم؟

ما یک مجموعه داده ساختگی متشکل از 100 نفر با ویژگی‌هایی مانند شغل، شرکت، محل سکونت، نام کاربری، نام، آدرس، مکان فعلی، ایمیل و غیره ایجاد خواهیم کرد. برای ایجاد این داده‌ها از «نمایه‌های» ارائه‌دهنده استاندارد استفاده می‌کنیم و برای ذخیره از Pandas Dataframes استفاده می‌کنیم. آی تی.

از واردات جعلی پانداهای وارداتی جعلی به عنوان پی دی جعلی = Faker() profileData = [fake.profile() برای i در محدوده(100)] df = pd.DataFrame(profileData) df

 

داده های ساختگی با استفاده از بسته Faker 1
منبع تصویر: ایجاد شده توسط نویسنده

 

 

روش های جایگزین برای ایجاد داده های ساختگی در پایتون

راه های دیگری برای ایجاد داده های ساختگی وجود دارد. آنها به شرح زیر است:

  • فاکس فاکتوری

    می توان از آن در مواقعی استفاده کرد که برای آزمایش سریع کد خود به برخی داده های جعلی تصادفی مانند رشته ها، اعداد، تاریخ ها، زمان ها، IP، آدرس های ایمیل و غیره نیاز دارید. می توانید اطلاعات بیشتری در مورد آن بیابید اینجا کلیک نمایید.

  • استفاده از ماژول تصادفی از کتابخانه Numpy در پایتون

    اگر فقط اعداد شبه تصادفی می خواهید، می توان آنها را با استفاده از بسته تصادفی تولید کرد. دارای توابع مختلفی مانند rand()، randint() و Choice().

نتیجه

ما یاد گرفتیم که چگونه از بسته Faker در پایتون برای ایجاد انواع مختلف داده استفاده کنیم. ما نحوه ایجاد نام، نمایه های شخصی، داده های مربوط به ارز را بررسی کردیم. ما همچنین یاد گرفتیم که چگونه همان داده های ساختگی و همچنین نحوه تولید داده های منحصر به فرد را بازتولید کنیم. ما ارائه‌دهندگان را بررسی کردیم و همچنین فهمیدیم که امکان ایجاد داده‌های محلی خاص وجود دارد.

کارهای بیشتری می توانیم با این بسته انجام دهیم. من چند نمونه از تولید داده های جعلی را به اشتراک گذاشته ام. امیدوارم برای آزمایش برنامه شما مفید باشد و هزینه سربار یافتن داده های واقعی را کاهش دهد.

 

منابع:

برای اطلاعات بیشتر در مورد پکیج Faker می توانید به سایت مراجعه کنید اینجا کلیک نمایید.

رسانه های نشان داده شده در این مقاله متعلق به Analytics Vidhya نیستند و به صلاحدید نویسنده استفاده می شوند.

منبع: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

تمبر زمان:

بیشتر از تجزیه و تحلیل Vidhya