วิธีสร้างข้อมูลจำลองใน Python โดยใช้ Faker Package

โหนดต้นทาง: 1100261

บทความนี้เผยแพร่โดยเป็นส่วนหนึ่งของไฟล์ Blogathon วิทยาศาสตร์ข้อมูล

จำเป็นต้องใช้ข้อมูลจำลองเพื่อวัตถุประสงค์ที่หลากหลาย การค้นหาข้อมูลที่ต้องการในรูปแบบเฉพาะอาจเป็นเรื่องยาก บทความนี้สำรวจวิธีต่างๆ ในการสร้างข้อมูลจำลองโดยใช้แพ็คเกจ Faker ใน หลาม.

หัวข้อที่ครอบคลุมในบทความนี้มีดังนี้:

  • ข้อมูลจำลองคืออะไร?
  • เหตุใดเราจึงต้องการข้อมูลจำลอง
  • จะติดตั้งแพ็คเกจ Faker ได้อย่างไร?
  • จะสร้างและเริ่มต้น Faker Generator ได้อย่างไร?
  • จะสร้างชื่อ ที่อยู่ และข้อความแบบสุ่มโดยใช้ Faker ได้อย่างไร?
  • จะสร้างข้อมูลจำลองเดียวกันได้อย่างไร?
  • จะสร้างข้อมูลจำลองที่ไม่ซ้ำใครได้อย่างไร?
  • จะสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินโดยใช้ Faker ได้อย่างไร
  • จะสร้างข้อมูลจำลองที่แปลโดยใช้ Faker ได้อย่างไร?
  • จะสร้างชุดข้อมูลจำลองโดยใช้ Faker ได้อย่างไร?
  • ผู้ให้บริการคืออะไร?
  • การใช้บรรทัดคำสั่งของ Faker Package
  • วิธีอื่นในการสร้างข้อมูลจำลองใน Python

 

ข้อมูลจำลองคืออะไร?

ข้อมูลจำลองเรียกอีกอย่างว่าข้อมูลสุ่ม ตามชื่อที่แนะนำ มันเป็นข้อมูลปลอมที่สร้างขึ้นแบบสุ่ม มันทำหน้าที่เป็นตัวแทนหรือตัวยึดสำหรับข้อมูลสด

 

เหตุใดเราจึงต้องการข้อมูลจำลอง

ข้อมูลจำลองใช้สำหรับวัตถุประสงค์ในการทดสอบและการปฏิบัติงาน ใช้เพื่อทดสอบสิ่งที่คุณพัฒนาขึ้นและวิธีที่โค้ดของคุณตอบสนองต่ออินพุตประเภทต่างๆ

ใน Python เราสามารถสร้างข้อมูลจำลองโดยใช้แพ็คเกจ Faker เป็นไลบรารีโอเพ่นซอร์สที่สร้างข้อมูลจำลองหลายประเภท

 

วิธีการติดตั้งแพ็คเกจ Faker สำหรับข้อมูลจำลอง

สามารถติดตั้งแพ็คเกจ Faker ได้โดยใช้คำสั่ง pip ดังนี้:

Pip ติดตั้ง Faker

 

จะสร้างและเริ่มต้น Faker Generator ได้อย่างไร?

คุณสามารถใช้วิธี Faker() เพื่อสร้างและเริ่มต้น Faker Generator

จากของปลอม นำเข้า Faker ของปลอม = Faker()

ตอนนี้ เมื่อคุณพร้อมสำหรับการติดตั้งและเริ่มต้นเครื่องกำเนิด Faker แล้ว คุณสามารถสร้างข้อมูลใดก็ได้ที่คุณต้องการ

 

วิธีสร้างชื่อ ที่อยู่ และข้อความสุ่มโดยใช้ Faker

สามารถใช้เมธอด name() เพื่อสร้างชื่อเต็มได้ หากคุณต้องการใช้เฉพาะชื่อหรือนามสกุลแทนชื่อเต็ม คุณสามารถใช้เมธอด first_name() และ last_name()

การเรียกใช้เมธอดเหล่านี้แต่ละครั้งจะสร้างชื่อแบบสุ่ม

ไปที่โค้ดเพื่อดูว่าวิธีการเหล่านี้ทำงานอย่างไร

fake.first_name() 'แดนนี่'
fake.last_name() 'ไรลีย์' 
fake.name() 'จอห์น มาร์ติเนซ'

สำหรับการสร้างที่อยู่และข้อความสุ่ม คุณสามารถใช้เมธอด address() และ text()

fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'เกมแลกเปลี่ยนเขาแตกต่าง ระหว่างโปรแกรมได้ ล้านผลิตเชื่อเล็ก ๆ ทั้งสอง.nCost สัปดาห์ที่ดีที่สุดบอกผู้มีอำนาจ. อาหารปรารถนาภายในเย็นของฉัน อาชีพทำลายแมลงวันธรรมดาอาจจะ.'

วิธี text() ด้านบนสร้างย่อหน้าเดียว

สำหรับการสร้างชื่อหลายๆ ชื่อ คุณสามารถใส่เมธอด name() ใน for loop ได้ดังนี้:

สำหรับ _ ในช่วง (10): print(fake.name())

ดร. มาริสา วาเลนเซีย DDS
เจสสิก้า เบิร์ด
แอนนา เมนเดซ
เจสสิก้าโรเบิร์ตสัน
มาวิน ดันแคน
โรเบิร์ต กู๊ด
บาร์บาร่าแจ็คสัน
James Faulkner
โชคชะตาฮาร์วีย์
คริสติน ฮิวจ์ส


 

วิธีสร้างข้อมูลจำลองเดียวกันโดยใช้แพ็คเกจ Faker

ในบางกรณี คุณอาจต้องการสร้างชุดข้อมูลเดียวกันซ้ำ เป็นไปได้โดยการเพาะเครื่องกำเนิด คุณสามารถใช้เมธอด seed() เพื่อสร้างข้อมูลจำลองแบบเดียวกันได้ดังนี้:

Faker.seed(111) พิมพ์(fake.first_name())
'คริสตี้ เบนเดอร์'

 

วิธีสร้างข้อมูลจำลองที่ไม่ซ้ำโดยใช้แพ็คเกจ Faker

เพื่อให้แน่ใจว่าข้อมูลจำลองที่สร้างขึ้นนั้นไม่ซ้ำกัน คุณสามารถใช้คุณสมบัติ .unique ของตัวสร้างได้

ชื่อ = [fake.unique.first_name() for
 i in ช่วง(100)]

แต่ละครั้ง โค้ดด้านบนจะถูกรัน มันจะสร้าง 100 ชื่อที่ไม่ซ้ำกัน

 

วิธีสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินโดยใช้แพ็คเกจ Faker

คุณสามารถใช้คุณสมบัติ Faker() ต่อไปนี้เพื่อสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินดิจิทัล

cryptocurrency() – สร้างชื่อสกุลเงินดิจิตอลและเป็นรหัสที่เกี่ยวข้อง

cryptocurrency_name() – สร้างชื่อสกุลเงินดิจิตอล

cryptocurrency_code() - สร้างรหัสสกุลเงินดิจิตอล

ลองใช้คุณสมบัติเหล่านี้บ้างแล้วดูผลลัพธ์

fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')

คุณสามารถใช้คุณสมบัติ Faker() ต่อไปนี้เพื่อสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงิน

สกุลเงิน () – สร้างชื่อสกุลเงินและเป็นรหัสที่เกี่ยวข้อง

currency_name() – สร้างชื่อสกุลเงิน

currency_code() – สร้างรหัสสกุลเงิน

fake.currency() ('TZS', 'ชิลลิงแทนซาเนีย')
fake.currency_name() 'ลีร่าตุรกี'

 

การใช้บรรทัดคำสั่งของ Faker Package

หลังจากติดตั้งแพ็คเกจ Faker แล้ว คุณยังสามารถเรียกใช้จากบรรทัดคำสั่งได้อีกด้วย คุณสามารถเขียนโค้ดได้โดยตรงที่พรอมต์คำสั่ง

 

ผู้ให้บริการคืออะไร?

จนถึงตอนนี้ เราได้ใช้คุณสมบัติของตัวสร้าง Faker เช่น name(), first_name, last_name, address เป็นต้น มีคุณสมบัติดังกล่าวมากมายที่บรรจุอยู่ใน 'Providers' บางคนเป็นผู้ให้บริการมาตรฐานในขณะที่คนอื่นเป็นผู้ให้บริการชุมชนที่พัฒนาโดยชุมชน

มีผู้ให้บริการมาตรฐานมากมาย เช่น credit_card, date_time, อินเทอร์เน็ต, บุคคล, โปรไฟล์, ธนาคาร ฯลฯ ซึ่งช่วยในการสร้างข้อมูลจำลองที่เกี่ยวข้อง

คุณสามารถค้นหาข้อมูลเพิ่มเติมเกี่ยวกับรายชื่อผู้ให้บริการมาตรฐานและคุณสมบัติทั้งหมดได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

มีผู้ให้บริการชุมชนมากมาย เช่น Credit Score, Air Travel, Vehicle, Music, Microservice เป็นต้น คุณยังสามารถสร้างผู้ให้บริการของคุณและเพิ่มลงในแพ็คเกจ Faker ได้

คุณสามารถค้นหาข้อมูลเพิ่มเติมเกี่ยวกับรายชื่อผู้ให้บริการชุมชนทั้งหมดและคุณสมบัติของพวกเขาได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

 

วิธีสร้างข้อมูลจำลองที่แปลเป็นภาษาท้องถิ่นโดยใช้แพ็คเกจ Faker

คุณสามารถสร้างข้อมูลจำลองที่แปลแล้วได้โดยระบุสถานที่ที่ต้องการเป็นอาร์กิวเมนต์ให้กับ Faker Generator

นอกจากนี้ยังรองรับหลายสถานที่ ในกรณีนั้น ต้องระบุโลแคลทั้งหมดในประเภทข้อมูลรายการหลาม

ตำแหน่งที่ตั้งเริ่มต้นคือ 'en_US' เช่น ภาษาอังกฤษแบบสหรัฐอเมริกา

มาโค้ดเพื่อสร้างชื่อภาษาฮินดี 10 ชื่อกัน

from faker import Faker fake = Faker('hi_IN') สำหรับ _ in range(10): print(fake.name())
สหรัฐอเมริกา

 

วิธีสร้างชุดข้อมูลจำลองโดยใช้แพ็คเกจ Faker

เราจะสร้างชุดข้อมูลจำลองจำนวน 100 คนพร้อมแอตทริบิวต์ เช่น งาน บริษัท ที่อยู่อาศัย ชื่อผู้ใช้ ชื่อ ที่อยู่ ตำแหน่งปัจจุบัน อีเมล ฯลฯ เราจะใช้ 'โปรไฟล์' ของผู้ให้บริการมาตรฐานเพื่อสร้างข้อมูลนี้และใช้ Pandas Dataframes เพื่อบันทึก มัน.

จากการนำเข้าของปลอม

 

ข้อมูลจำลองโดยใช้ Faker Package 1
ที่มาของภาพ: สร้างโดยผู้แต่ง

 

 

วิธีอื่นในการสร้างข้อมูลจำลองใน Python

มีวิธีอื่นในการสร้างข้อมูลจำลอง พวกเขามีดังนี้:

  • โรงงานเทียม

    สามารถใช้เมื่อคุณต้องการข้อมูลปลอมแบบสุ่ม เช่น สตริง ตัวเลข วันที่ เวลา IP ที่อยู่อีเมล ฯลฯ สำหรับการทดสอบโค้ดของคุณอย่างรวดเร็ว คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับมัน โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

  • การใช้โมดูลสุ่มจากไลบรารี Numpy ใน Python

    หากคุณต้องการเฉพาะตัวเลขสุ่มหลอก ก็สามารถสร้างขึ้นได้โดยใช้แพ็คเกจสุ่ม มันมีฟังก์ชั่นที่แตกต่างกันเช่น rand(), randint() และตัวเลือก ()

สรุป

เราได้เรียนรู้วิธีใช้แพ็คเกจ Faker ใน Python เพื่อสร้างข้อมูลประเภทต่างๆ เราสำรวจวิธีสร้างชื่อ โปรไฟล์ส่วนตัว ข้อมูลที่เกี่ยวข้องกับสกุลเงิน เรายังได้เรียนรู้วิธีสร้างข้อมูลจำลองแบบเดียวกัน ตลอดจนวิธีสร้างข้อมูลเฉพาะ เราได้สำรวจผู้ให้บริการและได้เรียนรู้ว่าสามารถสร้างข้อมูลเฉพาะสถานที่ได้

มีอะไรอีกมากมายที่เราสามารถทำได้ด้วยแพ็คเกจนี้ ฉันได้แบ่งปันตัวอย่างบางส่วนในการสร้างข้อมูลปลอม ฉันหวังว่ามันจะเป็นประโยชน์สำหรับการทดสอบแอปพลิเคชันของคุณ และลดค่าใช้จ่ายในการค้นหาข้อมูลจริง

 

อ้างอิง:

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Faker Package ได้ที่ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

สื่อที่แสดงในบทความนี้ไม่ใช่ของ Analytics Vidhya และใช้ดุลยพินิจของผู้เขียน

ที่มา: https://www.analyticsvidhya.com/blog/2021/09/how-to-create-dummy-data-in-python-using-faker-package/

ประทับเวลา:

เพิ่มเติมจาก การวิเคราะห์ วิทยา