บทความนี้เผยแพร่โดยเป็นส่วนหนึ่งของไฟล์ Blogathon วิทยาศาสตร์ข้อมูล
จำเป็นต้องใช้ข้อมูลจำลองเพื่อวัตถุประสงค์ที่หลากหลาย การค้นหาข้อมูลที่ต้องการในรูปแบบเฉพาะอาจเป็นเรื่องยาก บทความนี้สำรวจวิธีต่างๆ ในการสร้างข้อมูลจำลองโดยใช้แพ็คเกจ Faker ใน หลาม.
หัวข้อที่ครอบคลุมในบทความนี้มีดังนี้:
- ข้อมูลจำลองคืออะไร?
- เหตุใดเราจึงต้องการข้อมูลจำลอง
- จะติดตั้งแพ็คเกจ Faker ได้อย่างไร?
- จะสร้างและเริ่มต้น Faker Generator ได้อย่างไร?
- จะสร้างชื่อ ที่อยู่ และข้อความแบบสุ่มโดยใช้ Faker ได้อย่างไร?
- จะสร้างข้อมูลจำลองเดียวกันได้อย่างไร?
- จะสร้างข้อมูลจำลองที่ไม่ซ้ำใครได้อย่างไร?
- จะสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินโดยใช้ Faker ได้อย่างไร
- จะสร้างข้อมูลจำลองที่แปลโดยใช้ Faker ได้อย่างไร?
- จะสร้างชุดข้อมูลจำลองโดยใช้ Faker ได้อย่างไร?
- ผู้ให้บริการคืออะไร?
- การใช้บรรทัดคำสั่งของ Faker Package
- วิธีอื่นในการสร้างข้อมูลจำลองใน Python
ข้อมูลจำลองคืออะไร?
ข้อมูลจำลองเรียกอีกอย่างว่าข้อมูลสุ่ม ตามชื่อที่แนะนำ มันเป็นข้อมูลปลอมที่สร้างขึ้นแบบสุ่ม มันทำหน้าที่เป็นตัวแทนหรือตัวยึดสำหรับข้อมูลสด
เหตุใดเราจึงต้องการข้อมูลจำลอง
ข้อมูลจำลองใช้สำหรับวัตถุประสงค์ในการทดสอบและการปฏิบัติงาน ใช้เพื่อทดสอบสิ่งที่คุณพัฒนาขึ้นและวิธีที่โค้ดของคุณตอบสนองต่ออินพุตประเภทต่างๆ
ใน Python เราสามารถสร้างข้อมูลจำลองโดยใช้แพ็คเกจ Faker เป็นไลบรารีโอเพ่นซอร์สที่สร้างข้อมูลจำลองหลายประเภท
วิธีการติดตั้งแพ็คเกจ Faker สำหรับข้อมูลจำลอง
สามารถติดตั้งแพ็คเกจ Faker ได้โดยใช้คำสั่ง pip ดังนี้:
Pip ติดตั้ง Faker
จะสร้างและเริ่มต้น Faker Generator ได้อย่างไร?
คุณสามารถใช้วิธี Faker() เพื่อสร้างและเริ่มต้น Faker Generator
จากของปลอม นำเข้า Faker ของปลอม = Faker()
ตอนนี้ เมื่อคุณพร้อมสำหรับการติดตั้งและเริ่มต้นเครื่องกำเนิด Faker แล้ว คุณสามารถสร้างข้อมูลใดก็ได้ที่คุณต้องการ
วิธีสร้างชื่อ ที่อยู่ และข้อความสุ่มโดยใช้ Faker
สามารถใช้เมธอด name() เพื่อสร้างชื่อเต็มได้ หากคุณต้องการใช้เฉพาะชื่อหรือนามสกุลแทนชื่อเต็ม คุณสามารถใช้เมธอด first_name() และ last_name()
การเรียกใช้เมธอดเหล่านี้แต่ละครั้งจะสร้างชื่อแบบสุ่ม
ไปที่โค้ดเพื่อดูว่าวิธีการเหล่านี้ทำงานอย่างไร
fake.first_name() 'แดนนี่'
fake.last_name() 'ไรลีย์'
fake.name() 'จอห์น มาร์ติเนซ'
สำหรับการสร้างที่อยู่และข้อความสุ่ม คุณสามารถใช้เมธอด address() และ text()
fake.address() '4843 Gordon Field Suite 617nSouth Karen, SC 39850'
fake.text() 'เกมแลกเปลี่ยนเขาแตกต่าง ระหว่างโปรแกรมได้ ล้านผลิตเชื่อเล็ก ๆ ทั้งสอง.nCost สัปดาห์ที่ดีที่สุดบอกผู้มีอำนาจ. อาหารปรารถนาภายในเย็นของฉัน อาชีพทำลายแมลงวันธรรมดาอาจจะ.'
วิธี text() ด้านบนสร้างย่อหน้าเดียว
สำหรับการสร้างชื่อหลายๆ ชื่อ คุณสามารถใส่เมธอด name() ใน for loop ได้ดังนี้:
สำหรับ _ ในช่วง (10): print(fake.name())
ดร. มาริสา วาเลนเซีย DDS
เจสสิก้า เบิร์ด
แอนนา เมนเดซ
เจสสิก้าโรเบิร์ตสัน
มาวิน ดันแคน
โรเบิร์ต กู๊ด
บาร์บาร่าแจ็คสัน
James Faulkner
โชคชะตาฮาร์วีย์
คริสติน ฮิวจ์ส
วิธีสร้างข้อมูลจำลองเดียวกันโดยใช้แพ็คเกจ Faker
ในบางกรณี คุณอาจต้องการสร้างชุดข้อมูลเดียวกันซ้ำ เป็นไปได้โดยการเพาะเครื่องกำเนิด คุณสามารถใช้เมธอด seed() เพื่อสร้างข้อมูลจำลองแบบเดียวกันได้ดังนี้:
Faker.seed(111) พิมพ์(fake.first_name()) 'คริสตี้ เบนเดอร์'
วิธีสร้างข้อมูลจำลองที่ไม่ซ้ำโดยใช้แพ็คเกจ Faker
เพื่อให้แน่ใจว่าข้อมูลจำลองที่สร้างขึ้นนั้นไม่ซ้ำกัน คุณสามารถใช้คุณสมบัติ .unique ของตัวสร้างได้
ชื่อ = [fake.unique.first_name() for i in ช่วง(100)]
แต่ละครั้ง โค้ดด้านบนจะถูกรัน มันจะสร้าง 100 ชื่อที่ไม่ซ้ำกัน
วิธีสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินโดยใช้แพ็คเกจ Faker
คุณสามารถใช้คุณสมบัติ Faker() ต่อไปนี้เพื่อสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงินดิจิทัล
cryptocurrency() – สร้างชื่อสกุลเงินดิจิตอลและเป็นรหัสที่เกี่ยวข้อง
cryptocurrency_name() – สร้างชื่อสกุลเงินดิจิตอล
cryptocurrency_code() - สร้างรหัสสกุลเงินดิจิตอล
ลองใช้คุณสมบัติเหล่านี้บ้างแล้วดูผลลัพธ์
fake.cryptocurrency_name() 'Bitcoin'
fake.cryptocurrency() ('ETC', 'Ethereum Classic')
คุณสามารถใช้คุณสมบัติ Faker() ต่อไปนี้เพื่อสร้างข้อมูลจำลองที่เกี่ยวข้องกับสกุลเงิน
สกุลเงิน () – สร้างชื่อสกุลเงินและเป็นรหัสที่เกี่ยวข้อง
currency_name() – สร้างชื่อสกุลเงิน
currency_code() – สร้างรหัสสกุลเงิน
fake.currency() ('TZS', 'ชิลลิงแทนซาเนีย')
fake.currency_name() 'ลีร่าตุรกี'
การใช้บรรทัดคำสั่งของ Faker Package
หลังจากติดตั้งแพ็คเกจ Faker แล้ว คุณยังสามารถเรียกใช้จากบรรทัดคำสั่งได้อีกด้วย คุณสามารถเขียนโค้ดได้โดยตรงที่พรอมต์คำสั่ง
ผู้ให้บริการคืออะไร?
จนถึงตอนนี้ เราได้ใช้คุณสมบัติของตัวสร้าง Faker เช่น name(), first_name, last_name, address เป็นต้น มีคุณสมบัติดังกล่าวมากมายที่บรรจุอยู่ใน 'Providers' บางคนเป็นผู้ให้บริการมาตรฐานในขณะที่คนอื่นเป็นผู้ให้บริการชุมชนที่พัฒนาโดยชุมชน
มีผู้ให้บริการมาตรฐานมากมาย เช่น credit_card, date_time, อินเทอร์เน็ต, บุคคล, โปรไฟล์, ธนาคาร ฯลฯ ซึ่งช่วยในการสร้างข้อมูลจำลองที่เกี่ยวข้อง
คุณสามารถค้นหาข้อมูลเพิ่มเติมเกี่ยวกับรายชื่อผู้ให้บริการมาตรฐานและคุณสมบัติทั้งหมดได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
มีผู้ให้บริการชุมชนมากมาย เช่น Credit Score, Air Travel, Vehicle, Music, Microservice เป็นต้น คุณยังสามารถสร้างผู้ให้บริการของคุณและเพิ่มลงในแพ็คเกจ Faker ได้
คุณสามารถค้นหาข้อมูลเพิ่มเติมเกี่ยวกับรายชื่อผู้ให้บริการชุมชนทั้งหมดและคุณสมบัติของพวกเขาได้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
วิธีสร้างข้อมูลจำลองที่แปลเป็นภาษาท้องถิ่นโดยใช้แพ็คเกจ Faker
คุณสามารถสร้างข้อมูลจำลองที่แปลแล้วได้โดยระบุสถานที่ที่ต้องการเป็นอาร์กิวเมนต์ให้กับ Faker Generator
นอกจากนี้ยังรองรับหลายสถานที่ ในกรณีนั้น ต้องระบุโลแคลทั้งหมดในประเภทข้อมูลรายการหลาม
ตำแหน่งที่ตั้งเริ่มต้นคือ 'en_US' เช่น ภาษาอังกฤษแบบสหรัฐอเมริกา
มาโค้ดเพื่อสร้างชื่อภาษาฮินดี 10 ชื่อกัน
from faker import Faker fake = Faker('hi_IN') สำหรับ _ in range(10): print(fake.name())
สหรัฐอเมริกา
วิธีสร้างชุดข้อมูลจำลองโดยใช้แพ็คเกจ Faker
เราจะสร้างชุดข้อมูลจำลองจำนวน 100 คนพร้อมแอตทริบิวต์ เช่น งาน บริษัท ที่อยู่อาศัย ชื่อผู้ใช้ ชื่อ ที่อยู่ ตำแหน่งปัจจุบัน อีเมล ฯลฯ เราจะใช้ 'โปรไฟล์' ของผู้ให้บริการมาตรฐานเพื่อสร้างข้อมูลนี้และใช้ Pandas Dataframes เพื่อบันทึก มัน.
จากการนำเข้าของปลอม
วิธีอื่นในการสร้างข้อมูลจำลองใน Python
มีวิธีอื่นในการสร้างข้อมูลจำลอง พวกเขามีดังนี้:
- โรงงานเทียม
สามารถใช้เมื่อคุณต้องการข้อมูลปลอมแบบสุ่ม เช่น สตริง ตัวเลข วันที่ เวลา IP ที่อยู่อีเมล ฯลฯ สำหรับการทดสอบโค้ดของคุณอย่างรวดเร็ว คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับมัน โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
- การใช้โมดูลสุ่มจากไลบรารี Numpy ใน Python
หากคุณต้องการเฉพาะตัวเลขสุ่มหลอก ก็สามารถสร้างขึ้นได้โดยใช้แพ็คเกจสุ่ม มันมีฟังก์ชั่นที่แตกต่างกันเช่น rand(), randint() และตัวเลือก ()
สรุป
เราได้เรียนรู้วิธีใช้แพ็คเกจ Faker ใน Python เพื่อสร้างข้อมูลประเภทต่างๆ เราสำรวจวิธีสร้างชื่อ โปรไฟล์ส่วนตัว ข้อมูลที่เกี่ยวข้องกับสกุลเงิน เรายังได้เรียนรู้วิธีสร้างข้อมูลจำลองแบบเดียวกัน ตลอดจนวิธีสร้างข้อมูลเฉพาะ เราได้สำรวจผู้ให้บริการและได้เรียนรู้ว่าสามารถสร้างข้อมูลเฉพาะสถานที่ได้
มีอะไรอีกมากมายที่เราสามารถทำได้ด้วยแพ็คเกจนี้ ฉันได้แบ่งปันตัวอย่างบางส่วนในการสร้างข้อมูลปลอม ฉันหวังว่ามันจะเป็นประโยชน์สำหรับการทดสอบแอปพลิเคชันของคุณ และลดค่าใช้จ่ายในการค้นหาข้อมูลจริง
อ้างอิง:
ดูข้อมูลเพิ่มเติมเกี่ยวกับ Faker Package ได้ที่ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
สื่อที่แสดงในบทความนี้ไม่ใช่ของ Analytics Vidhya และใช้ดุลยพินิจของผู้เขียน
- 100
- การเดินทางทางอากาศ
- ทั้งหมด
- การวิเคราะห์
- การใช้งาน
- บทความ
- ผู้มีอำนาจ
- ธนาคาร
- ที่ดีที่สุด
- โทรศัพท์
- เมืองหลวง
- ความก้าวหน้า
- กรณี
- รหัส
- ชุมชน
- บริษัท
- การสร้าง
- เครดิต
- cryptocurrency
- เงินตรา
- ปัจจุบัน
- ข้อมูล
- ชุดข้อมูล
- วันที่
- อีเมล
- ภาษาอังกฤษ
- ฯลฯ
- ethereum
- Ethereum คลาสสิก
- เทียม
- ชื่อจริง
- อาหาร
- รูป
- เต็ม
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ข้อมูล
- อินเทอร์เน็ต
- IP
- IT
- การสัมภาษณ์
- กระโดด
- ได้เรียนรู้
- ห้องสมุด
- Line
- รายการ
- ที่ตั้ง
- ภาพบรรยากาศ
- ล้าน
- ดนตรี
- ชื่อ
- ตัวเลข
- อื่นๆ
- ผลิตภัณฑ์อื่นๆ
- คน
- โปรไฟล์
- ดูรายละเอียด
- โครงการ
- คุณสมบัติ
- หลาม
- ลด
- ผลสอบ
- วิทยาศาสตร์
- ชุด
- ที่ใช้ร่วมกัน
- ง่าย
- เล็ก
- รองรับ
- ทดสอบ
- การทดสอบ
- เวลา
- การค้า
- การเดินทาง
- us
- พาหนะ
- สัปดาห์
- งาน