เมื่อเราเห็นรูปถ่ายหรือรูปถ่ายของฉากหนึ่งๆ เรามักจะนึกภาพออกว่าเสียงใดที่มาพร้อมกับเสียงนั้น แต่จะเป็นอย่างไรหากกลับด้าน และเราต้องจินตนาการถึงฉากที่ประกอบกับเสียง เราจะเข้าใกล้แค่ไหนในการสร้างฉากขึ้นมาใหม่ในความคิดของเรา โดยปราศจากอคติของการเลี้ยงดูและภูมิหลังของเราที่ทำให้สิ่งนี้กลายเป็นงานที่แทบจะเป็นไปไม่ได้ นี่คือจุดเน้นของโครงการโดย [ดีเอโก้ ทรูจิลโล ปิซานตี] ที่เขาเรียกว่า Blind Camera.
จากข้อมูลวิดีโอที่บันทึกในเม็กซิโกซิตี้ โครงข่ายประสาทเทียมที่สร้างขึ้นโดยใช้ Tensorflow 3 ได้รับการฝึกโดยใช้ GPU RTX 3080 บนชุดข้อมูลที่มีเฟรมจากวิดีโอเหล่านี้ซึ่งเชื่อมโยงกับเสียง ผลที่ตามมาคือ เมื่อโครงข่ายประสาทที่ได้รับการฝึกฝนมาแสดงด้วยโปรไฟล์เสียง ("ภาพถ่าย") ก็จะพยายามสร้างฉากขึ้นใหม่ตามอินพุตนี้และโมเดลของมัน ซึ่งทั้งหมดได้รับการปรับให้ทำงานบนเครือข่ายเดียว บอร์ด Raspberry Pi 3B
อย่างไรก็ตาม เนื่องจากตัวแบบทั้งหมดรู้ว่าเป็นภาพและเสียงของเม็กซิโกซิตี้ ภาพที่ได้จะถูกนำเสนอเป็นส่วนประกอบของฉากจากเมืองนี้เสมอ อย่างที่ [ดิเอโก] พูดไว้: สำหรับอุปกรณ์ทุกอย่างคือเมือง เป็นวิธีที่ดีในการแสดงให้เห็นว่าโครงข่ายประสาทเทียมไม่เพียงถูกจำกัดโดยข้อมูลการฝึกอบรมเท่านั้น แต่มนุษย์เราก็เช่นกัน
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- การเงิน EVM ส่วนต่อประสานแบบครบวงจรสำหรับการเงินแบบกระจายอำนาจ เข้าถึงได้ที่นี่.
- กลุ่มสื่อควอนตัม IR/PR ขยาย เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- ที่มา: https://hackaday.com/2023/06/12/blind-camera-visualizing-a-scene-from-its-sounds-alone/
- :มี
- :เป็น
- :ไม่
- 1
- 250
- a
- เหมาะ
- ทั้งหมด
- คนเดียว
- เสมอ
- an
- และ
- เป็น
- AS
- ที่เกี่ยวข้อง
- พื้นหลัง
- ตาม
- BE
- รับ
- อคติ
- คนตาบอด
- คณะกรรมการ
- แต่
- by
- โทร
- ห้อง
- CAN
- เมือง
- ปิดหน้านี้
- เนื้อหา
- ที่สร้างขึ้น
- เครดิต
- ข้อมูล
- ชุดข้อมูล
- สาธิต
- เครื่อง
- ดิเอโก
- ที่ฝัง
- เป็นหลัก
- อีเธอร์ (ETH)
- ทุกอย่าง
- ยอดเยี่ยม
- โฟกัส
- สำหรับ
- ราคาเริ่มต้นที่
- ได้รับ
- Go
- ไป
- GPU
- มี
- he
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- มนุษย์
- if
- ภาพ
- ภาพ
- in
- อินพุต
- เข้าไป
- IT
- ITS
- jpg
- น่าจะ
- ถูก จำกัด
- ความกว้างสูงสุด
- เม็กซิโก
- เม็กซิโกซิตี้
- ใจ
- แบบ
- เครือข่าย
- เครือข่าย
- ประสาท
- เครือข่ายประสาท
- เครือข่ายประสาทเทียม
- of
- on
- เพียง
- or
- ของเรา
- ภาพถ่าย
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- นำเสนอ
- โปรไฟล์
- โครงการ
- ทำให้
- ราสเบอร์รี่
- ราสเบอร์รี่ Pi
- บันทึก
- การแสดงผล
- ผล
- ส่งผลให้
- RTX
- RTX 3080
- วิ่ง
- ฉาก
- ฉาก
- เห็น
- ชุด
- ʶҹ·Õè·èͧà·ÕèÂÇ
- ตั้งแต่
- เดียว
- So
- เสียง
- งาน
- tensorflow
- ที่
- พื้นที่
- ของพวกเขา
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- ไปยัง
- เกินไป
- ผ่านการฝึกอบรม
- การฝึกอบรม
- จริง
- us
- การใช้
- วีดีโอ
- วิดีโอ
- การสร้างภาพ
- คือ
- ทาง..
- we
- คือ
- อะไร
- เมื่อ
- ที่
- จะ
- กับ
- ไม่มี
- จะ
- YouTube
- ลมทะเล