Google ปล่อยโมเดลการบีบอัดภาพ ML ที่ดี… แต่สำหรับ JPEG-XL

โหนดต้นทาง: 1765805

แอปพลิเคชันใหม่ของแมชชีนเลิร์นนิงนั้นดูทั้งฉลาดและมีประโยชน์ ตรงข้ามกับคุณสมบัติทั่วไปของการอยู่ระหว่างความเป็นส่วนตัว ลิขสิทธิ์ หรืออันตรายต่อชีวิต แต่ก่อนที่คุณจะตื่นเต้นเกินไป คุณไม่สามารถมีมันได้

ต้นทุนที่แท้จริงของแอปพลิเคชัน ML นั้นแตกต่างกันไป หลายคนใช้งานได้ฟรี ซึ่งหมายความว่าพวกเขาเป็นอันตรายต่อรายได้ที่ได้รับจากใครบางคน การรู้จำเสียงทำให้คนยากจนเข้ามา ศูนย์บริการ ออกจากงาน โปรแกรมสร้างภาพ "AI" กีดกันศิลปินที่สร้างสรรค์จากรายได้และ เครื่องกำเนิดข้อความ "AI" คุกคามนักเขียน - ในงานไม่กี่งานเหล่านั้นที่รอดพ้นจากเว็บที่ทำลายวารสารศาสตร์สิ่งพิมพ์

การใช้ ML กับการบีบอัดและคลายการบีบอัดภาพดูเหมือนจะเป็นการใช้งานที่ค่อนข้างปลอดภัย การเพิ่มความชาญฉลาดให้กับการบีบอัดภาพทำให้รู้สึกเหมือนเป็นแนวคิดที่ได้รับแรงบันดาลใจที่รอช่วงเวลานั้นนับตั้งแต่นั้นเป็นต้นมา ไมเคิล บาร์นสลีย์ คิดค้น การบีบอัดภาพเศษส่วน ใน 1987

ใหม่ แบบจำลองศูนย์ความสนใจ ทำสิ่งที่แตกต่าง: ใช้การเรียนรู้ของเครื่องเพื่อพยายามระบุว่าส่วนใดของภาพที่จะดึงดูดความสนใจของมนุษย์ก่อน เพื่อให้สามารถเลือก ขยาย ภูมิภาคเหล่านั้นก่อน

โหลดบิตที่สำคัญก่อน

หากคุณโตพอที่จะจำได้ว่าดูภาพ GIF ที่ค่อยๆ ปรากฏขึ้นทีละบรรทัด ขณะที่ดาวน์โหลดผ่านโมเด็มผ่านสายโทรศัพท์ คุณจะเข้าใจคำอุทธรณ์ทันที แต่ตอนนี้มันเป็นเรื่องของการเชื่อมต่อมือถือและไร้สายมากกว่า ซึ่งความเร็วไม่เพียงเปลี่ยนแปลงอย่างรุนแรงแต่คาดเดาไม่ได้อีกด้วย

แนวคิดก็คือภาพทั้งภาพในเวอร์ชันความละเอียดต่ำจะปรากฏขึ้นตั้งแต่เริ่มต้น และเมื่อถึงเวลาที่เปลือกสมองส่วนการมองเห็นของคุณตัดสินใจได้ว่าจะชี้ไปที่รูม่านตาของคุณ พื้นที่ส่วนนั้นของภาพก็จะถูกทำให้คมชัดขึ้นแล้ว จากนั้นเมื่อคุณเพ่งความสนใจไปรอบ ๆ ภาพ อัลกอริทึมจะคาดเดาว่าดวงตาของคุณจะไปที่ไหนต่อไป และเติมรายละเอียดเพิ่มเติมในส่วนต่าง ๆ ต่อไป เมื่อส่วนเหล่านั้นค่อนข้างคมแล้ว ส่วนที่เหลือก็เติมเข้าไป ส่วนที่ค่อนข้างน่าเบื่อจะคงอยู่ตลอดไป

ถ้ามันทำงานได้ดีพอ คุณอาจไม่สังเกตว่ามันเกิดขึ้นด้วยซ้ำ ภาพลวงตาน่าจะเป็นรุ่นที่คมชัดสมบูรณ์แบบปรากฏขึ้นตั้งแต่เริ่มต้น เราขอแนะนำให้เล่นกับสิ่งนี้ สาธิตตราบใดที่คุณมีเบราว์เซอร์ที่ใช้ Chrome และคุณเปิดใช้โปรแกรมแสดงภาพ JPEG-XL รุ่นทดลอง: ไปที่ chrome://flags, ค้นหา jxl และเปิดใช้งาน

อัลกอริทึมอธิบายไว้ในโพสต์ชื่อ “โอเพนซอร์สโมเดลศูนย์ความสนใจ” ในบล็อกโอเพ่นซอร์สของ Google… และมีการประชดอยู่ และนั่นคือเหตุผลที่ย่อหน้าก่อนหน้าใช้โหมดเงื่อนไข เนื่องจากฟีเจอร์นี้ใช้ฟีเจอร์ใหม่ JPEG-XL รูปแบบภาพ – แบบที่ Google กล่าวว่าจะลบออกจาก Chrome เวอร์ชันอนาคต ย้อนกลับไปในเดือนตุลาคม

จะเป็นการดูถูกเหยียดหยามอย่างไร้เหตุผลของเราที่จะแนะนำว่าเนื่องจากรูปแบบนั้นจะถูกลบออกจาก Chrome 110 นั่นคือเหตุผลที่ Google ยินดีที่จะเปิดแหล่งที่มาของเทคโนโลยี ดังนั้นเราจะไม่ทำ ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน