Google membebaskan model kompresi gambar ML yang bagus… tapi ini untuk JPEG-XL

Node Sumber: 1765805

Aplikasi baru pembelajaran mesin terlihat pintar dan praktis, berbeda dengan sifat yang lebih normal karena berada di antara privasi, hak cipta, atau membahayakan nyawa. Tetapi sebelum Anda terlalu bersemangat, Anda tidak dapat memilikinya.

Biaya sebenarnya dari aplikasi ML bervariasi. Banyak yang gratis untuk digunakan, yang berarti membahayakan penghasilan berbayar seseorang di suatu tempat. Pengenalan ucapan menempatkan orang miskin di dalamnya pusat panggilan keluar kerja. Generator gambar "AI". merampas penghasilan seniman kreatif, dan Generator teks "AI". mengancam penulis - dalam beberapa pekerjaan yang selamat dari web yang menghancurkan jurnalisme cetak.

Menerapkan ML ke kompresi dan dekompresi gambar tampaknya merupakan penggunaan yang relatif aman. Menambahkan lebih banyak kecanggihan pada kompresi gambar terasa seperti ide yang diilhami yang menunggu momennya sejak saat itu Michael Barnley ditemukan kompresi gambar fraktal di 1987.

Baru model pusat perhatian melakukan sesuatu yang berbeda: Menggunakan pembelajaran mesin untuk mencoba mengidentifikasi bagian gambar mana yang akan menarik perhatian manusia terlebih dahulu, sehingga dapat secara selektif dekompresi daerah-daerah itu terlebih dahulu.

Muat bit-bit penting terlebih dahulu

Jika Anda cukup tua untuk mengingat menonton gambar GIF secara bertahap muncul, baris demi baris, saat diunduh melalui modem dial-up, Anda akan segera memahami daya tariknya. Tapi sekarang ini lebih tentang koneksi seluler dan nirkabel, yang kecepatannya tidak hanya bervariasi secara liar tetapi juga tidak dapat diprediksi.

Idenya adalah bahwa versi beresolusi rendah dari seluruh gambar muncul tepat di awal, dan pada saat korteks visual Anda telah memutuskan ke mana harus mengarahkan pupil Anda, area gambar tersebut sudah semakin dipertajam. Kemudian saat perhatian Anda menjelajahi gambar, algoritme telah menebak ke mana arah mata Anda selanjutnya dan selanjutnya mengisi bagian-bagian tersebut dengan lebih mendetail. Setelah bagian-bagian itu cukup tajam, maka sisanya diisi, bagian yang relatif membosankan menjadi yang terakhir.

Jika itu bekerja dengan cukup baik, Anda mungkin tidak akan menyadarinya. Ilusinya adalah bahwa versi yang sangat tajam muncul tepat di awal. Kami merekomendasikan bermain dengan ini demonstrasi, selama Anda memiliki browser berbasis Chrome dan mengaktifkan perender gambar JPEG-XL eksperimentalnya: buka chrome://flags, pencarian untuk jxl dan aktifkan itu.

Algoritme dijelaskan dalam posting berjudul “Buka sumber model pusat perhatian” di blog sumber terbuka Google… dan disitulah letak ironi, dan itulah alasan paragraf sebelumnya menggunakan mode bersyarat. Karena fitur ini menggunakan yang baru JPEG-XL format gambar – salah satu itu Google mengatakan akan menghapus dari versi Chrome yang akan datang kembali di bulan Oktober

Ini akan menjadi sinis yang tidak dapat dibenarkan dan tidak dapat dipertahankan dari kami untuk menyarankan bahwa karena formatnya akan dihapus dari Chrome 110, itulah sebabnya Google bersedia untuk membuka sumber teknologi, jadi kami tidak akan melakukannya. ®

Stempel Waktu:

Lebih dari Pendaftaran