تحرر Google نموذج ضغط الصور ML الأنيق ... ولكنه مخصص لـ JPEG-XL

عقدة المصدر: 1765805

يبدو التطبيق الجديد للتعلم الآلي ذكيًا ومفيدًا على حد سواء ، على عكس الخصائص الطبيعية التي تكون في مكان ما بين الخصوصية أو حقوق النشر أو تعريض الحياة للخطر. لكن قبل أن تصبح متحمسًا جدًا ، لا يمكنك الحصول عليه.

التكلفة الحقيقية لتطبيقات ML تختلف. العديد منهم أحرار في الاستخدام ، مما يعني أنهم يعرضون الدخل المدفوع لشخص ما للخطر في مكان ما. التعرف على الكلام يضع الفقراء في دعوة مراكز خارج العمل. مولدات الصور "AI" حرمان الفنانين المبدعين من دخلهم ، و مولدات النص “AI” يهدد الكتاب - في تلك الوظائف القليلة التي نجت من تدمير الويب للصحافة المطبوعة ، على أي حال.

يبدو أن تطبيق ML على ضغط الصور وإلغاء الضغط يعد استخدامًا آمنًا نسبيًا. لقد شعرت إضافة المزيد من الذكاء إلى ضغط الصور أنها كانت فكرة ملهمة تنتظر لحظتها منذ ذلك الحين مايكل بارنسلي اخترع ضغط الصورة النمطي هندسي متكرر في 1987.

الجديد نموذج مركز الانتباه يفعل شيئًا مختلفًا: يستخدم التعلم الآلي لمحاولة تحديد أي أجزاء من الصورة ستجذب انتباه الإنسان أولاً ، بحيث يمكن أن يكون انتقائيًا ضغط تلك المناطق أولاً.

قم بتحميل البتات المهمة أولاً

إذا كنت تبلغ من العمر ما يكفي لتتذكر مشاهدة صور GIF تظهر تدريجياً ، سطراً بسطر ، أثناء تنزيلها عبر مودم طلب هاتفي ، فستستوعب الطلب فورًا. لكن الأمر الآن يتعلق باتصالات الهاتف المحمول واللاسلكي ، التي لا تختلف سرعتها بشكل كبير ولكن بشكل غير متوقع.

الفكرة هي أن نسخة منخفضة الدقة من الصورة بأكملها تظهر مباشرة في البداية ، وبحلول الوقت الذي قررت فيه القشرة البصرية الخاصة بك إلى أين توجه تلاميذك ، فإن تلك المنطقة من الصورة قد أصبحت أكثر وضوحًا بالفعل. ثم بينما يتجول انتباهك حول الصورة ، خمنت الخوارزمية إلى أين ستذهب عيناك بعد ذلك وتملأ بمزيد من التفاصيل في تلك الأجزاء بعد ذلك. بمجرد أن تصبح هذه الأجزاء حادة إلى حد ما ، يتم ملء الباقي ، وتكون الأجزاء المملة نسبيًا هي الأخيرة.

إذا نجحت بشكل جيد ، فمن المحتمل أنك لن تلاحظ حدوثها. سيكون الوهم أن نسخة حادة تمامًا ظهرت في البداية. نوصي باللعب بهذا تمثيل، طالما أن لديك متصفحًا يستند إلى Chrome وقمت بتمكين عارض الصور JPEG-XL التجريبي الخاص به: انتقل إلى chrome://flags، البحث عن jxl وتمكينها.

تم وصف الخوارزمية في منشور بعنوان "المصدر المفتوح لنموذج مركز الاهتمام" على مدونة Google مفتوحة المصدر ... وهناك تكمن المفارقة ، وهذا هو سبب استخدام الفقرة السابقة للوضع الشرطي. لأن هذه الميزة تستخدم ملف جبيغ-XL تنسيق الصورة - الذي قالت Google إنها ستزيل من الإصدارات المستقبلية من Chrome مرة أخرى في أكتوبر.

سيكون من غير المبرر والسخرية منا أن نقترح أنه نظرًا لأنه يجب إزالة التنسيق من Chrome 110 ، فإن هذا هو السبب في أن Google مستعدة لفتح مصدر التكنولوجيا ، لذلك لن نفعل ذلك. ®

الطابع الزمني:

اكثر من السجل