باحثو جوجل AI يحلمون بأنواع جديدة من محركات البحث

عقدة المصدر: 1853271

تخيل مجموعة من الكتب - ربما الملايين أو حتى المليارات منها - رميها الناشرون عشوائياً في كومة متكدسة في أحد الحقول. كل يوم تنمو الكومة أضعافا مضاعفة.

تلك الكتب مليئة بالمعرفة والأجوبة. ولكن كيف يمكن للباحث أن يجدهم؟ تفتقر إلى التنظيم والكتب عديمة الفائدة.

هذا هو الإنترنت الخام بكل مجدها غير المصفاة. وهذا هو السبب في أن معظم مهامنا عن "التنوير" عبر الإنترنت تبدأ بـ Google (ونعم ، لا تزال هناك محركات بحث أخرى). تقوم مخالب Google الخوارزمية بمسح وفهرسة كل كتاب في تلك الكومة الشريرة. عندما يقوم شخص ما بإدخال استعلام في شريط البحث ، تقوم خوارزمية البحث بالاطلاع على نسختها المفهرسة من الإنترنت ، وتطرح الصفحات وتقدمها في قائمة مرتبة لأهم النتائج.

هذا النهج مفيد بشكل لا يصدق. مفيد جدًا ، في الواقع ، أنه لم يتغير بشكل أساسي منذ أكثر من عقدين. ولكن الآن ، يقوم باحثو الذكاء الاصطناعي في Google ، الشركة ذاتها التي وضعت المعايير لمحركات البحث في المقام الأول ، برسم مخطط لما قد يأتي بعد ذلك.

في باقة ورقة على خادم arXiv preprint، يقترح الفريق أن التكنولوجيا التي تجعل الإنترنت أكثر قابلية للبحث في متناول أيدينا. يقولون نماذج لغوية كبيرة -خوارزميات التعلم الآلي مثل OpenAI's GPT-3—يمكن أن يحل محل نظام الفهرس الحالي بالكامل ، ثم الاسترداد ، ثم الترتيب.

هل الذكاء الاصطناعي هو محرك البحث في المستقبل؟

عند البحث عن المعلومات ، يرغب معظم الناس في سؤال خبير والحصول على إجابة دقيقة وجديرة بالثقة ، كما يكتب المؤلفون. بدلا من ذلك ، جوجل ذلك. هذا يمكن أن يعمل ، أو أن يحدث خطأ فادح. مثل عندما يتم امتصاص حفرة أرنب مذعورة تتعلق بالصحة في الثانية صباحًا.

على الرغم من أن محركات البحث (التي نأمل أن تكون عالية الجودة) تحتوي على أجزاء من الإجابة على الأقل ، فإن العبء يقع على عاتق الباحث لمسح النتائج وتصفيتها وقراءتها لتجميع هذه الإجابة معًا بأفضل ما يمكن.

لقد تحسنت نتائج البحث بسرعة فائقة على مر السنين. ومع ذلك ، لا يزال هذا النهج بعيدًا عن الكمال.

هناك أدوات للأسئلة والأجوبة ، مثل Alexa و Siri و Google Assistant. لكن هذه الأدوات هشة ، ولديها مخزون محدود (وإن كان متناميًا) من الأسئلة التي يمكنهم الإجابة عليها. على الرغم من أن لديهم عيوبًا خاصة بهم (المزيد عن تلك أدناه) ، فإن نماذج اللغات الكبيرة مثل GPT-3 أكثر مرونة ويمكنها إنشاء ردود جديدة بلغة طبيعية لأي استفسار أو مطالبة.

يقترح فريق Google أن الجيل التالي من محركات البحث قد يجمع أفضل ما في جميع العوالم ، مما يؤدي إلى تحويل أفضل أنظمة استرداد المعلومات الحالية إلى ذكاء اصطناعي واسع النطاق.

تجدر الإشارة إلى أن التعلم الآلي يعمل بالفعل في محركات البحث الكلاسيكية التي تستخدم الفهرس - استرداد - ثم تصنيف. ولكن بدلاً من مجرد زيادة النظام ، اقترح المؤلفون أن التعلم الآلي يمكن أن يحل محله بالكامل.

"ماذا سيحدث إذا تخلصنا من فكرة الفهرس تمامًا واستبدلناها بنموذج كبير مُدرَّب مسبقًا يعمل على ترميز جميع المعلومات الموجودة في المجموعة بكفاءة وفعالية؟" يكتب دونالد ميتزلر والمؤلفون المشاركون في الورقة. "ماذا لو اختفى التمييز بين الاسترجاع والترتيب وبدلاً من ذلك كانت هناك مرحلة إنشاء استجابة واحدة؟"

إحدى النتائج المثالية التي يتصورونها هي إلى حد ما مثل كمبيوتر المركبة الفضائية في المؤسسة ستار تريك. يطرح الباحثون عن المعلومات أسئلة ، ويجيب النظام بشكل تحاوري - أي برد بلغة طبيعية كما تتوقع من خبير - ويتضمن الاستشهادات الموثوقة في إجابته.

في الورقة ، يرسم المؤلفون ما يسمونه مثالًا طموحًا لما قد يبدو عليه هذا النهج في الممارسة. يسأل أحد المستخدمين ، "ما الفوائد الصحية للنبيذ الأحمر؟" يعرض النظام إجابة دقيقة في نثر واضح من مصادر موثوقة متعددة - في هذه الحالة WebMD و Mayo Clinic - يسلط الضوء على الفوائد والمخاطر المحتملة لشرب النبيذ الأحمر.

ومع ذلك ، لا يجب أن ينتهي الأمر عند هذا الحد. لاحظ المؤلفون أن هناك فائدة أخرى للنماذج اللغوية الكبيرة وهي قدرتها على تعلم العديد من المهام مع القليل من التغيير والتبديل (وهذا ما يُعرف بالتعلم بلقطة واحدة أو القليل من اللقطات). لذلك قد يكونون قادرين على أداء جميع المهام نفسها التي تنجزها محركات البحث الحالية ، بالإضافة إلى العشرات من المهام الأخرى.

لا تزال مجرد رؤية

اليوم ، هذه الرؤية بعيدة المنال. النماذج اللغوية الكبيرة هي ما يسميه المؤلفون "المتعفون".

يمكن أن تنتج خوارزميات مثل GPT-3 نثرًا ، في بعض الأحيان ، لا يمكن تمييزه تقريبًا عن المقاطع المكتوبة من قبل البشر ، لكنها أيضًا لا تزال عرضة للردود غير المنطقية. والأسوأ من ذلك ، أنهم يعكسون بلا اكتراث التحيزات المضمنة في بيانات التدريب الخاصة بهم ، وليس لديهم شعور بالفهم السياقي ، ولا يمكنهم الاستشهاد بالمصادر (أو حتى مصادر منفصلة عالية الجودة ومنخفضة الجودة) لتبرير استجاباتهم.

كتب المؤلفون: "يُنظر إليهم على أنهم يعرفون الكثير ولكن معرفتهم عميقة". تحدد الورقة أيضًا الاختراقات اللازمة لسد الفجوة. في الواقع ، تنطبق العديد من التحديات التي يعرضونها على المجال ككل.

قد يكون التقدم الرئيسي هو تجاوز الخوارزميات التي تقوم فقط بنمذجة العلاقات بين المصطلحات (مثل الكلمات الفردية) إلى الخوارزميات التي تصمم أيضًا العلاقة بين الكلمات في مقالة ، على سبيل المثال ، والمقال ككل. بالإضافة إلى ذلك ، قد يقومون أيضًا بنمذجة العلاقات بين العديد من المقالات المختلفة عبر الإنترنت.

يحتاج الباحثون أيضًا إلى تحديد ما يشكل استجابة جيدة. هذا في حد ذاته ليس مهمة سهلة. ولكن ، بالنسبة للمبتدئين ، يقترح المؤلفون أن الاستجابات عالية الجودة يجب أن تكون موثوقة وشفافة وغير متحيزة ويمكن الوصول إليها وتحتوي على وجهات نظر متنوعة.

حتى أكثر الخوارزميات تطوراً اليوم لا تقترب من هذا الشريط. وسيكون من غير الحكمة نشر نماذج لغة طبيعية على هذا النطاق حتى يتم حلها. ولكن إذا تم حلها - وهناك بالفعل عمل يجري القيام به لمعالجته بعض هذه التحديات—محركات البحث لن تكون التطبيقات الوحيدة التي ستستفيد.

"رمادي مبكر ، حار"

إنها رؤية جذابة. البحث في صفحات الويب بحثًا عن إجابات أثناء محاولة تحديد ما هو جدير بالثقة وما هو غير جدير بالثقة يمكن أن يكون مرهقًا.

مما لا شك فيه أن الكثير منا لا يقوم بالمهمة كما ينبغي أو ينبغي.

ولكن من الجدير أيضًا التكهن بكيفية الوصول إلى الإنترنت بهذا الشكل من شأنه أن يغير الطريقة التي يساهم بها الناس فيه.

إذا كنا نستهلك المعلومات بشكل أساسي من خلال قراءة الردود النثرية التي تم تجميعها بواسطة الخوارزميات - بدلاً من فتح الصفحات الفردية وقراءتها - فهل سينشر المبدعون نفس القدر من العمل؟ وكيف يمكن لجوجل وغيره من صانعي محركات البحث أن يعوضوا المبدعين الذين ، في جوهرهم ، يصنعون المعلومات التي تدرب الخوارزميات بأنفسهم؟

سيظل هناك الكثير من الأشخاص الذين يقرؤون الأخبار ، وفي هذه الحالات ، ستحتاج خوارزميات البحث إلى تقديم قوائم من القصص. لكنني أتساءل عما إذا كان يمكن أن يحدث تحول طفيف حيث يضيف المبدعون الصغار أقل ، وبذلك ، فإن يصبح الويب أقل ثراءً بالمعلومات، مما يضعف الخوارزميات التي تعتمد على تلك المعلومات.

لا توجد طريقة لمعرفة ذلك. غالبًا ما تكون التكهنات متجذرة في مشاكل اليوم وتثبت براءتها في الإدراك المتأخر. في غضون ذلك ، سيستمر العمل بلا شك.

ربما سنقوم بحل هذه التحديات - والمزيد عند ظهورها - وفي أثناء ذلك نصل إلى ذلك الذي يعرف كل شيء ، والمحادثة الممتعة ستار تريك الكمبيوتر الذي تخيلناه منذ فترة طويلة.

الصورة الائتمان: X دينار / Unsplash

المصدر: https://singularityhub.com/2021/05/16/google-ai-researchers-are-dreaming-up-a-new-species-of-search-engine/

الطابع الزمني:

اكثر من التفرد المحور