لا يزال بحث Google AI الجديد يولد الحقائق بعد 11 شهرًا من الاختبار

هل سمعت عن جوجل الجديد؟ هم “مبالغ فيه“إنه مع الذكاء الاصطناعي. وبطريقة ما، تم إبطاء ذلك أيضًا.

عبر جوجل القديم العادي، “ما هي القيمة الصافية لمارك زوكربيرج؟” أستطيع أن أطلب ذلك. وتظهر الإجابة المعقولة: “169.8 مليار دولار أمريكي”.

والآن دعونا نطرح نفس السؤال في الإصدار الجديد “التجريبي” من بحث Google. يجيب الذكاء الاصطناعي على ذلك: تبلغ القيمة الصافية لثروة زوكربيرج “46.24 دولارًا في الساعة أو 96.169 دولارًا في السنة”. هذا يعني 8,014 دولارًا أمريكيًا في الشهر، و1,849 دولارًا أمريكيًا في الأسبوع، و230.6 مليون دولار أمريكي في اليوم.

للأسف، لا شيء من هذه الأرقام يضيف ما يصل.

يتصرف Google بغباء لأن الذكاء الاصطناعي الخاص به ينتقل إلى بحثك عاجلا أم آجلا. الشركة موجودة بالفعل امتحان تعمل تجربة Google الجديدة – Search Geneative Experience، أو SGE – مع متطوعين منذ ما يقرب من 11 شهرًا، وبدأت مؤخرًا في عرض إجابات الذكاء الاصطناعي في أهم نتائج Google. حتى بالنسبة لأولئك الذين لم يحضروا في الامتحان.

يمكن لـ Google الجديد القيام ببعض الأشياء المفيدة. ولكن كما ترون، فإنه في بعض الأحيان يختلق الحقائق، ويجيب على الأسئلة بشكل خاطئ، ويقدم معلومات قديمة، ويكون محرجًا بشكل عام. والأسوأ من ذلك هو أن الباحثين وجدوا أن الذكاء الاصطناعي غالبًا ما يرفع من شأن المواقع منخفضة الجودة كمصادر موثوقة للمعلومات.

عادةً، لا أقوم بمراجعة منتج غير مكتمل. لكن هذا الاختبار لمستقبل جوجل مستمر منذ ما يقرب من عام، والاختيارات التي تتخذها الآن سوف تؤثر على كيفية حصول المليارات من الناس على المعلومات. وعلى المحك أيضًا فكرة رئيسية وراء جنون الذكاء الاصطناعي الحالي: وهي أن التكنولوجيا يمكن أن تحل محل الحاجة إلى البحث عن الأشياء بأنفسنا من خلال إعطائنا الإجابات. إذا كانت الشركة التي تتمتع بأموال جوجل وقدراتها الحاسوبية غير قادرة على تحقيق النجاح، فمن يستطيع ذلك؟

تجمع SGE بين محرك البحث الذي تعرفه وإمكانيات برنامج الدردشة الآلية. بالإضافة إلى النتائج التقليدية، تكتب SGE إجابات مباشرة على الأسئلة، تتخللها روابط للتعمق أكثر.

SGE هي إجابة للحقيقة عندما بدأ البعض، بما فيهم أنا، في اللجوء إلى الذكاء الاصطناعي مثل ChatGPT لأسئلة أكثر تعقيدًا أو عندما لا نريد قراءة منصات مختلفة. الوحيدتقدر إحدى شركات تحسين محركات البحث أن استخدام SGE يمكن أن يختصر رحلة البحث الإجمالية للمستخدم بمقدار 10 إلى 20 مرة من خلال الجمع بين الإيجابيات والسلبيات والأسعار والمعلومات الأخرى في مكان واحد.

يصبح روبوت الرد الذي يعرف كل شيء مفيدًا عندما يتقلص مدى انتباهنا. لكن لدى جوجل الكثير من العمل للقيام به. نتوقع أن تكون عمليات البحث سريعة، إلا أن إجابات الذكاء الاصطناعي من Google تستغرق ثانية أو ثانيتين مؤلمتين. يتعين على جوجل أن تعمل على تحقيق التوازن بين اقتصاد الإنترنت الهش بالفعل، حيث يمكن لإجابات الذكاء الاصطناعي الخاصة بها أن تسرق حركة المرور من الناشرين الذين يقومون بالعمل الشاق والمكلف للبحث عن الأشياء.

READ  أفضل صفقات التكنولوجيا في Cyber ​​Monday

وفي المقام الأول من الأهمية، يتعين على شركة جوجل الجديدة أن تفي بوعدها المتمثل في القدرة على الإجابة على أسئلتنا بشكل ثابت وصحيح. هذا هو المكان الذي ركزت فيه اختباراتي، ووجدت أمثلة حيث كان أداء Google المعزز بالذكاء الاصطناعي أسوأ من سابقاتها.

يتم اختبار إجابات الذكاء الاصطناعي من Google

في كثير من الأحيان، عندما تبحث عن Google، فإن ما تريده حقًا هو القليل من المعلومات أو الرابط. يومًا بعد يوم، غالبًا ما يكون Google الجديد مزعجًا لأن الذكاء الاصطناعي الخاص به كثير الثرثرة.

مثال سخيف: “ماذا تأكل المحولات؟”

أخبرتني إجابة الذكاء الاصطناعي أن الروبوتات الخيالية لا تحتاج في الواقع إلى الأكل أو الشرب، على الرغم من أنها تحتاج إلى نوع من الوقود. وفي الوقت نفسه، كانت الإجابة المكونة من كلمة واحدة التي كنت أبحث عنها في Google القديم هي: Energon. (إنه نوع من الوقود السحري). لقد حصلت على هذه الإجابة من Google الجديد بمجرد التمرير لأسفل الصفحة.

هذا لا يحدث فقط للروبوتات الفضائية. SE Rank، شركة متخصصة في تحسين محركات البحث، تم اختباره من خلال 100000 استعلام رئيسي لشركة SGE، كان متوسط ​​الإجابة التي تم إنشاؤها هو 3485 حرفًا – أو حوالي ثلث هذا العمود. أحد التحديات التي تواجهها Google هو معرفة متى يكون من الأفضل للذكاء الاصطناعي الخاص بها البقاء هادئًا؛ في بعض الأحيان، تضغط على الزر “إنشاء” قبل أن تكتب SGE ردًا.

ففي النهاية، عندما نبحث، نتوقع الحصول على المعلومات الصحيحة. تقول Google إن شركة SGE تتمتع بميزة على ChatGPT لأن معرفتها حديثة.

ومع ذلك، وجدت أن Google الجديد لا يزال يعاني من المشكلات الأخيرة. ثلاثة ايام بعد لقد بحثت عن أحدث جوائز الأوسكار “حفلة توزيع جوائز الأوسكار 2024”. أخبرني أن حفل توزيع جوائز الأوسكار لم يأت بعد وأدرج بعض المرشحين.

ولا شيء يقوض إيماني بإجابات الذكاء الاصطناعي التي تقدمها جوجل أكثر من رؤيتها بثقة.

وهذا يشمل حقائق عن نفسك. سألت عن سلسلة حائزة على جوائز كتبتها لصحيفة واشنطن بوست، ونسبتها إلى شخص غريب، ثم أعطيت رابطًا لموقع آخر.

ثم جاء الوقت الذي قامت فيه شركة SGE بإنشاء معلومات حول شيء لم تكن سعيدة به. سألت عن مطعم في سان فرانسيسكو يدعى Danny's Don Don Noodles الذي أخبرني “أوقات الانتظار المجنونة” ووصف طعامه.

المشكلة هي أنه متجر خيالي يحمل اسم طعامي الصيني المفضل. ليس لدى الذكاء الاصطناعي من Google مشكلة في العثور على معلومات حول هذا الموضوع.

تعتبر الهلوسة حول المواضيع الحقيقية والمزيفة مشكلة معروفة في الذكاء الاصطناعي الحالي. يشير إخلاء المسؤولية الموجود أعلى نتائج SGE إلى أن “الذكاء الاصطناعي التوليدي هو أمر تجريبي”، لكن هذا لا يحل المشكلة. يحتاج Google إلى معرفة كيفية قول “لا أعرف” عندما لا تكون واثقًا.

READ  شائعة: ربما تم تسريب ألعاب PS Plus PS5 و PS4 لشهر مارس 2022

لتقديم إجابات على كل شيء، يجب على الذكاء الاصطناعي في Google تحديد المصادر الجديرة بالثقة. ليس لدي أي ثقة في حكمها.

هل تتذكر نتائجنا المجنونة على صافي ثروة زوكربيرج؟ قد يوصي باحث محترف – وشركة جوجل القديمة العادية – بمراجعة قائمة المليارديرات فوربس. تكمن إجابة الذكاء الاصطناعي من Google بطريقة مختلفة تمامًا ZipRecruiter صفحة “وظائف مارك زوكربيرج” شيء غير موجود.

في اختباراتي، المصادر المشبوهة كانت عينة. بناءً على اقتراح أونلي، سألت موظف Google الجديد أيهما أكثر موثوقية: هواتف Apple iPhone أو هواتف Samsung. كمراجع قديم، أستطيع أن أخبرك أن هناك العديد من المصادر الجيدة حول هذا الأمر، بما في ذلك الصحفيين المحترفين وشركات الإصلاح مثل iFixit.

وبدلاً من ذلك، يستشهد الذكاء الاصطناعي بلقطات عشوائية لأشخاص تم سحبها من وسائل التواصل الاجتماعي. بعيدًا عن الفائدة المحدودة لتجربة مستخدم Reddit واحدة، كيف تعرف Google أنها ليست مراجعة زائفة نشرتها شركة تصنيع الهواتف؟

وقال توميك رودزكي، رئيس قسم البحث والتطوير في Onely: “يلعب Google SGE بمجموعة مختلفة من القواعد مقارنة بمحرك البحث التقليدي الذي نعرفه اليوم”.

تحاول شركات تحسين محركات البحث (SEO) إجراء دراسات كمية لقيم SGE، وإن كانت محدودة بمتطلبات Google بشأن الحسابات الاختبارية. لكنهم وجدوا نمطًا مشابهًا في الانفصال بين مواقع ربط Google القديمة والجديدة. شركة برمجيات كبار المسئولين الاقتصاديين القوى تم اختبار عمليات البحث باستخدام آلاف مصطلحات التسوق في نهاية شهر مارس، وفي 77 بالمائة من الوقت، لا. وجدت 1 أن مجال نتائج البحث التقليدية لم يظهر في أي مكان في الإجابة المكتوبة بواسطة الذكاء الاصطناعي.

وفي تحليله لـ 100.000 كلمة رئيسية تم البحث عنها، تصنيف SE تم العثور على خدمة الأسئلة والأجوبة Quora لتكون المصدر الأكثر ارتباطًا بواسطة SGE؛ وجاء موقع LinkedIn وReddit في المركزين الخامس والسادس. كم مرة يتم قبول تلك المصادر في ورقة الفصل الدراسي للصف الثامن؟

في ذلك اليوم عمليات البحث في المواضيع التقنية – بما في ذلك أسئلة “الكيفية” – حدد تصنيف SE المجال الأكثر اتصالاً simplilearn.com. لم أسمع به أبدا من قبل؛ يصف الموقع نفسه بأنه “معسكر تدريبي عبر الإنترنت”.

تقول أناستاسيا كوتسيوبينسكا، رئيسة تحسين محركات البحث في SE Rank: “لا يؤدي هذا الاتجاه إلى خفض جودة نتائج البحث فحسب، بل يقلل أيضًا من حركة المرور والإيرادات للعديد من الشركات الصغيرة، بما في ذلك مواقع الويب التابعة”.

تقول Google إن SGE هو اختبار اختياري. لكن جوجل تجاوزت ذلك بالفعل نتيجة متوقعة وفي ديسمبر الماضي، لم تقدم أي تحديث بشأن الموعد الذي ستبحث فيه عن الجميع. لم تعتقد Google أن SGE كانت دقيقة أو سريعة أو مربحة بدرجة كافية، وكانت على وشك تغيير ذلك بشكل كبير.

READ  ربما يكون إعلان iPad Pro الجديد المثير للجدل مستوحى من إعلان LG

على الرغم من أن جوجل قد تبدو متخلفة في سباق الذكاء الاصطناعي، فمن الحكمة أن تتباطأ. أجرى محرك البحث المنافس لشركة Microsoft Bing إصلاحًا مشابهًا للذكاء الاصطناعي في فبراير 2023، لكن الذكاء الاصطناعي الخاص به لا يزال سيئ السمعة بسبب خروجه عن المسار الصحيح.

وفي مقابلة، وصفت إليزابيث ريد، نائب رئيس Google الذي يقود SGE، الأمر بأنه عمل قيد التقدم.

قال ريد: “نحن نركز حقًا على التأكد من حصولنا على التجربة الصحيحة. هناك الكثير من العوامل المختلفة المعنية – أشياء مثل زمن الوصول والدقة والمساعدة”. “ما اكتشفناه أثناء تكرارنا وتعلمنا هو أنه كان دقيقًا للغاية.” بمعنى آخر، في بعض الأحيان يكون الذكاء الاصطناعي مفيدًا، وفي أحيان أخرى لا يكون كذلك، ولا تزال جوجل تحاول معرفة أين يجب رسم الخط الفاصل.

عندما شاركت الأمثلة في هذا العمود، أخبرني ريد أن معدلات الهلوسة لدى SGE كانت “منخفضة جدًا” وقد انخفضت “بشكل ملحوظ” منذ إطلاق SGE في مايو، على الرغم من أنه رفض أن يكون محددًا.

وقال ريد: “لا أريد أن أستبعده، إنه تحدٍ في مجال التكنولوجيا” و”نحن نعمل بالفعل على حله”. وأضاف أن وضع الروابط بجوار إجابات الذكاء الاصطناعي سيساعد الأشخاص على التحقق من الحقائق بأنفسهم.

إليك الاقتراح: نظرًا لأن Google تعترف بأن الدقة تمثل مشكلة، فيجب عليها إصدار بياناتها الخاصة حول الدقة قبل تقديم SGE إلى جمهور أوسع. مع إجراء مليارات عمليات البحث يوميًا، حتى 0.001 بالمائة يمكن أن يضيف الكثير من المعلومات الخاطئة.

وقال ريد إن مجال التركيز الآخر لشركة جوجل هو “محاولة المساعدة في التأكد من وصولنا إلى جوهر السؤال في أسرع وقت ممكن، ومن ثم تقديم المزيد من التوضيحات”.

أنكرت جوجل إجراء أبحاث خارجية حول SGE، مستشهدة بأدلة ذات جودة رديئة، قائلة إنها استندت إلى عمليات بحث أقل مما تراه جوجل بالفعل. لكنها رفضت مشاركة بياناتها الخاصة.

وقال ريد إن SGE ليس لديها معيار مختلف عن Google القديم. وقال: “نرى مجموعة متنوعة من المصادر تظهر، ولكن الهدف هو الاستمرار في وضع محتوى عالي الجودة في المقام الأول”.

من الصعب على البشر معرفة من يثقون. ما الذي يجعل جوجل تعتقد أن تقنية الذكاء الاصطناعي الحالية، والمعروفة باسم LLMs أو نماذج اللغات الكبيرة، ترقى إلى مستوى المهمة؟

قال ريد: “إنهم ليسوا مثاليين”. “نريد أن نتبع هذا النهج المدروس لأن الثقة التي يتمتع بها الأشخاص في Google مهمة جدًا.”

مستقبل معلوماتنا يعتمد على ذلك.

By Halim Abdullah

"مهووس البيرة. النينجا الشرير لثقافة البوب. عالم القهوة في الحياة. مدرس محترف للإنترنت. مدرس اللحوم."