في نهاية مؤتمر Google السنوي للمطورين I/O في Shoreline Amphitheatre في ماونتن فيو، كشف الرئيس التنفيذي لشركة Google، ساندر بيتشاي، أن الشركة قالت “AI” 121 مرة. كان هذا، في الأساس، جوهر الكلمة الرئيسية لشركة Google التي استمرت لمدة ساعتين، حيث تم إدخال الذكاء الاصطناعي في كل تطبيقات وخدمات Google التي يستخدمها أكثر من ملياري شخص حول العالم. فيما يلي جميع التحديثات الرئيسية التي أعلنت عنها Google في هذا الحدث.
تحديثات لـ Gemini 1.5 Flash وGemini 1.5 Pro
أعلنت Google عن نموذج جديد تمامًا للذكاء الاصطناعي يسمى Gemini 1.5 Flash، والذي تقول إنه مُحسّن من حيث السرعة والأداء. ويقع الفلاش بين Gemini 1.5 Pro وGemini 1.5 Nano، وهو الطراز الأصغر للشركة في السوق المحلية. قالت Google إنها أنشأت Flash مع بعض الأشياء التي تميز Gemini Pro عن النماذج المنافسة، مثل نافذة سياق أطول تضم مليون رمز، حيث أراد المطورون إنشاء تطبيقات وخدمات مدعومة بالذكاء الاصطناعي لجعله نموذجًا أخف وزنًا وأقل تكلفة من الجوزاء برو. في وقت لاحق من هذا العام، ستقوم جوجل بمضاعفة نافذة سياق جيميني إلى مليوني رمز مميز، مما يعني أنها تستطيع معالجة ساعتين من الفيديو، أو 22 ساعة من الصوت، أو أكثر من 60 ألف سطر، أو أكثر من 1.4 مليون كلمة في وقت واحد. .
مشروع أسترا
وبينما عرضت جوجل مشروع أسترا، وهو نسخة مبكرة من المساعد العالمي الذي يعمل بالذكاء الاصطناعي، قال تيميس هاسابيس، الرئيس التنفيذي لشركة ديب مايند في جوجل، إن نسخة جوجل من وكيل الذكاء الاصطناعي “ستكون مفيدة في الحياة اليومية”.
في مقطع فيديو تقول Google إنه تم تصويره في لقطة واحدة، يُظهر مستخدم Astra الكاميرا وهو يحمل هاتفه حول مكتب Google في لندن – مكبر صوت وبعض الرموز على السبورة البيضاء وخارج النافذة – وما يبدو أنه محادثة طبيعية مع الرئيس التنفيذي لشركة Google. برنامج. وفي إحدى اللحظات الأكثر إثارة للاهتمام في الفيديو، يخبر المستخدم بالمكان الذي وضعت فيه نظارتها بالضبط من قبل دون الحاجة إلى التقاطها.
ينتهي الفيديو بتطور – عندما يعثر المستخدم على النظارات المفقودة ويرتديها، نعلم أن لديها نظام كاميرا داخلي والقدرة على إجراء محادثة مع المستخدم بسلاسة باستخدام Project Astra. منافس لنظارات Meta’s Ray-Ban الذكية.
اسأل صور جوجل
لقد كانت خدمة Google Photos ذكية بالفعل عندما يتعلق الأمر بالبحث عن صور أو مقاطع فيديو محددة، ولكن مع الذكاء الاصطناعي، تنقل Google الأمور إلى المستوى التالي. إذا كنت مشتركًا في Google One في الولايات المتحدة، فستتمكن من طرح سؤال صعب على صور Google مثل “أرني أفضل صورة من كل حديقة وطنية قمت بزيارتها”، عندما يتم طرح الميزة في العام التالي. بضعة أشهر. تستخدم صور Google معلومات نظام تحديد المواقع العالمي (GPS) وتحدد “الأفضل” لتوفر لك الخيارات
صوت وصورة 3
تُسمى محركات إنشاء الوسائط الجديدة التي تعمل بالذكاء الاصطناعي من Google باسم Veo وImagen 3. Veo هو رد Google على Sora من OpenAI. قالت Google إنها تستطيع إنشاء مقاطع فيديو “عالية الجودة” بدقة 1080 بكسل تدوم “لأكثر من دقيقة” ويمكنها فهم المفاهيم السينمائية مثل الفواصل الزمنية.
وفي الوقت نفسه، فإن Image 3 عبارة عن مولد لتحويل النص إلى صورة تقول Google إنه يتعامل مع النص بشكل أفضل من سابقتها، Image 2. والنتيجة هي نموذج “تحويل النص إلى صورة” عالي الجودة للشركة، و”مستوى مذهل من التفاصيل”، وصور مشرقة ونابضة بالحياة” وعدد أقل من القطع الأثرية – مما يضعها أساسًا في مواجهة DALLE-3 من OpenAI.
تحديثات كبيرة لبحث Google
تُجري Google تغييرات كبيرة على طريقة عملها فيما يتعلق بمصطلحات البحث. تتضمن معظم التحديثات التي تم الإعلان عنها اليوم القدرة على طرح أسئلة أكثر تعقيدًا (“ابحث عن أفضل استوديوهات اليوغا أو البيلاتس في بوسطن واعرض تفاصيل حول عروضها التمهيدية وأوقات المشي من Beacon Hill.”) واستخدم البحث للتخطيط للوجبات والإجازات. “غير متاح حتى تقوم بالاشتراك في Search Labs، وهي منصة الشركة التي تتيح للأشخاص تجربة الميزات التجريبية.
لكن الميزة الجديدة الكبيرة التي تسميها جوجل تراكبات الذكاء الاصطناعي والتي كانت الشركة تختبرها منذ عام الآن، يتم طرحها أخيرًا لملايين الأشخاص في الولايات المتحدة. سيعرض بحث Google الآن الإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي في أعلى النتائج افتراضيًا، وتقول الشركة إنها ستوفر الميزة لأكثر من مليار مستخدم حول العالم بحلول نهاية العام.
الجوزاء على الروبوت
تقوم Google بدمج Gemini مباشرة في Android. عندما يتم طرح Android 15 في وقت لاحق من هذا العام، سيكون Gemini على علم بالتطبيق أو الصورة أو الفيديو الذي تقوم بتشغيله، ويمكنك سحبه وطرح أسئلة سياقية. أين يترك ذلك مساعد Google الذي يقوم بذلك بالفعل؟ من تعرف! لم تطرح Google هذا الأمر خلال الكلمة الرئيسية اليوم.
كانت هناك بعض التحديثات الأخرى كذلك. قالت جوجل إنها ستضيف علامات مائية رقمية إلى مقاطع الفيديو والنصوص التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، وستتيح إمكانية الوصول إلى Gemini في لوحة جانبية في Gmail وDocs، وستضيف فريقًا افتراضيًا يعمل بالذكاء الاصطناعي إلى مكان العمل الذي سيستمع إلى المكالمات الهاتفية ويكتشف ما إذا كنت تتحدث بالفعل أم لا. خدع. الوقت، وأكثر من ذلك بكثير.
تابع جميع الأخبار من Google I/O 2024 هنا!
“مهووس البيرة. النينجا الشرير لثقافة البوب. عالم القهوة في الحياة. مدرس محترف للإنترنت. مدرس اللحوم.”