أخبار
أخر الأخبار

إصدارات جديدة من نماذج الذكاء الاصطناعي Gemini في مؤتمر جوجل 2024

جوجل عملت مؤتمرها للمطورين IO 2024.. وعملت عظمة!

1- إصدارات جديدة من نماذج الذكاء الاصطناعي Gemini

جيميناي 1.5 برو Gemini 1.5 Pro

وده مش جديد (نزل في فبراير) بس جوجل أضافت تحديثات جديدة عليه

زي انه دلوقتي بقى الـ Context Window بتوصل لحد 2 مليون توكين (بعد ما كان مليون توكن فقط)

يعني تقدر تدخل فيديو مدته ساعتين وتسأل جيميناي عن حاجة فيه

أو ترفع 22 ساعة من تسجيلات صوتية وتخليه يحللها

أو تدخل حوالي 60 ألف سطر من الأكواد البرمجية وتخليه يراجع ويحلل ويصحح

أو 1.4 مليون كلمة وتطلب منه يعمل عليهم أي حاجة

برضو من ضمن التحديثات انه اتطور كتير في الترجمة بين اللغات والتعامل مع النصوص والأكواد البرمجية

جيميناي 1.5 فلاش Gemini 1.5 Flash

وده ياسيدي نسخة خفيفة من البرو، ومخصوصة للاستخدامات السريعة زي انه يشغل مساعد صوتي ذكي ويبدأ يعمل حوار بالصوت هات وخد

كمان هايل مع تلخيص النصوص وتحليل الصور والفيديوهات، واستخلاص المعلومات من داخل المستندات النصية الضخمة

العظمة الحقيقية هو نظام التدريب اللي استخدمته جوجل عشان تدرب “جيميناي فلاش 1.5” ده

وهو أسلوب التقطير Distillation، وده خلت النموذج العملاق Gemini Pro يدرب النموذج الصغير بحيث ينقل له كل قدراته وخبراته

ولكن من غير ما يحتاج إمكانيات ضخمة عشان يقدم كل ده.. وده خلاه أسرع وأخف

في رأيي الشخصي ده رد مباشر من جوجل على نموذج أوبن إيه آي GPT-4o

جيميناي نانو Gemini Nano

وده برضو مش جديد لانه نزل السنة اللي فاتت، وهو مخصوص من جيميناي بتستهدف الأجهزة ذات الميموري المحدودة زي الموبايلات

التحديث اللي جاي لجيميناي نانو (وهيبقى اسمه Gemini Nano with MultiModality)

انه هيبقى قادر يشوف ويسمع كويس أوي من خلال كاميرا وميكروفون الموبايل

بحيث يقدر المستخدم يسأله بصوته عن أي حاجة تشوفها عين الكاميرا أو تسمعها ودن الميكروفون!

التحديث هيوصل طبعا موبايلات بيكسل الأول وبعدها يجي لباقي الموبايلات الأندرويد!

2- نيجي بقى للجزء العبقري بتاع تحديثات أدوات إنشاء الصور.. والفيديوهات!

مبدئيا كدا وأخيرا، جوجل نزلت لاعب ينافس راس بـ راس قصاد نموذج Sora التحفة من أوبن إيه آي

نموذج جوجل اسمع Veo بيقدر ينشئ فيديوهات بمدة بتعدي الدقيقة وكواليتي 1080p

بيفهم مصطلحات وزوايا وكادرات السينما والتصوير الاحترافي

جوجل ليها باع طويل في تدريب وتطوير نماذج الذكاء الاصطناعي اللي بتحلل الصور والفيديوهات (جوجل ف السوق ده من 2016)

ولكن Veo هو أول خطوة فعلية للنزول بمنتج إلى السوق..

النموذج هيكون متاح بشكل محدود للاستخدام على منصة إنتاج الفيديوهات بالذكاء الاصطناعي VideoFX وقريب أوي هتوصل جوا أدوات صناع المحتوى على Youtube Shorts!

نموذج Imagen 3

الجيل التالت من منصة إيماجين لتصميم الصور بالذكاء الاصطناعي عاملة أداء خرافي بصراحة في رأيي

النموذج الجديد بيقدر يفهم انت تقصد ايه من الأمر النصي اللي انت كتبته، وبقى عنده قدرة أفضل على فهم والتقاط

التفاصيل الصغيرة في الوصف النصي عشان يقدر يطلعلك تصميم للصورة بأقرب شكل للي في خيالك..

كمان وجوه البشر والسنان والأيدي إلى حد كبير دقيق ومقنع

برضو النصوص المكتوبة في تصميمات الصور ظاهرة واضحة ومتناسقة وماسكة نفسها كدا بشكل واضح ويتقري بسهولة

وده متاح بشكل محدود على منصة ImageFX لجوجل، وقريب هيوصل على منصة Vertex AI!

3- يلا بينا نروح ع الأندرويد!

جوجل نزلت تقريبا 4 مزايا جديدة حلوين أوي في رأيي المتواضع بالذكاء الاصطناعي جوا موبايلات أندرويد وهم:

ميزة الحماية من النصب: (تعتمد على جيميناي نانو)

دي ميزة هتخلي الذكاء الاصطناعي على موبايلك الأندرويد (من غير إنترنت)

يقدر يسمع مكالمتك، ولو حس ان فيه حد بيحاول ينصب عليك.. هيطلعلك رسالة تنبيهية تحذرك!

مثلا لو انت جتلك مكالمة من شخص بيقول انه من البنك بتاعك، وبيقولك هات ال3 ارقام من ضهر الكريدت مثلا..

فتطلعلك رسالة تنبهك ان ده نصب وان البنوك مبتطلبش أبدا الداتا دي!

ميزة فهم محتوى الشاشة:

الميزة دي بقى مش عايزة جيميناي نانو

لانها معتمدة على وجود أبلكيشن جيميناي على موبايلك وبس

دي بقى حاجة كدا فوق العظمة بتخليك تقدر تسأل عن أي حاجة على الشاشة

يعني لو بتشوف فيديو على يوتيوب، تقدر تشغل جيميناي وتدوس زرار Ask this Video

وتقوم كاتب سؤالك، يقوم جيميناي داخل محلل الفيديو ومجاوبلك !

أو تبقى فاتح مثلا الجيميل على موبايلك وعايز تبعت لحد تخيلك لبدلة مثلا أو تصميم كنبة

تقوم فاتح جيميناي (وانت جوا الجيميل)، وتقوم كاتب التصميم، جيميناي يصمم ويطلعلك الصورة

تقوم واخد صورة من اللي طلعوا Drag & Drop هوووب في قلب الجيميل!

برضو فيه ميزة اسمها Ask this PDF (أدوبي عملت حاجة زيها بظبط كدا من كام شهر)

الميزة دي مخصوص للمشتركين في إصدار Gemini Advanced المدفوع

ومن اسمها مفهوم انك بتسأل جيميناي أي سؤال عن الملف اللي انت فاتحه، وهو بيسيرش يحلل ويدور فيه ويجاوبك!

ميزة المساعدة في المذاكرة

ودي برضو ميزة قريبة شوية من اللي عرضته من يومين OpenAI مع نموذج GPT-4o

الميزة من جوجل نازلة تحت ميزة Circle to Search

اللي بتخليك تقدر تعمل دايرة على اي حاجة على موبايلك عشان تسيرش عليها

الجديد انك لو فاتح فايل على موبايل وفيه مسائل كلامية مثلا أو أسئلة فيزياء

تقدر تعلّم دايرة على مسألة، وجوجل تبدأ تمشي معاك خطوة بخطوة عشان تفهمك طريقة الحل.. مش تغششك الاجابة!

هتنزل لموبايلات بيكسل وسامسونج اللي فيهم بالفعل ميزة Circle to Search

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى