أعلنت مجموعة غوغل ديب مايند رسميا عن إطلاق الجيل الثاني من طرازها الرائد لتوليد الصور، والمعروف تجاريا باسم نانو بانانا 2، وهو التحديث الذي يرتكز تقنيا على بنية جيمناي 3.1 فلاش إيمج.
ويأتي هذا الإعلان في وقت يشهد فيه سوق الذكاء الاصطناعي تنافسا محموما على دقة التفاصيل وسرعة التنفيذ، حيث قدمت غوغل ما وصفته الصحافة التقنية بالنموذج المتكامل الذي ينهي الفجوة بين النماذج الخفيفة السريعة والنماذج الثقيلة عالية الجودة.
وبحسب ما ورد في المدونة الرسمية لشركة غوغل، فإن الطراز الجديد لا يكتفي بمجرد تحسين جودة البكسلات، بل يعتمد على فلسفة الذكاء السياقي الحقيقي.
مميزات نانو بانانا 2
وصرح الرئيس التنفيذي لشركة ألفابت، الشركة الأم لغوغل، سوندار بيتشاي عبر حساباته الرسمية بأن نانو بانانا 2 صمم ليكون أداة إنتاجية للمحترفين وليس مجرد وسيلة للترفيه، مؤكدا أن الكفاءة البرمجية لهذا الطراز تسمح له بالعمل بسرعة تفوق الجيل السابق بنسبة 300%، مع استهلاك طاقة أقل بكثير، مما يمهد الطريق لدمجه بشكل أعمق في الأجهزة المحمولة والمتصفحات.
وفي تحليل معمق نشره موقع تيك رادار التقني الأمريكي، تبرز ميزة الربط الحي ببحث غوغل كأهم إضافة ثورية في هذا الإصدار، حيث أن هذه الميزة تسمح للنموذج، لأول مرة، بالخروج من دائرة بيانات التدريب المغلقة والتحقق من المعلومات في الوقت الفعلي عبر محرك البحث.
وهذا يعني أنه عند طلب صورة لمنتج تجاري حديث أو معلم أثري، يقوم الذكاء الاصطناعي بمطابقة المواصفات الواقعية قبل البدء في عملية التوليد، مما يقضي تماما على مشكلة الهلوسة البصرية التي كانت تؤرق المصممين.
قدرات إبداعية غير مسبوقة
وعلى صعيد القدرات الإبداعية المتخصصة، كشفت وثائق المطورين في غوغل ايه اي ستوديو عن مجموعة من الخصائص التقنية التي تمنح المصممين سيطرة غير مسبوقة، وهي ثبات العناصر والشخصيات والقدرة على الحفاظ على ملامح دقيقة لـ 5 شخصيات وتفاصيل 14 جسما ثابتا عبر سلسلة لا نهائية من الصور، مما يجعله قادرا على إنتاج قصص مصورة كاملة دون تغير في هوية الأبطال.
وثورة النصوص تايبوغرافيا 2.0 معالجة النصوص داخل الصور بدقة مذهلة، مع دعم كامل للغة العربية بخطوطها المعقدة، وضمان عدم تداخل الحروف أو تشوه الكلمات مهما كان طول النص المطلوب.
واضافت المرونة الهندسية دعم أبعاد صور تبدأ من المربع التقليدي وتصل إلى الأبعاد البانورامية السينمائية بنسبة 8:1، مع إمكانية التوليد المباشر بدقة فور كيه.
الجانب الأخلاقي والأمني
ومن ناحية أخرى، ركزت تقارير من بلومبرغ على الجانب الأخلاقي والأمني في الطراز الجديد، فقد قامت غوغل بدمج تقنية سينث اي دي المتطورة، وهي علامة مائية رقمية غير مرئية يتم حفرها في نسيج الصورة لمنع التزييف العميق وتسهيل كشف المحتوى المولد اصطناعيا.
كما يمتثل الطراز لمعايير سي 2 بي ايه العالمية لضمان شفافية مصدر المحتوى، وهو ما تعتبره غوغل خطوة ضرورية لتعزيز الثقة في استخدام الذكاء الاصطناعي ضمن قطاعات الإعلام والإعلان.
ويرى خبراء التقنية أن إطلاق نانو بانانا 2 يمثل لحظة نضوج للذكاء الاصطناعي التوليدي، حيث انتقلت التكنولوجيا من مرحلة الإبهار البصري إلى مرحلة الأدوات المهنية الرصينة التي يمكن الاعتماد عليها في سلاسل التوريد الإبداعية العالمية.
