| بنية نموذج الذكاء الاصطناعي الأساسية | يعتمد على Gemini 2.5 Flash Image - مصمم للتوليد السريع والنماذج الأولية الإبداعية مع أداء فعال من حيث التكلفة. | يعتمد على Gemini 3 Pro Image Model - قدرات تفكير محسّنة ومعرفة عالمية لمهام إبداعية أكثر تعقيداً. |
| قدرة عرض النص في الصورة | قادر على توليد صور بنص, ولكن لديه قيود ملحوظة في النصوص المعقدة والمحتوى متعدد اللغات والخطوط الصغيرة ومتطلبات الوضوح الشديد. | تحسين كبير:يدعم النص متعدد اللغات بأنماط خطوط متنوعة وجودة عرض نص واضحة جداً في الصور المولدة. |
| الدقة وجودة المخرجات | مناسب للويب والعمل الإبداعي السريع - دعم محدود لمخرجات 4K والدقة العالية. | يدعم مخرجات 2K و 4K مع عناصر تحكم سينمائية متقدمة بما في ذلك الإضاءة وعمق المجال وضبط التركيز وزوايا الكاميرا. |
| المرجع متعدد الصور واتساق العلامة التجارية/الشخصية | كافٍ للنماذج الأولية الإبداعية, لكن القدرات أضعف عند الحفاظ على اتساق العلامة التجارية عبر أصول متعددة أو سلاسل شخصيات طويلة. | يقبل ما يصل إلى 14 صورة مرجعية ويحافظ على الاتساق عبر أصول متعددة ومشاهد متعددة الشخصيات - مثالي لأصول العلامة التجارية والمواد الإعلانية. |
| المعرفة العالمية والمعلومات في الوقت الفعلي(الرسوم البيانية, البيانات, الخرائط, السيناريوهات) | توليد يعتمد بشكل أساسي على المطالبات مع إبداع قوي ولكنه محدود في دقة المعرفة والسيناريوهات البصرية القائمة على البيانات. | قدرة 'Search grounding' الجديدة - يدمج بحث Google لتحسين التوليد البصري بالبيانات الفعلية والمعرفة العالمية والرسوم البيانية والخرائط وسير العمل التقني. |
| التحكم الإبداعي وقدرة التحرير(الإضاءة, زوايا الكاميرا, تدرج الألوان, التركيز) | يوفر توليداً وتحريراً أساسيين, ولكن لديه قيود في التحكم التفصيلي(مثل:تحويل المشاهد من النهار إلى الليل) والحفاظ على الاتساق عبر زوايا كاميرا متعددة. | عناصر تحكم احترافية متقدمة:ضبط زوايا الكاميرا, تغيير التركيز, تحويل إضاءة المشهد, تدرج الألوان, نسب عرض مختلفة - أنسب لمواد على مستوى الإنتاج والعلامة التجارية. |
| حالات الاستخدام الموصى بها | توليد الأفكار السريع, رسومات وسائل التواصل الاجتماعي, نماذج أولية, مسودات, صور فيروسية, مخرجات منمقة - صديق للتكلفة والوقت للتجارب عالية الحجم. | إعلانات العلامات التجارية, مواد الأسواق متعددة اللغات, مرئيات إنتاج عالية الدقة, أصول متعددة القنوات للمنتجات/التجارة الإلكترونية/التسويق, رسوم بيانية تعليمية, وثائق تقنية. |
| مقايضات السرعة والتكلفة | معالجة أسرع, صديق للتكرارات - مثالي لسير العمل 'توليد الحجم أولاً, تجربة أكثر'. | نموذج أثقل بجودة مخرجات أعلى - قد يكون لديه أوقات توليد أطول قليلاً وتكاليف أو استهلاك حصة أعلى. |