أطلقت جوجل نموذج Gemini 3 Pro الثلاثاء الماضي، مدعية أنه يتفوق على Gemini 2.5 Pro ومنافسيه الرئيسيين مثل ChatGPT (GPT-5.1)، مع أداء استثنائي في معايير الرياضيات والتفكير الأكاديمي، رغم تفوق Claude Sonnet 4.5 في بعض مهام البرمجة.
بعد أسابيع من التلميحات، أصبح Gemini 3 الأداة الرائدة في عالم الذكاء الاصطناعي، متجاوزاً Grok الذي سيطر مؤقتاً على بعض الاختبارات، ليعود Gemini إلى قمة التصنيفات.
نتائج المعايير الرئيسية:
| المعيار | الوصف | Gemini 3 Pro | GPT-5.1 | Claude 4.5 | Grok 4.1 |
|---|---|---|---|---|---|
| Humanity’s Last Exam | تفكير أكاديمي متقدم | 37.5% | 26.5% | 13.7% | ~25% |
| MathArena Apex | مسائل رياضية صعبة | 23.4% | 0.5-1.6% | 0.5-1.6% | N/A |
| ScreenSpot Pro | فهم شاشات الكمبيوتر | 72.7% | 3.5% | 36.2% | N/A |
| SWE-Bench Verified | مهام برمجة حقيقية | 76.2% | 76.3% | 77.2% | N/A |
- نقاط قوة Gemini 3 Pro: يهيمن في التفكير العميق (أكثر من ضعف GPT في بعض الاختبارات) وفهم الشاشات، مع نافذة سياق تصل إلى مليون رمز.
- نقاط ضعف: يتأخر قليلاً في البرمجة المعقدة أمام Claude، بينما Grok يفوق في السرعة والإجابات غير المقيدة.
مع إصدارات جديدة كل أسابيع، لن يحتفظ Gemini بالصدارة طويلاً، لكن المعايير لا تعكس دائماً الواقع. التجربة الفعلية للمستخدم هي المعيار الحقيقي، حيث يبرز Grok في الإبداع والكفاءة اليومية.
