أخبار حقيقية محدّثة يومياً مع تحليل الأثر العملي على عملك وحياتك.

قررت شركة أنثروبيك إلغاء خططها لتعديل نظام الفوترة الخاص بـ Claude Agent SDK قبل إطلاقه، حيث ستستمر التطبيقات في الاعتماد على حدود الاشتراك المعتادة بدلاً من نظام الأرصدة المنفصلة.
يستفيد المطورون العرب من استقرار تكاليف استخدام SDK، مما يسهل عليهم التخطيط لمشاريعهم البرمجية دون مفاجآت في هيكل الفوترة.

ذكر The Decoder نقلاً عن مدونة OpenAI Alignment أن باحثي OpenAI اختبروا تدريباً بالتعزيز على محادثات واقعية لترسيخ الصدق، والتواضع المعرفي، وقابلية التصحيح، والإنصاف، مع تحسن واسع في تقييمات السلامة.
للشركات والباحثين، يهم الخبر لأنه ينقل تقييم السلامة من قائمة قواعد ثابتة إلى اختبار سلوك النموذج تحت الضغط؛ قبل اعتماد نماذج في الصحة أو التعليم أو البرمجة، راقبوا الصدق وقابلية التصحيح لا الدقة فقط.

ذكر The Decoder أن Zhipu AI أطلقت GLM-5.2 تحت رخصة MIT، مع نافذة سياق مستقرة تصل إلى مليون توكن وأداء قريب من النماذج المغلقة في مهام FrontierSWE البرمجية.
للفرق التقنية التي تراجع بدائل مفتوحة المصدر، يستحق GLM-5.2 اختباراً عملياً في مهام البرمجة الطويلة، مع عدم افتراض تفوقه في الاستدلال العام أو كل أنواع العمل البرمجي.

ذكر The Decoder أن باحثين في OpenAI يقترحون محاكاة سلوك النماذج قبل نشرها لتقدير الأخطاء المتوقعة بعد الإطلاق وسد فجوات اختبارات السلامة التقليدية.
على فرق المنتجات التي تعتمد نماذج كبيرة ألا تكتفي بنتائج الاختبارات المعيارية؛ محاكاة الاستخدام قبل النشر قد تضيف طبقة عملية لتقدير المخاطر والأخطاء المتوقعة.

ذكر The Decoder أن Gemini-SQL2 من Google Research يحول اللغة الطبيعية إلى استعلامات SQL قابلة للتنفيذ، وحقق 80.04% في معيار BIRD متقدماً على OpenAI وAnthropic.
يمكن لفرق البيانات متابعة هذه الفئة من الأدوات لتقليل حاجز كتابة الاستعلامات، مع إبقاء مراجعة SQL والصلاحيات والاختبارات قبل تشغيل أي استعلام على قواعد إنتاجية.

ذكر The Decoder أن Claude Fable 5 سجل 88% في أصعب مستوى من FrontierMath، مقابل نحو 75% لـ GPT-5.5، بعد أن كان Opus 4.5 دون 10% في أوائل 2026.
للفرق التعليمية والبحثية، لا يكفي اختيار النموذج بالأسماء التجارية؛ ينبغي اختبار الأداء على نوع المسائل الفعلية ومراقبة الدقة والتكلفة قبل إدخاله في سير عمل حساس.

ذكر The Decoder أن OpenAI أتاحت لمستخدمي Codex حفظ عمليات إعادة تعيين حدود الاستخدام وتشغيلها يدوياً، بدلاً من انتظار جدول زمني ثابت عند بلوغ سقف الاستخدام.
قد تساعد الميزة المطورين على إدارة جلسات العمل المكثفة مع Codex بمرونة أكبر، لكن على الفرق متابعة شروط الخطة والحدود الفعلية قبل بناء سير عمل يعتمد عليها.

كشفت جوجل عن نموذج DiffusionGemma، وهو نموذج مفتوح يعتمد على تقنية الانتشار لتوليد النصوص بدلاً من الطريقة التقليدية، مما يجعله أسرع بأربع مرات من النماذج الحالية.
يستفيد المطورون العرب من هذا النموذج في بناء تطبيقات تتطلب سرعة عالية في توليد النصوص، كما يتيح لهم فرصة المساهمة في تطوير نماذج مفتوحة المصدر تدعم تقنيات الذكاء الاصطناعي الحديثة.

أشار سام ألتمان، الرئيس التنفيذي لشركة OpenAI، إلى أن الشركة قد تطرح أسهمها للاكتتاب العام خلال العام المقبل، مع وجود احتمالية لتأجيل الخطوة حتى عام 2027، وسط تكهنات حول أسباب استراتيجية وتنافسية.
قد يؤدي تأجيل الاكتتاب إلى استمرار OpenAI في التركيز على تطوير المنتجات والخدمات بدلاً من الانشغال بمتطلبات الأسواق المالية، مما قد يعني وصول ميزات جديدة للمستخدمين العرب بشكل أسرع.

كشفت دراسة حديثة أجراها فريق الأمن في شركة Anthropic أن نموذج الذكاء الاصطناعي Mythos Preview يمكنه تحويل التحديثات الأمنية لمتصفح Firefox ونواة Windows إلى ثغرات برمجية فعالة خلال ساعات معدودة وبتكلفة منخفضة، مما يهدد الأنظمة التقليدية لإرسال التحديثات.
يحتم هذا التطور على المؤسسات والمستخدمين في العالم العربي تسريع وتيرة تبني حلول الأمن السيبراني الفورية وعدم الاعتماد الكلي على التحديثات التلقائية المتأخرة، مع ضرورة فحص الأنظمة بشكل استباقي.

كشفت شركة Anthropic عن نموذج Claude Fable 5، وهو الإصدار الأول ضمن فئة Mythos الجديدة، الذي يتصدر مقاييس الأداء التقني مع فرض قيود أمان صارمة وسياسات بيانات محدثة.
يواجه المستخدمون العرب تحدياً مزدوجاً يتمثل في التكلفة العالية والقيود الصارمة على المحتوى، مما قد يتطلب استراتيجيات دقيقة في صياغة الأوامر لضمان الحصول على أفضل النتائج دون التعرض للحجب.

كشفت شركة أنثروبيك عن جيل جديد من نماذج الذكاء الاصطناعي، Fable 5 وMythos 5، التي تتفوق بشكل ملحوظ على إصدارات Opus السابقة في مهام البرمجة المعقدة والبحث العلمي المتقدم.
سيستفيد المطورون والباحثون العرب من هذه الأدوات في تسريع وتيرة الابتكار البرمجي والبحث العلمي، مما يقلل الفجوة الزمنية في تنفيذ المشاريع التقنية المعقدة.