اضغط ⬆️ ثم "إضافة للشاشة الرئيسية"

الرئيسية حياتنا نماذج الـAI تفشل في حل مسائل رياضيات بحثية الأربعاء 17 حزيران 2026 10:52 ص نماذج الـAI تفشل في حل مسائل رياضيات بحثية

الرئيسية حياتنا نماذج الـAI تفشل في حل مسائل رياضيات بحثية  الأربعاء 17 حزيران 2026  10:52 ص نماذج الـAI تفشل في حل مسائل رياضيات بحثية
أخبار البلد -   خضع الذكاء الاصطناعي، ضمن مشروع "First Proof"، لأحد أكثر اختبارات الرياضيات صعوبة حتى الآن، إذ طُلب من أربعة أنظمة للذكاء الاصطناعي حلّ عشر مسائل بحثية معقّدة.

ولم تكن هذه المسائل ضمن بيانات التدريب الخاصة بالنماذج المشاركة، فيما تولّى علماء رياضيات متخصصون مراجعة الإجابات وتقييمها. ويُعد هذا الاختبار الأول من نوعه، إذ يجمع بين مسائل عالية التعقيد، وأسئلة جديدة غير مألوفة لأنظمة الذكاء الاصطناعي، إلى جانب تقييم رسمي يجريه خبراء متخصصون

وأظهرت النتائج أن نماذج الذكاء الاصطناعي الحالية لا تزال أقل كفاءة من كبار علماء الرياضيات في التعامل مع مسائل مماثلة، كما أنها تفتقر إلى الحدس الرياضي وتظل عرضة لارتكاب الأخطاء أو ما يُعرف بـ"الهلوسة".


واقترح عشرة باحثين هذه المسائل من أعمالهم العلمية غير المنشورة. واقتصرت المشاركة على النماذج المتاحة للجمهور، بما في ذلك نموذج ChatGPT 5.5 Pro من OpenAI، إلى جانب فرق أكاديمية من جامعة كاليفورنيا، وجامعة برينستون، والمعهد الفيدرالي السويسري للتكنولوجيا في زيورخ.


وطوّرت فرق من جامعة كاليفورنيا والمعهد الفيدرالي السويسري للتكنولوجيا ما يُعرف بـ"الأنظمة الوسيطة"، وهي أنظمة يتولى فيها أحد روبوتات الدردشة طرح الحلول، بينما يقوم آخر بمراجعتها والتحقق منها، مع تبادل المعلومات بينهما عدة مرات عند الحاجة.


وسجّل نموذج المعهد الفيدرالي السويسري للتكنولوجيا أفضل أداء، بعدما نجح في حل ست مسائل من أصل عشر. واعتمد النظام على تحسين استجابات ChatGPT من خلال "مجلس استشاري" مكوّن من ثلاثة روبوتات دردشة متقدمة.

 

وجاء فريق جامعة كاليفورنيا في المركز الثاني بنظام مساعد قائم على ChatGPT، تلاه فريق OpenAI باستخدام ChatGPT دون أدوات مساعدة، ثم فريق جامعة برينستون الذي استخدم نظاما قائما على Gemini 3.1 Pro.


ورغم ذلك، لم يتمكن أي فريق من حل ثلاث مسائل من أصل عشر. ووفقا للمشاركين، افتقرت الأنظمة في بعض الحالات إلى الفكرة الجوهرية التي يتوصل إليها البشر بصورة بديهية، بينما نجحت في حالات أخرى في اختيار النهج الصحيح لكنها أخفقت في تنفيذ التفاصيل بدقة.


ومن أبرز التحديات التي رُصدت ظاهرة "الهلوسة"، حيث قدمت أنظمة الذكاء الاصطناعي نتائج غير صحيحة حتى عند مطالبتها بالتحقق من المراجع. كما لوحظ أن بعض النماذج قامت بنسخ أجزاء من مقالات ومصادر منشورة دون الإشارة إليها بشكل واضح.


وأشار الباحثون إلى أن نشر هذه المسائل سيتيح للشركات والمؤسسات الأخرى استخدامها مستقبلا لاختبار قدرات أنظمة الذكاء الاصطناعي وتقييم أدائها في مواجهة التحديات الرياضية المعقدة. science.mail.ru


شريط الأخبار النبلاء للتنمية المستدامة تزور شركة دار الدواء لتعزيز التعاون ودعم الصناعة الدوائية الأردنية . 15 جامعة أردنية ضمن أفضل 1500 جامعة في العالم (أسماء) أطفال يتعاطون "التنر" بديلاً للمخدرات في إربد.. فيديو صادم يثير غضب الأردنيين إيران تعفي السفن من رسوم عبور مضيق هرمز لمدة 60 يوما السجن المؤبد لشاب بسبب خط تليفون.!! ترمب مهدداً : إسرائيل ستفعل ما أقوله ولا حدود لقوتي 60 ألفا يؤدون الجمعة في الأقصى علوان يتصدر تصنيف دقة التسديد في الجولة الأولى من المونديال مفتشو الوكالة الذرية يستعدون للعودة إلى إيران تأثيرات مرعبة لإدمان التصفح عبر الإنترنت مذكرة "إسلام آباد".. 14 بندا ترسم طريق إنهاء النزاع بين طهران وواشنطن العمل لأصحاب المنازل: صوبوا أوضاع عاملات المنازل واستفيدوا من الإعفاءات قبل نهاية أيلول الخارجية السويسرية: المفاوضات الأمريكية الإيرانية لن تعقد اليوم زوجات وعشيقات لاعبي المونديال يخطفن الأنظار بإطلالاتهن وأعمالهن الجيش الإسرائيلي يعلن مقتل ضابط برتية مقدم و4 جنود في جنوب لبنان دراسة: فيروس «إيبولا» يظل على قيد الحياة في الدماغ لعدة أشهر الضمان تخفض فائدة تقسيط مديونية المنشآت شحنة عجول مرفوضة عراقياً وتوضيح من الزراعة طقس صيفي معتدل الجمعة بفضل ميسي ومبابي وكين.. كأس العالم 2026 تسجل رقما تاريخيا بعد 64 عاما