لماذا تحتاج الجامعات إلى إعادة التفكير بشكل جذري في الامتحانات في عصر الذكاء الاصطناعي؟
Illustration by Matt Chinworth
منذ إطلاق Chatbot ChatGPT في أواخر عام 2022، كان المعلمون يتصارعون مع كيفية تسخير الذكاء الاصطناعي لتعزيز التعلم مع تقليل المخاطر التي تهدد النتائج التعليمية وعدالة التقييمات.
لا محاضرات، امتحانات، مقالات: داخل جامعة القرن الحادي والعشرين
أصبح استخدام الذكاء الاصطناعي بين الطلاب هو القاعدة الآن. في فبراير، استطلاع1 من بين أكثر من 1000 طالب جامعي في المملكة المتحدة بدوام كامل، وجدوا أن 92% منهم يستخدمون الذكاء الاصطناعي بشكل ما، ارتفاعًا من 66% في عام 2024. وأفاد 88% من الطلاب أنهم يعتمدون على الذكاء الاصطناعي التوليدي (شكل من أشكال الذكاء الاصطناعي يمكنه إنشاء نصوص وصور ورموز برمجية من مجموعات بيانات ضخمة) لدعم دوراتهم الدراسية الأكاديمية، مقارنة بـ 53% في عام 2024.
كما يستمر الذكاء الاصطناعي في ذلك يتفوق على البشر في المهام الأساسية مثل فهم القراءة وبرمجة الكمبيوتر2وتزايدت المخاوف بشأن تأثيرها على التعلم والنزاهة الأكاديمية. على سبيل المثال، أصبحت قيمة المقالات التقليدية وغيرها من التقييمات الكتابية موضع شك على نحو متزايد، نظرا لأن الذكاء الاصطناعي قادر الآن على إنتاج كتابات تتجاوز غالبا جودة معظم أعمال الطلاب.
وتشمل المخاوف الأخرى الاعتماد المفرط على برامج الدردشة الآلية مما يؤدي إلى التعلم السطحي3، انخفاض فرص التأمل الذاتي4 وفقدان الوكالة الطلابية5، حيث يصبح الطلاب مستخدمين سلبيين للتكنولوجيا بدلاً من أن يكونوا متعلمين نشطين.
استجابت الجامعات باستخدام أدوات لمحاولة اكتشاف استخدام الطلاب للذكاء الاصطناعي التوليدي. ولكن ثبت أن هذه غير موثوقة6. وقد أدى ذلك إلى إصلاحات قصيرة المدى مثل التقييمات الكتابية “اختبار الإجهاد”.1 واستبدالها باختبارات شفهية أو اختبارات مكتوبة بخط اليد أو نماذج عاكسة (المحافظ والمجلات؛ انظر go.nature.com/43btcxf)، بالإضافة إلى إرشادات أكثر وضوحًا حول متى يمكن استخدام الذكاء الاصطناعي ومتى لا يمكن استخدامه. وعلى الرغم من أن هذه التدابير تساعد، إلا أن فعاليتها محدودة.
وبدلا من ذلك، هناك حاجة إلى إعادة التفكير بشكل أساسي في التعلم والتقييم. نسلط الضوء هنا على ثلاثة أساليب واعدة للفحص تعمل على تكييف الأساليب الحالية – مثل التقييمات القائمة على المحادثة – مع عصر الذكاء الاصطناعي. وتهدف هذه الاستراتيجيات إلى تعزيز التنمية الفكرية الحقيقية مع ضمان أن التقييمات تعكس بدقة فهم الطلاب ومهاراتهم.
استخدم أنواعًا أخرى من التقييم
أحد الركائز الأساسية للتعليم الحديث هو أن “الكتابة هي تفكير”7. الكتابة هي عملية غير خطية8 يتطلب مشاركة حقيقية وتفكيرًا نقديًا وحل المشكلات. كل هذه الأنشطة تحفز التطور الفكري البشري.
عندما يساعد الذكاء الاصطناعي في نصوص الطلاب أو ينشئها، يصبح من المستحيل تقريبًا معرفة مقدار العمل النهائي الذي يعكس فهم الطالب وتفكيره النقدي (انظر go.nature.com/47tjv93). ويقوض عدم اليقين هذا استخدام الكتابة كدليل على التعلم.
إن متابعة الطالب والمعلم لمحادثة منظمة هي إحدى الطرق لتمكين التفكير النقدي. على سبيل المثال، طريقة الأسئلة السقراطية هي شكل من أشكال الاستفسار المنضبط الذي يساعد الطلاب على العمل من خلال الأفكار المعقدة والتشكيك في افتراضاتهم والحكم على صحة المعلومات. في اليونان القديمة، كانت القيمة الممنوحة للحوار الفكري كبيرة جدًا لدرجة أن بعض الفلاسفة في ذلك الوقت أعربوا عن قلقهم من أن الاعتماد المفرط على الكتابة يمكن أن يضعف الذاكرة البشرية (انظر go.nature.com/43grxsp).
لا يزال من الممكن أن يكون للامتحانات التقليدية مكان إلى جانب التقييم القائم على الذكاء الاصطناعي.الائتمان: خورخي جيل / أوروبا برس عبر جيتي
تم استخدام نسخة معاصرة من النهج القائم على الخطاب المستخدم في اليونان القديمة، والمعروف باسم التقييم القائم على المحادثة، لعدة عقود في إعدادات التعليم الابتدائي والثانوي والجامعي. على سبيل المثال، تم استخدام برنامج AutoTutor، الذي تم تطويره في جامعة ممفيس بولاية تينيسي، لتدريس موضوعات مثل الفيزياء النيوتونية مع تحسين المهارات في مجال القراءة والكتابة الحاسوبية والتفكير النقدي9. إنه يشرك الطلاب في محادثات باللغة الطبيعية ويستخدم تقنيات حسابية لقياس فهمهم – ويحلل عوامل مثل الدقة واختيار الكلمات والوقت المستغرق للرد. ومع ذلك، عادةً ما تتمتع هذه الأنظمة بقدرات محادثة محدودة ولا تزال تعتمد في الغالب على تحليلات نصية بسيطة واكتشاف كلمات وتعبيرات محددة.
هذا هو المكان الذي يمكن أن يغير فيه تكامل الذكاء الاصطناعي قواعد اللعبة. يمكن للذكاء الاصطناعي أن يحافظ على حوار مفتوح وحساس للسياق بطريقة أكثر واقعية بكثير من أساليب التقييم الحالية القائمة على المحادثة. يمكن لأدوات الذكاء الاصطناعي أن تطرح على الطلاب أسئلة للمتابعة، وتوفر تلميحات مخصصة وتتكيف مع مستوى معرفة الطالب في الوقت الفعلي، مما يوفر دعمًا تعليميًا مرنًا وشخصيًا. ويمكن أن يمتد طرح الأسئلة على نطاق أوسع من نظم تقييم المحادثة التقليدية، والتي عادة ما تكون متخصصة في مجال معين.
يحتاج التدريب على الدكتوراه إلى إعادة التشغيل في عالم الذكاء الاصطناعي
إن الفرصة الحاسمة للذكاء الاصطناعي لا تقتصر على أتمتة الإجابة على الأسئلة فحسب، بل في تمكين الطلاب من التعلم من خلال المحادثة مع أنظمة الذكاء الاصطناعي واستخدام هذا الحوار كشكل من أشكال التقييم، مما يجعله عملية ديناميكية وشخصية.
لا تزال هناك تحديات. أولاً، ستحتاج أنظمة الذكاء الاصطناعي إلى توجيه المحادثات بطريقة متوازنة، وتشجيع الطلاب على طرح الأسئلة واستكشاف الموضوعات التي تهمهم والقيام بدور نشط في تعلمهم. وفي الوقت نفسه، يجب أن يكون الحوار منظمًا بشكل كافٍ حتى يتمكن نظام الذكاء الاصطناعي من جمع أدلة ذات معنى على فهم الطالب، مثل كيفية حل المشكلة أو شرح مفهوم ما أو تطبيق المعرفة في السياق. ويظل تحقيق هذا التوازن بين الاستكشاف المفتوح والتقييم القابل للقياس يمثل تحديًا بحثيًا كبيرًا.
يعد سوء التواصل مصدر قلق آخر – فقد تسيء أنظمة الذكاء الاصطناعي فهم نية الطالب أو تقدم معلومات غير دقيقة أو مضللة. عندما يحدث هذا، يمكن للطلاب أن يواجهوا صعوبة في تحديد مصادر أخطائهم. كما أن الطبيعة الشخصية للغاية والمفتوحة للتعلم والتقييم القائم على الذكاء الاصطناعي من شأنها أن تجعل توحيد المعايير أمرًا صعبًا. لذلك، سيظل هناك مكان للتقييمات التقليدية، وخاصة في عملية القبول بالجامعات، حيث يشكل الاتساق والعدالة بين مجموعات كبيرة من الطلاب أولوية.
التقييم بشكل مستمر
إحدى القضايا الحاسمة مع العديد من الاستجابات المقترحة لاعتماد الطلاب على نطاق واسع للذكاء الاصطناعي هي أنه على الرغم من محاولتهم حماية النزاهة الأكاديمية، إلا أنهم يواصلون العمل ضمن نموذج امتحان عالي المخاطر. حتى لو تمت إعادة صياغة الاختبار على شكل محادثة، يظل الطلاب مدركين أن النتيجة لها وزن كبير. يجد الطلاب أن الاختبارات عالية المخاطر مرهقة وقد يكون أداؤهم ضعيفًا أو يميلون إلى الغش. التحدي الرئيسي إذن هو تقليل الحاجة إلى اختبارات عالية المخاطر في عصر يغذيه الذكاء الاصطناعي حيث قد يصبح الغش أسهل.
التقييم المستمر يمكن أن يكون بديلا فعالا10. إن استبدال اختبارات نهاية الفصل الدراسي بسلسلة من التقييمات المترابطة التي تبني صورة شاملة لتعلم الطلاب أمر مطلوب بشكل عاجل في العديد من المجالات الأكاديمية. التقييم المستمر أمر راسخ في التعليم الطبي. على سبيل المثال، أثناء المناوبات السريرية، يتم تقييم طلاب الطب باستمرار من قبل المشرفين الذين يراقبون تفكيرهم السريري ومهارات العمل الجماعي والتواصل مع المرضى. تعمل هذه الملاحظات، جنبًا إلى جنب مع الأفكار المكتوبة وتقييمات الأقران، على إنشاء صورة شاملة لكفاءة الطالب مع مرور الوقت. ومع ذلك، تظل مثل هذه النماذج نادرة في التخصصات الأخرى، ويرجع ذلك أساسًا إلى زيادة عبء العمل الذي تضعه على عاتق المعلمين.
يجب على الجامعات أن تتحرك مع الزمن: كيف يتعامل ستة علماء مع الذكاء الاصطناعي والصحة العقلية والمزيد
إن التوافر المتزايد للأنظمة القائمة على الذكاء الاصطناعي يجعل التقييم المستمر أكثر جدوى. لا يمكن النظر إلى المحادثات بين الطلاب وأداة الذكاء الاصطناعي على أنها تبادلات لمرة واحدة، ولكن كجزء من عملية التعلم المستمرة التي تقوم فيها التفاعلات المتعددة منخفضة المخاطر ببناء صورة غنية لتقدم الطالب تدريجيًا10.
ويكمن التحدي الرئيسي في ضمان قدرة أنظمة الذكاء الاصطناعي على تتبع وتحليل تقدم التعلم هذا بشكل فعال. لم يتم تصميم الأدوات الحالية ذات الأغراض العامة، مثل ChatGPT، وGemini، وCopilot، لهذا الغرض، فهي لا تحلل استجابات الطلاب بمرور الوقت لتحديد النمو أو المفاهيم الخاطئة المستمرة. ولدعم التقييم المستمر حقًا، هناك حاجة ملحة لمنصات الذكاء الاصطناعي الموجهة نحو التعلم والتي يمكنها التقاط البيانات الطولية حول أداء الطلاب، وتوفير رؤى مفيدة حول مسارات التعلم والاندماج بسلاسة في تصميم الدورات والبرامج.
نشر لأول مرة على: www.nature.com
تاريخ النشر: 2025-12-02 02:00:00
الكاتب: Vitomir Kovanović
تنويه من موقع “yalebnan.org”:
تم جلب هذا المحتوى بشكل آلي من المصدر:
www.nature.com
بتاريخ: 2025-12-02 02:00:00.
الآراء والمعلومات الواردة في هذا المقال لا تعبر بالضرورة عن رأي موقع “yalebnan.org”، والمسؤولية الكاملة تقع على عاتق المصدر الأصلي.
ملاحظة: قد يتم استخدام الترجمة الآلية في بعض الأحيان لتوفير هذا المحتوى.







