وجد العلماء أنه في نماذج الذكاء الاصطناعي الكبيرة مثل ChatGPT، يتم فصل الذاكرة والتفكير بشكل معماري. لقد شاركوا هذا الاكتشاف، والذي سيساعد في جعل الذكاء الاصطناعي أكثر أمانًا وموثوقية، في نسخة أولية arXiv.
تعتمد نماذج الذكاء الاصطناعي المدربة على كميات هائلة من البيانات على ميزتين رئيسيتين على الأقل. أولاً – ذاكرة، مما يسمح للنظام باسترداد المعلومات وإعادة إنتاجها. ثانية – التفكير المنطقي (الاستدلال)أي حل المشكلات الجديدة من خلال تطبيق المبادئ العامة والأنماط المستفادة. ومع ذلك، حتى الآن لم يكن معروفًا كيف يتم تنظيم هذه المهارات الحاسمة.
لمعرفة ذلك، قام خبراء التعلم الآلي من شركة Goodfire.ai الناشئة بدراسة البنية الداخلية للغة الكبيرة والنماذج المرئية.
كيف يعمل “عقل” الذكاء الاصطناعي؟
في البداية استخدموا الطريقة الرياضية K-FAC (الانحناء التقريبي لعامل كرونيكر)– التعرف على المكونات المسؤولة عن القدرات المختلفة. وتبين أن الذاكرة البسيطة ترتبط بمكونات منخفضة الانحناء (مسارات ذاكرة ضيقة ومتخصصة)، بينما يرتبط التفكير المنطقي المرن بمكونات عالية الانحناء (آليات معالجة عامة وواسعة).
ثم قمنا بإيقاف تشغيل أجزاء الذاكرة الخاصة بالذكاء الاصطناعي واختبرنا النموذج في مهام مختلفة. وشملت هذه الإجابة على الأسئلة الواقعية وحل المشكلات الجديدة. أظهرت التجربة أنه حتى مع إيقاف تشغيل الذاكرة، تحتفظ النماذج بالقدرة على التفكير المنطقي. وهذا يثبت أن الوظيفتين تشغلان مناطق مختلفة في بنية الذكاء الاصطناعي.
وأشار الباحثون إلى أن “طريقتنا، القائمة على تحليل الانحناء، هي الأكثر فعالية في قمع الذاكرة في النماذج من أي حجم… مع تحقيق تعميم أفضل بكثير عند العمل مع البيانات غير المخزنة سابقًا”.
كان لتعطيل أجزاء من الذكاء الاصطناعي تأثير غير متوقع. وعلى الرغم من الحفاظ على القدرات العامة على حل المشكلات، إلا أن مهارات الرياضيات والقدرة على تذكر حقائق محددة تأثرت بشكل خطير.
قال المؤلفون: “يعتمد استرجاع الذاكرة الحسابية والواقعية بشكل أكبر على مكونات منخفضة الانحناء وهي الأكثر تأثراً بالتداخل، في حين يتم الحفاظ على الاستدلال القائم على السياق دون استخدام الأرقام إلى حد كبير، بل ويتم تحسينه في بعض الحالات”.
مسارات لتحسين سلامة الذكاء الاصطناعي
إن الفهم الدقيق لكيفية عمل الذكاء الاصطناعي سيكون أمرًا أساسيًا لتحسين أمنه وكسب ثقة الجمهور. إحدى مشكلات نماذج الذاكرة هي خطر تسرب المعلومات الخاصة أو النصوص المحمية بحقوق الطبع والنشر. بالإضافة إلى ذلك، أثناء عملية الحفظ، قد يستوعب النموذج الصور النمطية الضارة أو المحتوى السام.
يمكن تجنب هذه المشكلات إذا تعلم المهندسون تحديد آليات التعلم البسيطة وإزالتها دون التأثير على الذكاء العام للنظام. سيؤدي فهم ممرات الذاكرة أيضًا إلى جعل نماذج الذكاء الاصطناعي أكثر كفاءة وأرخص في التشغيل من خلال تحسين مساحة الشبكة التي تستخدمها.
تنويه من موقع “yalebnan.org”:
تم جلب هذا المحتوى بشكل آلي من المصدر:
naukatv.ru
بتاريخ: 2025-11-12 17:05:00.
الآراء والمعلومات الواردة في هذا المقال لا تعبر بالضرورة عن رأي موقع “yalebnan.org”، والمسؤولية الكاملة تقع على عاتق المصدر الأصلي.
ملاحظة: قد يتم استخدام الترجمة الآلية في بعض الأحيان لتوفير هذا المحتوى.
