ملخص بالذكاء الاصطناعي
٤ محرم ١٤٤٨ هـ١٩ يونيو ٢٠٢٦
تحسين أمان نماذج الذكاء الاصطناعي من خلال التعلم المعزز

تحسين أمان نماذج الذكاء الاصطناعي من خلال التعلم المعزز

أظهر باحثو OpenAI أن التعلم المعزز على سمات سلوكية مرغوبة مثل الصدق والقدرة على التصحيح يعمل عبر مجالات متعددة. أدى التدريب على بيانات الصحة أيضًا إلى تحسين الكشف عن الخداع، حيث سجل النموذج نتائج أفضل في 44 من أصل 53 معيارًا. هذه الطريقة تختلف عن منهج Anthropic القائم على الدستور. يعني هذا التطور أن استخدام التعلم المعزز يمكن أن يجعل نماذج الذكاء الاصطناعي أكثر أمانًا وأقل عرضة للتلاعب، مما يعد خطوة مهمة نحو تحسين موثوقية الأنظمة الذكية.

تابع هذه المواضيع

سجّل دخولك لمتابعة المواضيع التي تهمك

تسجيل الدخول للمتابعة

يُنتج هذا الملخص باستخدام تقنيات الذكاء الاصطناعي مع مراجعة تحريرية دورية، ويرجى الرجوع إلى المصدر الأصلي للتفاصيل الكاملة.

0
0 يقرأون الآن

تقييم الخبر

سيظهر متوسط التقييم بعد 3 تقييمات.

سجل الدخول للتفاعل والتقييم والحفظ. تسجيل الدخول
مقالات ذات صلة

مقالات ذات صلة

مزيج خفيف من الوسوم والموضوعات القريبة والزخم الحديث.

شركة Subquadratic تكشف عن نموذج LLM جديد يحل مشكلة رياضية معقدة
نماذج اللغةالأبحاثنماذج

شركة Subquadratic تكشف عن نموذج LLM جديد يحل مشكلة رياضية معقدة

أعلنت شركة Subquadratic الناشئة في مجال الذكاء الاصطناعي عن نموذج جديد يسمى SubQ، والذي يدعي أنه أسرع وأرخص ويستخدم طاقة أقل...

تلائم لغتك الحالية

اقرأ الرؤية
إطلاق Zhipu AI نموذج GLM-5.2 بقدرة سياق مليون توكن
نماذج اللغةالأبحاثنماذج

إطلاق Zhipu AI نموذج GLM-5.2 بقدرة سياق مليون توكن

أعلنت مختبر Zhipu AI الصيني عن إطلاق نموذج GLM-5.2، الذي يتمتع بسياق مستقر يصل إلى مليون توكن، تحت رخصة MIT. على منصة Fronti...

تلائم لغتك الحالية

اقرأ الرؤية
FERC يوجه مشغلي الشبكات لتسريع ربط مراكز البيانات
نماذج اللغةالأعمال

FERC يوجه مشغلي الشبكات لتسريع ربط مراكز البيانات

أصدرت لجنة تنظيم الطاقة الفيدرالية (FERC) توجيهات لمشغلي الشبكات لتوفير مسار سريع لمراكز البيانات لربطها بالشبكة. ومع ذلك، ل...

تلائم لغتك الحالية

اقرأ الرؤية
توسعات غير مسبوقة في صناعة الشرائح الضوئية العالمية
نماذج اللغةالبنية التحتية

توسعات غير مسبوقة في صناعة الشرائح الضوئية العالمية

تشهد صناعة الشرائح الضوئية العالمية موجة غير مسبوقة من التوسعات والاتفاقيات الاستراتيجية. في 16 يونيو، وقعت شركة Coherent خط...

تلائم لغتك الحالية

اقرأ الرؤية
إطلاق أندرويد 17 وWear OS 7 مع ميزات جديدة
نماذج اللغةالأعمال

إطلاق أندرويد 17 وWear OS 7 مع ميزات جديدة

أعلنت جوجل عن إطلاق أندرويد 17 وWear OS 7، حيث تتضمن النسخ الجديدة ميزات متعددة المهام، أدوات للتحكم الأبوي، وأدوات أمان محس...

تلائم لغتك الحالية

اقرأ الرؤية