تقييم قدرات التحليل العربية لـ ChatGPT وCloude: دراسة مقارنة قائمة على الخبراء
محتوى المقالة الرئيسي
الملخص
تشكل اللغة العربية، المعروفة بتعقيداتها الصرفية والنحوية الغنية، تحديات كبيرة لتقنيات معالجة اللغة الطبيعية. تقدم هذه الدراسة تقييماً مقارناً لأداتي الذكاء الاصطناعي ChatGPT وCloude في قدراتهما على تحليل الجمل العربية بدقة. تم اختيار خمس جمل تجسد سمات لغوية متنوعة، وتم تقييم مخرجات الإعراب من قبل ثلاثة خبراء في اللغة العربية. كشفت النتائج عن فجوة واضحة في الأداء، حيث تفوق Cloude على ChatGPT من حيث الدقة الإجمالية (72.9% مقابل 33.3%). برع كلود في التعامل مع التعقيدات المورفولوجية والعلاقات النحوية الأساسية، لكنه واجه صعوبات في التعبيرات الاصطلاحية للغاية والإنشاءات الغامضة. على العكس من ذلك، واجه ChatGPT صعوبة في التعامل مع الشكل المعقد والتبعيات بعيدة المدى. تسلط النتائج الضوء على أهمية تطوير أدوات متخصصة لمعالجة اللغة العربية مع الاعتراف بإمكانات نماذج اللغة ذات الأغراض العامة مع مزيد من الضبط. تتضمن التوصيات دمج المعرفة الخاصة بالمجال، والاستفادة من نقل التعلم، واستكشاف الأساليب المجمعة لتعزيز دقة وقوة أنظمة التحليل العربية القائمة على الذكاء الاصطناعي.
تفاصيل المقالة
إصدار
القسم
هذا العمل مرخص بموجب Creative Commons Attribution 4.0 International License.