مشروع مبتكر يفتح أبواب ويكيبيديا أمام الذكاء الاصطناعي

مشروع مبتكر يفتح أبواب ويكيبيديا أمام الذكاء الاصطناعي

أعلنت مؤسسة ويكيبيديا في ألمانيا عن إطلاق مشروع جديد يحمل اسم “مشروع تضمين بيانات ويكي”، ويأتي هذا المشروع بالتعاون مع شركتي داتا ستاكس وجينا، ويهدف إلى تسهيل الوصول إلى البيانات الضخمة الموجودة على ويكيبيديا ومواقعها الشقيقة، والتي تحتوي على نحو 120 مليون إدخال، من خلال تحسين استخدام هذه البيانات في نماذج الذكاء الاصطناعي.

اسم المشروع الشركاء عدد الإدخالات
مشروع تضمين بيانات ويكي داتا ستاكس، جينا 120 مليون

يعتمد المشروع على تقنية البحث الدلالي المعتمد على المتجهات، وهو ما يمكّن أنظمة الذكاء الاصطناعي من فهم المعاني والعلاقات بين الكلمات بطريقة متقدمة، بدلاً من الاعتماد فقط على البحث عن كلمات مفتاحية بسيطة، مما يعزز من فعالية استعلامات اللغة الطبيعية.

هذا التقدم يسهل على المطورين استخدام اللغة الطبيعية للاستعلام عن البيانات دون الحاجة للجوء إلى لغات استعلام معقدة مثل SPARQL، مما يجعل العملية أكثر سهولة ويسراً. كما تسهم هذه المبادرة في تقديم بيانات موثوقة وعالية الجودة لتدريب نماذج الذكاء الاصطناعي.

وبدلاً من الاعتماد على مجموعات بيانات قد تكون عشوائية أو محدودة الدقة مثل “Common Crawl”، يمكن للمطورين الآن بناء نماذجهم اعتماداً على معلومات تم التحقق منها من قبل محرري ويكيبيديا، ما يحسن دقة النتائج وموثوقيتها.

علاوة على ذلك، تُهيكل البيانات بشكل يُوفر سياقًا دلاليًا غنيًا، على سبيل المثال من خلال ربط كلمة “عالم” بمعلومات حول علماء بارزين أو مفاهيم ذات صلة، مما يعزز من فهم البيانات في سياقات متعددة.

ويؤكد فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، أن الهدف من هذه المبادرة هو إظهار إمكانية أن يكون الذكاء الاصطناعي مفتوحًا وتعاونيًا، وليس مخصصًا لشركات قليلة فقط، حيث أن المشروع متاح للجميع على Toolforge، مما يجعله مورداً يمكن لأي مطور الاستفادة منه بحرية.