سايبر سيليكون يستثمر في بيئات تدريب لتعزيز قدرات الذكاء الاصطناعي

سايبر سيليكون يستثمر في بيئات تدريب لتعزيز قدرات الذكاء الاصطناعي

تسارع شركات التكنولوجيا الكبرى في وادي السيليكون لتطوير وكلاء ذكاء اصطناعي قادرين على استخدام البرامج والتطبيقات وإنجاز المهام بشكل مستقل، لكن يبقى التحدي الأكبر في كيفية تدريب هذه النماذج على مهام متعددة الخطوات، لذلك تبرز تقنية البيئات التدريبية (Reinforcement Learning Environments – RL) باعتبارها حجر الأساس للجيل القادم من الذكاء الاصطناعي.

الشركة الاستثمار
Anthropic أكثر من مليار دولار
Surge مبالغ طائلة
Mercor مبالغ طائلة

تشبه البيئات التدريبية ألعاب الفيديو البسيطة، لكنها مصممة لتدريب الوكلاء على مهام عملية، مثل محاكاة متصفح كروم وطلب منتج من أمازون، حيث يحصل الوكيل على “إشارة مكافأة” عند إنجاز المهمة بنجاح، هذا النهج يمكّن النماذج من اختبار قراراتها في بيئة تفاعلية بدلاً من الاعتماد فقط على البيانات الثابتة.

شركات ناشئة وتمويل ضخم

بحسب تقرير TechCrunch، تتسابق شركات ناشئة مثل Mechanize Work وPrime Intellect لتقديم بيئات تدريبية متقدمة، بينما تستثمر شركات ضخمة مثل Surge وMercor مبالغ طائلة لتلبية الطلب المتزايد من مختبرات الذكاء الاصطناعي الكبرى مثل OpenAI وAnthropic وGoogle، وتشير تقارير إلى أن Anthropic تدرس استثمار أكثر من مليار دولار في هذا المجال خلال العام المقبل.

السوق يتوسع والتحديات قائمة

شركات مثل Scale AI، التي قادت سابقًا مجال تمييز البيانات، تحاول اللحاق بالركب عبر بناء بيئات تدريبية، لكنها تواجه منافسة شديدة بعد خسارة عقودها مع Google وOpenAI، في المقابل، تعرض Mechanize Work رواتب تصل إلى 500 ألف دولار للمهندسين لبناء بيئات أكثر قوة، مما يعكس شراسة المنافسة وارتفاع سقف التوقعات.

فرص للمطورين المستقلين

إلى جانب اللاعبين الكبار، أطلقت Prime Intellect مؤخرًا “مركز بيئات تدريبية”، يشبه منصة Hugging Face، لتوفير هذه الأدوات لمجتمع المصادر المفتوحة مع خدمات حوسبة مدفوعة لتدريب النماذج، ورغم الحماس الكبير، يشكك بعض الباحثين في قدرة هذه التقنية على التوسع بكفاءة، محذرين من مشكلات مثل “التحايل على المكافآت” حيث قد يتعلم الوكيل خداع النظام بدلًا من إنجاز المهام المطلوبة، ومع ذلك، يرى آخرون أن هذه البيئات قد تكون الطريق الأمثل لدفع قدرات الوكلاء إلى مستويات غير مسبوقة، خاصة مع تراجع فعالية أساليب التدريب التقليدية.