
داخل مانوس: وكيل الذكاء الاصطناعي الصيني الجديد الذي يلفت الأنظار
الضجة حول وكيل الذكاء الاصطناعي العام الجديد مانوس كانت صاخبة وعالمية. طورته شركة ناشئة مقرها ووهان تسمى تأثير الفراشة، وقد جذب مانوس اهتماماً كبيراً من عالم التكنولوجيا، بما في ذلك إشادات من مؤسس تويتر جاك دورسي وفيكتور موستار من هاجينج فيس. حتى أنه حظي بمقارنات مع ديب سيك، النجاح المفاجئ السابق في مجال الذكاء الاصطناعي. لكن هل يرقى إلى مستوى الضجة المثارة حوله؟
رغم الإثارة، لم يتمكن سوى عدد قليل من المستخدمين من تجاوز قائمة الانتظار—أقل من 1% في الواقع. ومع ذلك، فإن الاهتمام حقيقي: يضم سيرفر ديسكورد الرسمي أكثر من 186,000 عضو، ويُشاد بمانوس كأحد أوائل أدوات الذكاء الاصطناعي التي تعمل كـ وكيل متعدد الأغراض حقيقي، وليس مجرد روبوت دردشة. على عكس الأنظمة أحادية النموذج مثل ChatGPT أو DeepSeek، يعمل مانوس من خلال تنسيق نماذج ذكاء اصطناعي متعددة (بما في ذلك Claude 3.5 Sonnet وإصدارات مخصصة من Qwen) ووكلاء مستقلين لأداء المهام بشكل مستقل.
اختبار متدرب الذكاء الاصطناعي
حصلت مجلة MIT Technology Review على وصول مبكر إلى مانوس واختبرت قدراته. استخدامه بدا طبيعياً بشكل مدهش، مثل العمل مع متدرب ذكي وسريع الاستجابة. أحياناً كانت الأداة تسيء فهم التعليمات أو تحاول الإسراع في المهام، لكن عند توجيهها بملاحظات مفصلة، كانت تتكيف بسرعة. تصميمها نظيف وسهل الاستخدام ومُحسّن للمستخدمين الناطقين بالإنجليزية.
عند تسجيل الدخول باستخدام رمز الدعوة، يصل المستخدمون إلى واجهة مشابهة لواجهة ChatGPT، مع إدخال الدردشة في المنتصف، وسجل الجلسات على اليسار، واقتراحات المهام المنسقة في الصفحة الرئيسية، بما في ذلك التخطيط التجاري، والأدوات التعليمية، وبرامج العافية الشخصية.
الميزة البارزة هي نافذة ”كمبيوتر مانوس“، التي تعرض لك كل ما يفعله الوكيل—خطوة بخطوة. يمكنك المشاهدة أو الإيقاف المؤقت أو التدخل للمساعدة. هذه الشفافية نادرة بين أدوات الذكاء الاصطناعي الوكيلية وتجعل التجربة تبدو أكثر تعاونية.
أداء المهام: من قوائم الصحافة إلى العقارات
تم استخدام ثلاث مهام رئيسية لتقييم مانوس:
- العثور على أبرز صحفيي التكنولوجيا في الصين
كانت القائمة الأولية قصيرة وغير متسقة. عندما سُئل عن السبب، اعترف مانوس بأنه تسرع. بعد طلب مزيد من العمق والوضوح، عاد الوكيل بـ قائمة أكثر ثراءً وهيكلة جيدة تضم 30 صحفياً، بما في ذلك المنافذ الإعلامية والمقالات الرئيسية. حتى أنه سمح بالتنزيل بتنسيقات Word أو Excel. الجانب السلبي؟ واجه صعوبة مع المحتوى المحمي بجدران الدفع والكابتشا، مما يتطلب مساعدة بشرية في تلك الحالات. - البحث عن شقق في مدينة نيويورك
تم إعطاء مانوس معايير مفصلة—الميزانية، المساحة الخارجية، الموقع، إلخ. في البداية، فسر ”المساحة الخارجية“ بشكل ضيق للغاية، مستبعداً العديد من الخيارات الجيدة. لكن بعد تنقيح الطلب، أنتج قائمة متدرجة مفيدة، مكتملة بتصنيفات مثل ”أفضل قيمة“ و ”اختيار فاخر.“ استغرقت العملية أقل من 30 دقيقة—أسرع بكثير من مهمة الصحافة. - ترشيح المبتكرين تحت سن 35
كانت هذه المهمة الأكثر تعقيداً. بدأ مانوس بدراسة ملفات المرشحين السابقين وبنى خطة بحث. بعد ثلاث ساعات، أنتج فقط بضعة ملفات كاملة وقائمة تقريبية من 50 اسماً، كثير منها منحاز لبعض المناطق والقطاعات. عندما طُلب منه خمسة مرشحين صينيين، قدمهم، لكنه مال نحو شخصيات إعلامية معروفة. حذر النظام أيضاً من أن معالجة الكثير من الطلبات قد تؤدي إلى تدهور الأداء.
ليس مثالياً، لكنه واعد
بشكل عام، يؤدي مانوس أفضل أداء في مهام البحث المركزة ذات البيانات مفتوحة المصدر. طبيعته الشبيهة بالمتدرب تجعله مفيداً بشكل خاص للمحترفين الذين يحتاجون إلى مخرجات منظمة، مثل القوائم أو الملخصات أو موجزات البحث. في حين أنه يتفوق على DeepResearch من ChatGPT في الجودة، إلا أنه يمكن أن يكون أبطأ و أقل استقراراً، حيث يتعطل أو يتجمد غالباً أثناء المهام. يمنع الحمل العالي على الخادم أحياناً بدء جلسات جديدة.
لكن نقطة سعر مانوس تعد ميزة رئيسية: 2 دولار لكل مهمة، مقارنة بـ 20 دولاراً لـ DeepResearch. ووفقاً لمطوريه، فإن تحسينات الخادم قادمة.
الحكم النهائي
تكمن القوة الحقيقية لمانوس في شفافيته وقدرته على التكيف وتصميمه التعاوني. يمكن للمستخدمين المتابعة، والتدخل عند الحاجة، وحتى التأثير على تعلم الوكيل بمرور الوقت. يتم حفظ كل جلسة ويمكن إعادة تشغيلها، مما يسهل مشاركة التقدم أو مراجعته.
في حين أنه لا يزال بحاجة إلى ضبط دقيق، خاصة مع المهام الكبيرة والاستقرار، يشير مانوس إلى أن نظام الذكاء الاصطناعي الصيني ليس فقط يلحق بالركب، بل يبتكر في اتجاهه الخاص، دافعاً حدود ما يمكن للذكاء الاصطناعي المستقل القيام به.
اترك تعليقاً