ابدأ بـ RAG: إجابات مرتكزة على بياناتك
التوليد المعزز بالاسترجاع، RAG، يعني أن النموذج لا يجيب من ذاكرته. قبل أن يكتب كلمة واحدة، تسترجع المنظومة المقاطع ذات الصلة من محتواك أنت: الوثائق والسياسات وسجل الحالات وبيانات المنتج. تُبنى الإجابة من تلك المقاطع وتستشهد بها.
هذا الخيار التصميمي وحده يغيّر طبيعة الخطأ كلها. النموذج غير المرتكز ينتج نصاً يبدو مقنعاً فحسب. أما المرتكز فينتج نصاً تسنده مصادرك، وحين لا تدعم المصادر إجابة، يستطيع أن يقول ذلك صراحة بدل أن يخترع جواباً.
أضف الجزء الوكيلي: منظومات تتصرف
روبوت المحادثة ينتهي عند الرد. الوكيل يواصل: يفتح الحالة، يحجز الموعد، يحدّث السجل، ويوجّه الاستثناء إلى إنسان مع السياق مرفقاً. RAG الوكيلي يتخذ من الاسترجاع المرتكز قاعدة أدلته، ثم ينفّذ الخطوة التالية داخل الأنظمة التي تشغّلها أصلاً.
في عمليات النشر لدينا يظهر ذلك منظومات متعددة الوكلاء: منسّق Synthesiser يوجّه وكلاء مجال متخصصين، كل منهم معايَر على شريحته من المشكلة. يستشهد الوكلاء بمصادرهم، يرفقون مستوى ثقة، ويعترضون حين يناقض مدخلٌ ما الأدلة.
الاختبار الذي يفرز بينهما
اطرح على أي مزود سؤالاً واحداً: حين تنتهي المحادثة، ما الذي تغيّر في أنظمتك؟ إن كان الجواب لا شيء، فهو روبوت محادثة. وإن كانت حالات قد حُلّت وسجلات حُدّثت وعمل تقدّم بسجل تدقيق كامل، فهو وكيل.
أرقام الإنتاج تنبع من هذا الفرق بالذات. وكيل ترشيح الضوضاء يُبقي 60-80% من الحالات الزائفة بعيداً عن فريق الدعم. ووكيل الرد الأول ينقل الحالات الروتينية من ساعات إلى ثوانٍ، على مدار الساعة.