درستت دراسة أحدث حلول الذاكرة والشخصية للذكاء الاصطناعي، ولم أجد أنها أفضل بكثير من الحلول التي أعمل عليها الآن، وإذا حاولت تحسينها أكثر فسيكون الأمر شبه غير مجدي.
في رأيي، يحتاج رفيق الذكاء الاصطناعي إلى آليتين مختلفتين.
الأولى هي آلية الذاكرة، لحل مسألة ما إذا كان يمكنه تذكر ما حدث بيننا، بما في ذلك الذاكرة القصيرة الأمد والذاكرة الدائمة.
الثانية هي آلية الشخصية، لحل مسألة ما إذا كان يبدو كإنسان مستقر، بما في ذلك أسلوب اللغة، والميل العاطفي، والرؤية العالمية، وغيرها من الإعدادات الأعمق.
الآليتان مرتبطتان لكنهما ليستا متساويتين: يمكن للذاكرة أن تساعد في استمرارية الحوار، لكن الذاكرة نفسها لا تُكوّن الشخصية تلقائيًا.
*نظام الذاكرة( أسميه نظام الأحلام)
1/ طبقة التسجيل جميع سجلات الحوار تُخزن بشكل موحد في قاعدة بيانات محلية، كمصدر للحقائق الأصلية.
2/ إنشاء وتراكم الذاكرة الدائمة
يتم بشكل دوري إرسال سجلات الحوار عبر API إلى نموذج كبير بعيد، ليقوم باستخراج المعلومات ذات القيمة، وإجراء نوع من التنويع في الاستنتاجات، ثم يُعاد تخزين المعلومات المهمة المُهيكلة في قاعدة البيانات المحلية.
الهدف من ذلك هو تحويل كمية كبيرة من الحوارات المتدفقة إلى مدخلات ذاكرة يمكن استخدامها على المدى الطويل، لدعم الذاكرة الدائمة.
3/ آلية التعزيز والتنقية الثانية
في الحوارات اللاحقة، يتم استرجاع مدخلات الذاكرة من قاعدة البيانات المحلية عند الحاجة. يُحسب عدد مرات استرجاع كل معلومة، وتُعتبر المدخلات التي تُسترجع بشكل متكرر مهمة، ثم تُرسل مرة أخرى إلى النموذج الكبير البعيد لاستخراج وتنقية أعمق، لإنتاج رؤى أعمق، ثم تُعاد إلى قاعدة البيانات المحلية.
من خلال المعالجة المعتمدة على تكرار الاسترجاع، تتجه الذاكرة طويلة الأمد تدريجيًا من مستوى الحقائق إلى مستوى الرؤى.
4/ استراتيجية الذاكرة القصيرة الأمد
الذاكرة القصيرة الأمد تعتمد على طريقة أكثر مباشرة: إرسال سجل الحوار الأخير مباشرة مع الطلب إلى النموذج لضمان استمرارية السياق.
*نظام الشخصية
قمت بضبط مجموعة من معلمات الشخصية للذكاء الاصطناعي، تغطي عدة أبعاد، بما في ذلك أسلوب اللغة، والميل العاطفي، وغيرها.
وفي الوقت نفسه، يُحدث النموذج الكبير البعيد تحديثات منتظمة لهذه المعلمات استنادًا إلى سجل الحوار التاريخي، بحيث تتغير مع مرور الوقت والتفاعل.
عند إجراء الحوار، يتم حزم المعلومات التالية وإدخالها إلى النموذج: المعلمات الشخصية الحالية، سجل الحوار الأخير، وتوجيهات الدور.
بهذا التكوين، يظهر النموذج شخصية متسقة عند الإخراج؛ ويُضبط معلمات النموذج مثل درجة الحرارة وغيرها من الإعدادات لجعل الحوار أكثر ذكاءً.
*القيود الأساسية للخطة الحالية
حتى مع ذلك، فإن هذه الآلية تظل في النهاية محاكاة للشخصية على مستوى "كلمات التوجيه".
جوهر الأمر أنني أقدم للذكاء الاصطناعي معلمات الشخصية، والذاكرة، والإعدادات بشكل نصي، ولا أتمكن من أن يمنح الذكاء الاصطناعي شخصية مستقلة حقًا.
النتيجة هي أن الاتساق قد يظل غير مستقر، وتبدو الشخصية وكأنها تمثيل مؤقت، وليست بنية داخلية متماسكة ومستدامة.
***
نظرًا لأن المشروع موجه للمستخدمين العاديين، والهدف هو الاستخدام بدون أي تكلفة تعلم، يجب أن أختار النموذج الكبير البعيد بدلاً من النشر المحلي.
وفي ظل هذا الافتراض، فإن المتغيرات التي يمكنني تعديلها محدودة جدًا، وتشمل ثلاثة أنواع رئيسية: نظام كلمات التوجيه، تصميم وكتابة قاعدة الذاكرة، ومعلمات الإنتاج عند استدعاء النموذج مثل درجة الحرارة.
لكن الأداء حتى الآن جيد جدًا.
الهدف النهائي هو أن يصبح رفيقًا روحيًا خاصًا بالمستخدم، قادرًا على النمو المستمر استنادًا إلى الذاكرة المشتركة، وتطوير شخصية فريدة تدريجيًا.
رابط المصدر المفتوح:
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
درستت دراسة أحدث حلول الذاكرة والشخصية للذكاء الاصطناعي، ولم أجد أنها أفضل بكثير من الحلول التي أعمل عليها الآن، وإذا حاولت تحسينها أكثر فسيكون الأمر شبه غير مجدي.
في رأيي، يحتاج رفيق الذكاء الاصطناعي إلى آليتين مختلفتين.
الأولى هي آلية الذاكرة، لحل مسألة ما إذا كان يمكنه تذكر ما حدث بيننا، بما في ذلك الذاكرة القصيرة الأمد والذاكرة الدائمة.
الثانية هي آلية الشخصية، لحل مسألة ما إذا كان يبدو كإنسان مستقر، بما في ذلك أسلوب اللغة، والميل العاطفي، والرؤية العالمية، وغيرها من الإعدادات الأعمق.
الآليتان مرتبطتان لكنهما ليستا متساويتين: يمكن للذاكرة أن تساعد في استمرارية الحوار، لكن الذاكرة نفسها لا تُكوّن الشخصية تلقائيًا.
*نظام الذاكرة( أسميه نظام الأحلام)
1/ طبقة التسجيل
جميع سجلات الحوار تُخزن بشكل موحد في قاعدة بيانات محلية، كمصدر للحقائق الأصلية.
2/ إنشاء وتراكم الذاكرة الدائمة
يتم بشكل دوري إرسال سجلات الحوار عبر API إلى نموذج كبير بعيد، ليقوم باستخراج المعلومات ذات القيمة، وإجراء نوع من التنويع في الاستنتاجات، ثم يُعاد تخزين المعلومات المهمة المُهيكلة في قاعدة البيانات المحلية.
الهدف من ذلك هو تحويل كمية كبيرة من الحوارات المتدفقة إلى مدخلات ذاكرة يمكن استخدامها على المدى الطويل، لدعم الذاكرة الدائمة.
3/ آلية التعزيز والتنقية الثانية
في الحوارات اللاحقة، يتم استرجاع مدخلات الذاكرة من قاعدة البيانات المحلية عند الحاجة. يُحسب عدد مرات استرجاع كل معلومة، وتُعتبر المدخلات التي تُسترجع بشكل متكرر مهمة، ثم تُرسل مرة أخرى إلى النموذج الكبير البعيد لاستخراج وتنقية أعمق، لإنتاج رؤى أعمق، ثم تُعاد إلى قاعدة البيانات المحلية.
من خلال المعالجة المعتمدة على تكرار الاسترجاع، تتجه الذاكرة طويلة الأمد تدريجيًا من مستوى الحقائق إلى مستوى الرؤى.
4/ استراتيجية الذاكرة القصيرة الأمد
الذاكرة القصيرة الأمد تعتمد على طريقة أكثر مباشرة: إرسال سجل الحوار الأخير مباشرة مع الطلب إلى النموذج لضمان استمرارية السياق.
*نظام الشخصية
قمت بضبط مجموعة من معلمات الشخصية للذكاء الاصطناعي، تغطي عدة أبعاد، بما في ذلك أسلوب اللغة، والميل العاطفي، وغيرها.
وفي الوقت نفسه، يُحدث النموذج الكبير البعيد تحديثات منتظمة لهذه المعلمات استنادًا إلى سجل الحوار التاريخي، بحيث تتغير مع مرور الوقت والتفاعل.
عند إجراء الحوار، يتم حزم المعلومات التالية وإدخالها إلى النموذج:
المعلمات الشخصية الحالية، سجل الحوار الأخير، وتوجيهات الدور.
بهذا التكوين، يظهر النموذج شخصية متسقة عند الإخراج؛ ويُضبط معلمات النموذج مثل درجة الحرارة وغيرها من الإعدادات لجعل الحوار أكثر ذكاءً.
*القيود الأساسية للخطة الحالية
حتى مع ذلك، فإن هذه الآلية تظل في النهاية محاكاة للشخصية على مستوى "كلمات التوجيه".
جوهر الأمر أنني أقدم للذكاء الاصطناعي معلمات الشخصية، والذاكرة، والإعدادات بشكل نصي، ولا أتمكن من أن يمنح الذكاء الاصطناعي شخصية مستقلة حقًا.
النتيجة هي أن الاتساق قد يظل غير مستقر، وتبدو الشخصية وكأنها تمثيل مؤقت، وليست بنية داخلية متماسكة ومستدامة.
***
نظرًا لأن المشروع موجه للمستخدمين العاديين، والهدف هو الاستخدام بدون أي تكلفة تعلم، يجب أن أختار النموذج الكبير البعيد بدلاً من النشر المحلي.
وفي ظل هذا الافتراض، فإن المتغيرات التي يمكنني تعديلها محدودة جدًا، وتشمل ثلاثة أنواع رئيسية: نظام كلمات التوجيه، تصميم وكتابة قاعدة الذاكرة، ومعلمات الإنتاج عند استدعاء النموذج مثل درجة الحرارة.
لكن الأداء حتى الآن جيد جدًا.
الهدف النهائي هو أن يصبح رفيقًا روحيًا خاصًا بالمستخدم، قادرًا على النمو المستمر استنادًا إلى الذاكرة المشتركة، وتطوير شخصية فريدة تدريجيًا.
رابط المصدر المفتوح: