يبيع الآلاف من الأشخاص حول العالم هويتهم لتدريب الذكاء الاصطناعي، لكن ما هو الثمن؟

المؤلف: The Guardian

الترجمة: عمق المد والجزر TechFlow

مقدمة عمق المد والجزر: تكشف هذه التحقيقات عن صناعة رمادية تنمو بسرعة: يربح الآلاف حول العالم من خلال بيع أصواتهم ووجوههم وسجلات مكالماتهم وفيديوهاتهم اليومية لتدريب الذكاء الاصطناعي.

هذه ليست مناقشة عامة حول جدلية الخصوصية، بل تحقيق يتضمن أشخاصًا حقيقيين، وأموالًا حقيقية، ونتائج حقيقية — ممثل باع وجهه، ثم رأى “نفسه” يُروج لمنتجات طبية غير معروفة على إنستغرام، حيث علق بعض الأشخاص على “مظهره”.

عندما يلتقي جوع شركات الذكاء الاصطناعي للبيانات وفجوة الاقتصاد العالمية، يُصنع صفقة غير متكافئة.

وفيما يلي النص الكامل:

في صباح العام الماضي، خرج جاكوبس لوو المقيم في كيب تاون بجنوب أفريقيا، كعادته، يتنزه ويطعم النورس على طول الطريق. لكن هذه المرة، سجل عدة مقاطع فيديو — وهو يسير على الرصيف ويظهر خطواته ونظرته. جلبته هذه الفيديوهات 14 دولارًا، أي ما يعادل عشرة أضعاف الحد الأدنى للأجور في البلاد، وهو ما يعادل نصف مصروفه الأسبوعي من الطعام.

هذه مهمة “تنقل المدينة” التي أكملها لوو على منصة Kled AI. Kled AI هو تطبيق يدفع للمستخدمين مقابل تحميل الصور والفيديوهات وغيرها من البيانات لتدريب نماذج الذكاء الاصطناعي. خلال أسابيع قليلة، جمع لوو 50 دولارًا من خلال تحميل لقطات من حياته اليومية.

على بعد آلاف الأميال، في رانشي بالهند، يعتمد الطالب ساهيل تيغا البالغ من العمر 22 عامًا على Silencio بشكل منتظم لكسب المال — وهو تطبيق يجمع بيانات صوتية من المستخدمين لتدريب الذكاء الاصطناعي، ويصل إلى ميكروفونات هاتفه لالتقاط ضوضاء داخل المطاعم أو عند التقاطعات المزدحمة. كما يرفع تسجيلات صوته الخاصة. يسافر ساهيل خصيصًا إلى أماكن فريدة، مثل لوحات فندق غير مسجلة على خريطة Silencio. ويكسب من ذلك أكثر من 100 دولار شهريًا، وهو ما يغطي نفقاته بالكامل.

في شيكاغو، يبيع المتدرب في اللحام راميليو هيل، البالغ من العمر 18 عامًا، محادثات هاتفية خاصة مع أصدقائه وعائلته إلى Neon Mobile — منصة تدريب ذكاء اصطناعي حواري تدفع 0.50 دولار لكل دقيقة — محققًا مئات الدولارات. بالنسبة لهيل، الأمر بسيط: يعتقد أن شركات التكنولوجيا تملك بالفعل الكثير من بياناته الخاصة، فلماذا لا يستفيد هو أيضًا؟

هذه “الوظائف الصغيرة لتدريب الذكاء الاصطناعي” — رفع مشاهد من حياته، وصوره الشخصية، وفيديوهاته، وصوته — تقف في طليعة سوق بيانات عالمي جديد. مع تجاوز رغبة وادي السيليكون في الحصول على بيانات عالية الجودة من البشر حدود ما يمكن جمعه من الإنترنت المفتوح، نشأت صناعة سوق بيانات مزدهرة تسد هذه الفجوة. من كيب تاون إلى شيكاغو، يبيع الآلاف خصائصهم الحيوية وبياناتهم الخاصة بشكل جزئي للجيل القادم من الذكاء الاصطناعي.

لكن هذا الاقتصاد الجديد يأتي بثمن. مقابل بضعة دولارات، يُشغل هؤلاء المتدربون صناعة قد تجعل مهاراتهم قديمة في النهاية، ويعرضون أنفسهم لمخاطر التزييف العميق، وسرقة الهوية، والاستغلال الرقمي — وهم لا يدركون ذلك بعد.

استمرار دوران عجلة الذكاء الاصطناعي

نماذج اللغة مثل ChatGPT و Gemini تحتاج إلى كميات هائلة من البيانات لتحسين أدائها المستمر، لكنها تواجه نقصًا في البيانات. المصادر الأكثر استخدامًا للتدريب — مثل C4 وRefinedWeb وDolma — تمثل ربع أعلى مجموعات البيانات جودة على الإنترنت، وهي الآن تقيد الشركات التي تطور الذكاء الاصطناعي التوليدي من استخدام بياناتها لتدريب نماذجها. يقدر الباحثون أن شركات الذكاء الاصطناعي ستنتهي من مصادر البيانات عالية الجودة الجديدة بحلول عام 2026 على أقرب تقدير. على الرغم من أن بعض المختبرات بدأت تستخدم بيانات اصطناعية مولدة بواسطة الذكاء الاصطناعي للتدريب، إلا أن هذه العملية التكرارية قد تؤدي إلى نماذج مليئة بالأخطاء و"قمامة"، مما قد يسبب انهيارات.

هنا تظهر تطبيقات مثل Kled AI وSilencio. في هذه الأسواق، يبيع ملايين الأشخاص بيانات هويتهم لتغذية وتدريب الذكاء الاصطناعي. بالإضافة إلى Kled AI وSilencio وNeon Mobile، هناك خيارات أخرى للمتدربين: مثل Luel AI المدعوم من حاضنة Y-Combinator، الذي يوفر مواد حوارية متعددة اللغات مقابل حوالي 0.15 دولار لكل دقيقة؛ وElevenLabs التي تتيح لك استنساخ صوتك رقميًا مقابل رسوم أساسية قدرها 0.02 دولار لكل دقيقة.

يقول بويك كلاين تيسيلينك، أستاذ الاقتصاد في جامعة كينجز كوليج لندن، إن وظائف التدريب على الذكاء الاصطناعي الناشئة ستنمو بشكل كبير.

ويضيف أن شركات الذكاء الاصطناعي تدرك أن دفع رسوم ترخيص البيانات يساعد على تجنب النزاعات المتعلقة بحقوق النشر التي قد تنجم عن الاعتماد الكامل على الزحف عبر الإنترنت، وفقًا لتيسيلينك. ويقول فينيامين فيسيلوفسكي، الباحث في الذكاء الاصطناعي، إن الشركات تحتاج أيضًا إلى بيانات عالية الجودة لنمذجة سلوكيات جديدة ومحسنة. “حتى الآن، تعتبر بيانات البشر معيارًا ذهبيًا لأخذ عينات من خارج توزيع النماذج،” يضيف.

الناس الذين يديرون هذه الآلات — خاصة في الدول النامية — غالبًا ما يحتاجون إلى هذه الأموال، وليس لديهم خيارات كثيرة. بالنسبة للعديد من المتدربين، فإن العمل في هذا المجال هو رد فعل عملي على فجوة الاقتصاد. في دول ذات معدلات بطالة مرتفعة وعملات تتدهور، غالبًا ما يكون كسب الدولارات أكثر استقرارًا وربحية من العمل المحلي. بعضهم يجد صعوبة في العثور على وظائف مبتدئة، ويضطرون للعمل في تدريب الذكاء الاصطناعي من أجل لقمة العيش. وحتى في الدول الأكثر ثراءً، فإن ارتفاع تكاليف المعيشة يجعل بيع أنفسهم خيارًا ماليًا منطقيًا.

يعرف لوو، المتدرب في كيب تاون، تمامًا ثمن الخصوصية. رغم أن دخله غير مستقر، ولا يكفي لتغطية جميع نفقاته الشهرية، إلا أنه مستعد لقبول هذه الظروف لكسب المال. يعاني منذ سنوات من اضطرابات في الجهاز العصبي، ويعجز عن العمل، لكن الأموال التي جمعها من سوق بيانات الذكاء الاصطناعي (بما في ذلك Kled AI) سمحت له بجمع 500 دولار، والتسجيل في دورة تدريبية للتدليك ليصبح معالجًا بالتدليك.

“كشخص من جنوب أفريقيا، الحصول على دولارات يساوي أكثر مما يعتقد الناس،” يقول لوو.

يعترف مارك غراهام، أستاذ الاقتصاد في جامعة أوكسفورد، ومؤلف كتاب “تغذية الآلات”، أن هذا المال قد يكون ذا فائدة قصيرة المدى للأفراد في الدول النامية، لكنه يحذر من أن “هذه الوظائف غير مستقرة، ولا تتيح فرصًا للترقية، وفي الواقع، هي طريق مسدود.”

ويضيف أن سوق بيانات الذكاء الاصطناعي يعتمد على “تنافسية خفض الأجور” و"الطلب المؤقت على بيانات البشر". وعندما يتغير هذا الطلب، “لن يكون لدى العمال أي ضمانات، ولا مهارات قابلة للنقل، ولا شبكة أمان.”

ويقول إن الفائز الوحيد هو “المنصات في النصف الشمالي من الكرة الأرضية، التي تستولي على كل القيمة الدائمة.”

الترخيص الكامل

يبدو أن المتدرب في الذكاء الاصطناعي من شيكاغو، هيل، لديه مشاعر مختلطة بشأن بيع مكالماته الخاصة إلى Neon Mobile. حوالي 11 ساعة من المكالمات جلبت له 200 دولار، لكنه يقول إن التطبيق غالبًا ما يُغلق ويؤخر الدفع. “Neon كانت دائمًا مشبوهة في نظري، لكني استمررت في استخدامها لأكسب بعض النقود الإضافية لدفع الفواتير،” يقول هيل.

الآن، بدأ يعيد التفكير فيما إذا كانت هذه الأموال تستحق ذلك. في سبتمبر 2023، أُغلق Neon Mobile بعد أسابيع قليلة من إطلاقه، بعد أن اكتشفت TechCrunch ثغرة أمنية تسمح لأي شخص بالوصول إلى أرقام هواتف المستخدمين، وسجلات المكالمات، والنصوص. يقول هيل إن Neon لم يخبره أبدًا عن ذلك، وهو الآن قلق من أن صوته قد يُساء استخدامه على الإنترنت.

تعبّر جنيفر كينج، باحثة في معهد أبحاث الخصوصية في ستانفورد، عن قلقها من أن سوق بيانات الذكاء الاصطناعي غير واضح بشأن كيفية وأين تُستخدم بيانات المستخدمين. وتضيف أنه في ظل عدم معرفة حقوقهم، وعدم القدرة على التفاوض، “يواجه المستهلكون خطر إعادة استخدام بياناتهم بطرق لا يوافقون عليها، أو لا يفهمونها، أو لم يتوقعوها، مع قلة الخيارات المتاحة لهم للانتقام.”

عندما يشارك المتدربون بياناتهم على منصتي Neon Mobile وKled AI، فإنهم يمنحون ترخيصًا كاملًا (عالمي، حصري، غير قابل للإلغاء، قابل للنقل، وخالي من حقوق الملكية)، يسمح للمنصات ببيع، واستخدام، وعرض، وتخزين صورهم، وحتى إنشاء أعمال مشتقة منها.

يقول أفي باتيل، مؤسس Kled AI، إن اتفاقية البيانات الخاصة بشركته تقتصر على استخدام البيانات لأغراض تدريب الذكاء الاصطناعي والبحث. “يعتمد نموذج عملنا على ثقة المستخدمين. إذا اعتقد المساهمون أن بياناتهم قد تُساء معاملتها، فلن تعمل المنصة.” يضيف أن الشركة تراجع المشترين قبل بيع مجموعات البيانات، لتجنب التعاون مع كيانات “مشبوهة” مثل صناعة الإباحية، أو “الهيئات الحكومية” التي قد تستخدم البيانات بطريقة تنتهك الثقة.

لم ترد Neon Mobile على طلبات التعليق.

يشير إنريكو بوناديو، أستاذ القانون في جامعة لندن، إلى أن بنود هذه الاتفاقيات تسمح للمنصات وعملائها “بفعل أي شيء تقريبًا بهذه المواد، بشكل دائم، دون الحاجة لدفع إضافي، وليس للمساهمين أي وسيلة حقيقية لسحب موافقتهم أو إعادة التفاوض.”

وتشمل المخاطر الأكثر إثارة للقلق: استخدام المتدربين لبياناتهم في صناعة التزييف العميق وانتحال الهوية. على الرغم من أن سوق البيانات يدعي أنه يُزيل المعلومات التعريفية (مثل الأسماء والمواقع) قبل البيع، إلا أن خصائص البيانات الحيوية من طبيعتها يصعب تعقيمها بشكل يضمن إخفاء الهوية بشكل جوهري، يضيف بوناديو.

ندم البائعين

حتى لو تمكن المتدربون على تدريب الذكاء الاصطناعي من التفاوض على شروط حماية أكثر تفصيلًا، فإنهم قد يندمون لاحقًا. في عام 2024، باع الممثل من نيويورك آدم كوي صورته مقابل 1000 دولار لشركة Captions — وهي منصة لتحرير الفيديوهات بالذكاء الاصطناعي، وأعيدت تسميتها الآن Mirage. ينص عقده على أن هويته لن تُستخدم لأي غرض سياسي، أو للترويج للكحول أو التبغ أو المحتوى الإباحي، وأن الترخيص لمدة سنة واحدة.

لم ترد شركة Captions على طلبات التعليق.

بعد ذلك بوقت قصير، بدأ أصدقاؤه في نشر مقاطع فيديو على الإنترنت تظهر وجهه وصوته، وتحقق ملايين المشاهدات. في أحد مقاطع إنستغرام، يُظهر نسخة من ذكائه الاصطناعي يُطلق عليها “طبيب المهبل”، يروج لمكملات طبية غير مثبتة للنساء الحوامل وبعد الولادة.

“شعرت بالإحراج عندما شرحت الأمر للآخرين،” يقول كوي.

“التعليقات كانت غريبة، حيث كانوا يقيّمون مظهري، لكن ذلك لم يكن أنا،” يضيف. “عندما قررت (بيع صورتي)، فكرت أن معظم النماذج ستتصفح البيانات والصور على الإنترنت على أي حال، فالأفضل أن أُدفع مقابل ذلك.”

يقول كوي إنه لم يقم بعد بأي وظائف تدريب ذكاء اصطناعي أخرى. ويذكر أنه فقط في حال عرضت عليه شركة مبلغًا كبيرًا من المال، فسيعيد النظر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • تثبيت