تتعرض شركات الذكاء الاصطناعي لانتقادات حادة بسبب استيلائها على محتوى مواقع الإنترنت واستخدامه في تدريب نماذجها المختلفة أو إعادة نشره عبر منصات متعددة. وذلك وفقًا لتقرير وكالة رويترز، فإن شركة Perplexity، المالكة لمحرك البحث المدعوم بالذكاء الاصطناعي، بالإضافة إلى شركات أخرى مشابهة، تتجاوز تعليمات ملف robots.txt لجمع محتوى المواقع لاستخدامه في من اجل تدريب نماذجها.
- استخدام ملف robots.txt وإشكالية الامتثال :
يعتبر ملف robots.txt من الوسائل التي يستخدمها مطورو الويب منذ عام 1994 وذلك لتحديد الصفحات التي يمكن لمحركات البحث وروبوتات جمع البيانات الوصول إليها. ومع ذلك، فإن الامتثال لهذه التعليمات يعتبر اختياري بشكل تام . مما يفتح الباب أمام الشركات من اجل تجاوزها . وذكرت رويترز أنها اطلعت على رسالة موجهة إلى الناشرين من شركة . TollBitوالتي تعمل على توصيل الناشرين بشركات الذكاء الاصطناعي من اجل توقيع اتفاقيات ترخيص. تحذر الرسالة من أن “وكلاء الذكاء الاصطناعي من مصادر متعددة (وليس شركة واحدة فقط) يتجاوزون بروتوكول robots.txt من اجل الحصول على محتوى من المواقع " دون ترخيص، دون ذكر شركات محددة " .
- استخدام ملف robots.txt وإشكالية الامتثال :
يعتبر ملف robots.txt من الوسائل التي يستخدمها مطورو الويب منذ عام 1994 وذلك لتحديد الصفحات التي يمكن لمحركات البحث وروبوتات جمع البيانات الوصول إليها. ومع ذلك، فإن الامتثال لهذه التعليمات يعتبر اختياري بشكل تام . مما يفتح الباب أمام الشركات من اجل تجاوزها . وذكرت رويترز أنها اطلعت على رسالة موجهة إلى الناشرين من شركة . TollBitوالتي تعمل على توصيل الناشرين بشركات الذكاء الاصطناعي من اجل توقيع اتفاقيات ترخيص. تحذر الرسالة من أن “وكلاء الذكاء الاصطناعي من مصادر متعددة (وليس شركة واحدة فقط) يتجاوزون بروتوكول robots.txt من اجل الحصول على محتوى من المواقع " دون ترخيص، دون ذكر شركات محددة " . - تجاوز التعليمات من قبل الشركات الكبرى :
أشار موقع “بيزنس إنسايدر” إلى أن شركتي " OpenAI و Anthropic " اللتين تعملان في مجال الذكاء الاصطناعي، تتجاوزان أيضًا بروتوكول robots.txt. برغم أن الشركتين قد أعلنتا سابقًا احترامهما للتعليمات الموجودة في ملفات robots.txt الخاصة بالمواقع. واكتشفت مجلة Wired أن هناك برنامجًا على خادم تابع لشركة أمازون تشغّله شركة Perplexity يتجاوز تعليمات robots.txt الخاصة بموقعها للوصول إلى محتواها. وتأكدت المجلة من ذلك بعد تحقيق خاص. - ردود فعل الشركات والدعاوى القانونية :
في مقابلة مع مجلة " Fast Company" قال الرئيس التنفيذي لشركة " Perplexity" أرافيند سرينيفاس إن شركته " لا تتجاهل بروتوكول استبعاد الروبوتات " ولكنه أوضح أن الشركة تستفيد من الروبوتات التي تتجاهل البروتوكول. وأشار إلى أن الشركة تستخدم زواحف ويب تابعة لأطراف خارجية بالإضافة إلى زواحفها الخاصة وأن الزاحف الذي حددته مجلة Wired كان واحدًا منها. رفع بعض الناشرين مثل صحيفة نيويورك تايمز دعاوى قضائية ضد شركات الذكاء الاصطناعي بتهمة انتهاك حقوق الطبع والنشر. بينما اتجه آخرون إلى توقيع اتفاقيات ترخيص مع شركات الذكاء الاصطناعي من اجل تقديم تراخيص استخدام المحتوى مقابل الدفع. وبهذا الشكل، تتصاعد حدة الجدل حول استخدام محتوى المواقع بدون إذن . مما يطرح تساؤلات حول مستقبل حقوق الطبع والنشر في ظل تطور تقنيات الذكاء الاصطناعي . نتمنى لكم الفائده دائما معنا .