Wikimedia, устал от трафика, вызванного искусственным интеллектом, который пытается «учиться». Какие решения предлагаются

Фонд Wikimedia недавно объявил, что трафик, генерируемый автоматическими битами, предназначенным для моделей искусственного интеллекта, оказал значительное давление на серверы Википедии.
С января 2024 года они увеличили использование полосы пропускания для сброса мультимедийного содержания на 50%, что привело к увеличению технических и финансовых затрат для Wikimedia.
Несмотря на значительный вклад платформы, трафик загрузки привел к чрезмерному использованию ресурсов, не приносят прямым преимуществам сообществу Wikimedia.
Влияние бота на инфраструктуру Викимедии, катастрофа
Wikimedia, в которой размещаются такие платформы, как Wikipedia и Wikimedia Commons, где хранятся около 144 миллионов медиа-файлов, испытывает все более распространенное явление в сообществе программного обеспечения с открытым исходным кодом: автоматизированное соскоб.
Эти боссы, которые собирают данные для моделей искусственного интеллекта, доступа к массовым и быстрому файлам на платформах Wikimedia. Несмотря на очевидные преимущества Wikimedia для развития искусственного интеллекта, автоматически генерировал угроза по устойчивости инфраструктуры сообщества.
Проблема становится очевидной, когда случаи массового трафика анализируются одновременно. Например, после смерти бывшего президента США Джимми Картера в декабре 2024 года его страница в Википедии записала миллионы.
Но реальный стресс был вызван тем фактом, что пользователи смотрели 1,5 -часовое видео от Wikimedia Commons. Это привело к удвоению обычного трафика, а некоторые интернет -подключения были временно перегружены.
Удивительно, но большая часть пропускной способности уже использовалась от ударов, которые соскабливали на платформе, прежде чем реальные пользователи получают доступ к контенту, пишет Arstechnica.
Какие решения можно найти для балансировки доступа к инфраструктуре
Фонд Wikimedia заявляет, что бесплатный доступ к информации не означает отсутствие затрат на инфраструктуру, необходимую для поддержки этого доступа.
Хотя многие компании основаны на информации, предоставленной такими платформами, как Wikimedia, для обучения коммерческих моделей, они не способствуют поддержке инфраструктуры, которая делает возможный свободный доступ к этим знаниям. Это создает технический дисбаланс, который угрожает устойчивости общественных платформ.
В этом контексте Wikimedia выпустила инициативу WE5, которая является ответственным использованием инфраструктуры. Его цель состоит в том, чтобы побудить разработчиков принять более эффективные методы доступа, поддерживать открытие и доступность знаний, не подвергая опасности ресурсы платформы.
Сотрудничество между разработчиками ИИ и поставщиками ресурсов может решить эти проблемы, создавая выделенные API, финансируя общую инфраструктуру или улучшая модели доступа.
В отсутствие практического сотрудничества платформы, которые позволили авансу, могут не иметь возможности продолжать поддерживать надежные услуги.