Les bots automatisés d’IA, en quête de données pour leur apprentissage, menacent la stabilité du projet Wikipedia, selon la Fondation Wikimedia. Cette situation met en lumière les défis techniques et financiers croissants auxquels font face les plateformes open source.
Une Pression Croissante sur les Serveurs
La Fondation Wikimedia a récemment alerté sur l’impact significatif des bots d’IA sur ses serveurs. Ces derniers, cherchant à alimenter leurs modèles avec des données, ont accru l’utilisation de la bande passante de 50% depuis janvier 2024. Cette tendance n’est pas isolée et reflète une problématique plus large au sein de la communauté des logiciels libres.
L’Impact sur les Ressources
Wikimedia Commons, avec ses 144 millions de fichiers média sous licence libre, est une ressource inestimable. Cependant, l’exploitation intensive par les entreprises d’IA, via des crawlers et des téléchargements en masse, a engendré des coûts techniques et financiers considérables. Ces actions, souvent sans attribution, compromettent l’écosystème bénévole de Wikimedia.
Un Événement Révélateur
Le décès de l’ancien président américain Jimmy Carter en décembre 2024 a illustré ce défi. Alors que sa page Wikipedia attirait des millions de visites, le streaming massif d’une vidéo de débat de 1980 a doublé le trafic normal, révélant l’ampleur de la consommation de bande passante par les bots.
Des Solutions en Débat
Face à ces défis, des mesures comme les défis de preuve de travail ou les listes noires collaboratives sont explorées. Ces initiatives visent à équilibrer l’accès ouvert avec les besoins industriels de l’IA, tout en protégeant les infrastructures des plateformes open source.
Un Avenir Incertain pour les Communs Numériques
La Fondation Wikimedia souligne que si le contenu est libre, l’infrastructure ne l’est pas. Le projet WE5: Utilisation Responsable des Infrastructures, cherche à établir des limites durables tout en préservant l’ouverture. La collaboration entre développeurs d’IA et fournisseurs de ressources apparaît comme une piste essentielle pour assurer la pérennité des plateformes communautaires.