La géante des réseaux sociaux Reddit a révélé qu'elle fait l'objet d'une enquête de la Federal Trade Commission (FTC) concernant ses pratiques de licence de données pour la formation à l'intelligence artificielle. Cette divulgation intervient alors que l'entreprise se prépare à son tant attendu introduction en bourse.
La divulgation est apparue dans un amendement au formulaire d'enregistrement S-1 déposé auprès de la Securities and Exchange Commission hier, soumis le lendemain de la réception de l'enquête de la FTC.
«Le 14 mars 2024, nous avons reçu une lettre de la FTC nous informant que le personnel de la FTC mène une enquête non publique axée sur notre vente, licence ou partage de contenu généré par les utilisateurs avec des tiers pour former des modèles d'IA», a déclaré Reddit dans le dépôt. «Compte tenu de la nature novatrice de ces technologies et des accords commerciaux, nous ne sommes pas surpris que la FTC ait manifesté un intérêt pour ce domaine.
»Nous ne pensons pas avoir commis de pratiques commerciales déloyales ou trompeuses«, note le dépôt.
La sonde de la FTC fait suite à un accord de 60 millions de dollars par an que Reddit a signé avec Google en février, accordant au géant de la recherche l'accès à la vaste mine de données des utilisateurs de Reddit pour former ses modèles d'IA. L'accord approfondit la relation entre les deux entreprises, Reddit gagnant une plus grande visibilité sur la plateforme de Google en échange de ses précieuses données.
»Avec l'API de données Reddit, Google aura désormais un accès efficace et structuré à des informations plus récentes«, a déclaré Google au moment de l'annonce. »Ainsi que des signaux améliorés qui nous aideront à mieux comprendre le contenu de Reddit et à l'afficher, le former et l'utiliser de la manière la plus précise et pertinente possible.«
Reddit, qui compte plus de 100 000 communautés actives et enregistre en moyenne 1,2 million de publications et 7,5 millions de commentaires par jour, considère ses données comme un atout clé sur le marché de l'IA en pleine croissance. »Nous pensons que nos données de plateforme en croissance seront un élément clé dans la formation des principaux grands modèles de langage («LLMs») et serviront de canal de monétisation supplémentaire pour Reddit«, a déclaré la société dans son prospectus.
Cependant, la licence des données utilisateur pour l'IA a soulevé des préoccupations parmi les défenseurs de la vie privée et les régulateurs. Dans son dépôt, Reddit a reconnu que ses efforts de licence de données en sont encore aux premiers stades et sont soumis à des réglementations évolutives.
»Ces programmes peuvent nous soumettre à des approches évolutives de la réglementation de ces données et impliquent des lois, règles et réglementations complexes et en développement en matière de confidentialité des données, de protection des données, d'appropriation indue et de propriété intellectuelle«, a déclaré la société.
Ce n'est pas la première fois que les ambitions d'IA de Reddit font la une. Dans le cadre de ses plans d'IPO, la société a déclaré qu'elle avait investi dans Bitcoin et Ethereum dans le cadre de sa stratégie de bilan avant son IPO. Le dépôt a également révélé que Reddit avait acquis de l'Ethereum et du Polygon (MATIC) pour payer des biens virtuels sur sa plateforme.
»Nous avons investi une partie de nos réserves de trésorerie excédentaires en Bitcoin et en Ether et avons également acquis de l'Ether et du Matic comme forme de paiement pour la vente de certains biens virtuels, ce que nous pourrions continuer à faire à l'avenir«, a déclaré la société.
Reddit se lance dans le monde de l'IA et de la crypto-monnaie alors que l'entreprise cherche à exploiter le marché croissant de ces technologies. Citant les estimations de l'International Data Corporation, Reddit a noté que le marché mondial de l'IA, même sans la Chine et la Russie, devrait atteindre 1 billion de dollars d'ici 2027, avec un taux de croissance annuel composé de 20%.
Cependant, l'enquête de la FTC met en lumière les défis réglementaires auxquels Reddit est confronté alors qu'il cherche à tirer parti du boom de l'IA. Malgré la confiance de l'entreprise selon laquelle elle n'a enfreint aucune loi, Reddit a reconnu que l'enquête pourrait être longue et imprévisible.
»Any regulatory engagement may cause us to incur substantial costs, and it is possible for any regulatory engagement to result in reputational harm or fines, cause us to discontinue or modify our products, services, features, or functionalities, require us to change our policies or practices, divert management and other resources from our business, or otherwise adversely impact our business, results of operations, financial condition, and prospects,« Reddit disclaimed in the filing.