Google modifie sa politique de confidentialité : utilisation de données publiques pour entraîner ses modèles d'IA

Google a mis à jour sa politique de confidentialité pour préciser qu'il peut utiliser des données publiquement disponibles pour aider à entraîner ses modèles d'IA. Le géant de la technologie a modifié le libellé de sa politique au cours du week-end et a remplacé "modèles d'IA" par "modèles de langage". Il a également déclaré qu'il pourrait utiliser des informations publiquement disponibles pour construire non seulement des fonctionnalités, mais aussi des produits complets comme "Google Translate, Bard, et les capacités de Cloud AI". En mettant à jour sa politique, il informe les gens et clarifie que tout ce qu'ils publient publiquement en ligne pourrait être utilisé pour entraîner Bard, ses futures versions et tout autre produit d'IA générative que Google développe.

Changements dans la politique de confidentialité de Google

Voici une copie de la partie pertinente de la politique de confidentialité de Google :

Des critiques ont été émises concernant l'utilisation par les entreprises d'informations postées en ligne pour entraîner leurs grands modèles de langage pour une utilisation en IA générative. Récemment, une action en justice proposée a été déposée contre OpenAI, l'accusant de "gratter" des "quantités massives de données personnelles sur Internet", y compris des "informations privées volées", pour entraîner ses modèles GPT sans consentement préalable. Comme le note Search Engine Journal, nous verrons probablement beaucoup de poursuites similaires à l'avenir alors que de plus en plus d'entreprises développent leurs propres produits d'IA générative.

Réactions des propriétaires de sites web

Les propriétaires de sites web qui pourraient être considérés comme des places publiques à l'ère numérique ont également pris des mesures pour prévenir ou profiter de l'essor de l'IA générative. Reddit a commencé à facturer l'accès à son API, ce qui a conduit à la fermeture de clients tiers au cours du week-end. Pendant ce temps, Twitter a mis une restriction sur le nombre de tweets qu'un utilisateur voit par jour pour "faire face à des niveaux extrêmes de grattage de données [et] de manipulation du système".