Este fin de semana, Google ha introducido un pequeño pero importante cambio en su política de privacidad que le permite reclamar todo lo que publiques en internet para utilizarlo en el entrenamiento de sus modelos de inteligencia artificial. La redacción original de la sección de su política de privacidad afirmaba que los datos públicos se utilizarían con fines comerciales, de investigación y para mejorar los servicios de Google Translate.
Ahora, sin embargo, la sección se ha actualizado para que diga lo siguiente:
Google utiliza la información para mejorar nuestros servicios y desarrollar nuevos productos, funciones y tecnologías que beneficien a nuestros usuarios y al público en general. Por ejemplo, utilizamos información disponible públicamente para ayudar a entrenar los modelos de IA de Google y crear productos y funciones como Google Translate, Bard y las capacidades de IA en la nube.
Más abajo, en el texto de la política, Google contiene otra sección que ejemplifica las áreas de información «públicamente disponible» que pretenden extraer:
Por ejemplo, podemos recopilar información disponible públicamente en internet o procedente de otras fuentes públicas para ayudar a entrenar los modelos de IA de Google y crear productos y funciones como Google Translate, Bard y las funciones de IA en la nube. O bien, si la información de su empresa aparece en una web, podemos indexarla y mostrarla en los servicios de Google.
El nuevo cambio ya ha entrado en vigor el 1 de julio de 2023. Dado el alcance y la longevidad de las cuentas de Google (pensad en el tiempo que algunas personas han dispuesto de cuentas de Gmail y YouTube), este cambio incluye ahora formalmente una cantidad increíblemente extensa de datos de interacción pública que se prolongan durante décadas.
Lo que aún se desconoce es si las personas que se han comprometido a «desGooglear» su vida online podrían quedar atrapadas en la red de rastreo de datos de Google, independientemente de si han aceptado o no este cambio de política, o si basta con haber tenido algún contacto con Google a lo largo de los años. El scraping público a gran escala ya ha estado ocurriendo independientemente del consentimiento individual con otros grandes modelos de formación lingüística, como ChatGPT de OpenAI.
Lo idóneo es que este cambio solo afecte a quienes posean cuentas activas en diversos servicios de Google. Un punto importante a destacar es que Google no menciona nada sobre el uso de datos privados, y dichos datos compartidos con Google están aparentemente a salvo de ser ingeridos en la máquina de IA. Por el momento.
Vía: TechPowerUp