¿Por qué debería anonimizar mi IP en Google Analytics?
En mayo del 2018 el Reglamento General de Protección de Datos de la Unión Europea (GDPR) entró en vigor con el objetivo de mejorar la protección de datos personales. Es un reglamento por el que el Parlamento Europeo, el Consejo de la Unión Europea y la Comisión Europea tienen la intención de reforzar y unificar la protección de datos para todos los individuos dentro de la Unión Europea (UE). También se ocupa de la exportación de datos personales fuera de la UE.
Desde esa fecha todos los que estamos metidos en el mundo del marketing y la analítica digital hemos hablado en múltiples ocasiones de dicho reglamento y de todo lo que implica: cookies, consentimiento del usuario, CMPs, consent mode, cookie-less o el mundo sin cookies. Un amplio conjunto de términos y funcionalidades que hemos tenido que ir incorporando en el día a día.
La Unión Europea busca dar a las personas más control sobre cómo se utilizan sus datos personales. Todos sabemos que nuestro DNI es un dato personal, pero hay otros datos que pueden no estar tan claros. Entre ellos está la IP, que se considera como un dato de tipo PII (Personally Identifiable Information) en Europa. Se considera dato de tipo PII a cualquier dato que, en un principio, puede parecer inofensivo, ya que de forma aislada no identifica a una persona. Sin embargo, todos ellos unidos sí que podrían identificar quién es esa persona. Estos son los considerados PII.
A partir de mayo del 2010 Google incorpora una nueva funcionalidad en Google Analytics que permite anonimizar la IP del usuario para ayudarnos a cumplir con la GDPR. Aunque las IPs no son visibles en Google Analytics, sí que se almacenan, para permitir por ejemplo los informes de geolocalización y también para aplicar filtros en las vistas usando dichas IPs.
¿Cómo funciona la anonimización de las IPs en Google Analytics?
Cuando se solicita a Google Analytics que se anonimicen las IPs, la plataforma realiza dicha anonimización lo antes posible.
¿Y cómo lo hace? Google Analytics convierte en un cero el último octeto de la dirección IP (y los últimos 80 bits si la dirección es IPv6). Esta conversión se hace antes de que la IP se guarde en disco. Por tanto, la dirección completa de IP no llega a ser guardada nunca en disco, solo se guardará la IP ya anonimizada.
En el caso de GA4 la anonimización está habilitada por defecto, lo que significa que las IPs siempre se guardan de forma anonimizada. Pero en Universal esto no es así. Por defecto, se almacena la IP completa y es necesario aplicar una configuración previa al envío del dato para que Google Analytics la anonimice.
¿Qué tengo que hacer para anonimizar las IPs en Universal?
Para anonimizar la IP, es necesario aplicar un ajuste de configuración a nivel de implementación que puede variar en función de cómo se haya hecho la implementación de la analítica.
- Si se está usando la librería Analytics.js, es necesario inicializar el campo ‘anonymizeIp’ con el valor ‘true’.
- Si tienes tag manager y es GTM, sería tan sencillo como incluirlo en la configuración del tag o si usas una variable para configurar todo el mapeo, también puedes hacerlo en dicha variable:
-
- Por código es necesario incluir la siguiente instrucción: ga('set', 'anonymizeIp', true);
- Si estás usando la librería gtag.js, tienes que hacerlo de la forma siguiente:
gtag('config', 'GA_TRACKING_ID', { 'anonymize_ip': true });
Cuando se aplica dicho ajuste, en la petición enviada a Google Analytics, se enviará toda la información que se quiera recoger y un parámetro adicional ‘aip’ cuyo valor será ‘1’. Esto será lo que Google Analytics revise para saber si tiene que anonimizar la IP o no.
Y en APPs, ¿qué es necesario implementar?
La forma de anonimizar las IPs variará en función del SDK que se esté usando:
- Firebase Analytics: almacena todas las IPs incondicionalmente anonimizadas. Lo hace por defecto sin necesidad de aplicar ninguna configuración o desarrollo adicional.
- SDK de iOS: debería usarse la función siguiente:
[tracker set:kGAIAnonymizeIp value:@"1"];
*Más información aquí.
- SDK de Android: hay que aplicar la siguiente configuración en el fichero de configuración:
<string name="ga_anonymizeIp">true</string>
También es posible hacerlo usando la función ‘setAnonymizeIpmethod’:
mTracker.setAnonymizeIp(true)
- Más información aquí.
¿Tiene algún impacto si anonimizo las IPs?
- La respuesta es sí. El principal impacto de la anonimización es la geolocalización. Google Analytics usa las IPs para los informes de geolocalización, y si estas IPs están anonimizadas, perderá detalle en la geolocalización, pudiendo fallar a nivel de ciudad (a nivel de país y de continente no debería afectar).
- En el caso de GA4 la geolocalización funciona de la misma forma que en Universal. Por tanto, deberíamos tener en cuenta que la información de la ciudad en los informes puede no ser tan precisa como lo es en Universal sin anonimizar las Ips.
- En Universal será necesario revisar cualquier filtro de IP en caso de estar usándose en alguna vista, ya que es muy probable que puedan dejar de funcionar.
- En el caso de GA4 esto no supone un problema, ya que, si existen filtros de IP, se revisa la IP antes de anonimizarla, y si cumple la condición del filtro, entonces el dato no se guardará. Si no lo cumple, la IP se anonimiza y la información quedará guardada para su posterior explotación.
En GA4 los filtros están pensados para excluir tráfico interno y tráfico de los desarrolladores. (¡Ojo!, también hay filtros de ‘solo incluir’), y se pueden incluir hasta 10 filtros por propiedad. Por tanto, esto cambia un poco con los filtros que usamos a nivel de vista en Universal.
En GA4 se excluye automáticamente el tráfico procedente de robots y arañas. De este modo, se asegura que los datos de Analytics, en la medida de lo posible, no incluyan eventos de robots conocidos. No es posible deshabilitar esto, ni comprobar qué volumen de tráfico se ha excluido.
Si necesitas excluir datos de bots que no estén siendo filtrados y cuya IP conozcas, quizás la opción más viable sería usar un custom parameter para “etiquetar” el hit como bot y poder excluir estos hits con ‘comparisons’ (equivalente a segmentos en Universal).
¿Estáis anonimizando vuestras IPs? Si no es así, aún estáis a tiempo de hacerlo, y de todas formas, como GA4 ya ha venido para quedarse, será algo que ya tendremos todos sí o sí en nuestras soluciones.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
*Fuentes bibliográficas
Google Analytics > Medición > Universal Analytics (gtag.js)
Google Analytics > Medición > iOS
Google Analytics > Medición > Android
Support Google (Analytics Help) - Reporting > Filters and comparisons > [GA4] Data filters
Support Google (Analytics Help) - Set up Analytics > [GA4] Filter out internal traffic