Umbral de GA4: Cómo evitarlo

La aplicación del umbral es un concepto que se utiliza en Google Analytics 4 para describir el proceso de ocultar o agrupar datos que podrían permitirte identificar a ciertos visitantes individuales de tu sitio web.

Aunque parece algo útil a nivel de privacidad genera ciertos inconvenientes para el analista de datos. En las próximas lineas describiré en qué consiste el umbral de GA4 y cómo evitarlo.

¿Qué es el umbral en Google Analytics 4?

El umbral es una medida de privacidad que Google aplica a los datos de Google Analytics 4 para proteger la identidad de los usuarios individuales. El umbral se aplica cuando el número de usuarios que cumplen ciertos criterios es inferior a un nivel determinado.

Por ejemplo, si hay una cantidad muy pequeña de usuarios que han visitado una página específica o que han disparado un evento, GA4 podría ocultar esos datos para evitar que se puedan identificar.

El umbral se aplica a:

  • los informes estándar
  • las exploraciones o informes personalizados.
  • los datos que se exportan a BigQuery
  • las audiencias
  • los análisis de atribución

¿Qué NO es el umbral de GA4?

El umbral de datos en Google Analytics 4 no es el muestreo o sampling. Son cosas diferentes. El umbral se aplica cuando su propiedad GA4 cumple con estas condiciones:

  • Has activado Google Signals.
  • Tu identidad para informes está ajustada como Mezclada u Observada.
  • El informe que estás consultando contiene filas con números bajos de usuario/evento/sesión.

Ninguno de estos aspectos tiene relación con el muestreo de datos. Muy al contrario, el muestreo se produce cuando tenemos un volumen muy elevado de los mismos y GA prefiere reducir el número de eventos que analiza para gestionar mejor sus recursos.

La confusión probablemente se produzca porque ambas situaciones se informan de forma conjunta en la misma tarjeta.

¿En qué me afecta la aplicación del umbral de Google Analytics 4?

La aplicación del umbral puede afectar a la precisión y al detalle de tus informes ya que provoca cierta pérdida de información importante sobre el comportamiento de tus usuarios. También puede dificultar el análisis y la toma de decisiones. Particularmente si estás usando embudos de conversión con valores pequeño en las partes inferiores del funnel.

Si tienes un gran volumen de datos o muchos usuarios puede que el umbral te pase más desapercibido. Pero si tienes un sitio web pequeño o muy segmentado, es posible que veas (o mejor dicho que no veas) que muchos datos quedan ocultos tras la protección del umbral.

¿Cómo sé que se está aplicando el umbral?

Si ves un icono como el de la siguiente captura de pantalla en tus informes de Google Analytics 4, significa que algunos de tus datos se han ocultado o agrupado debido al umbral. La advertencia suele aparecer en la parte superior del informe, junto al título de la tarjeta, indicándote así qué dimensiones o métricas se han visto afectadas.

Cuando veas que se está aplicando el umbral en un informe donde necesites mayor precisión en el análisis, puede tratar de minimizar su impacto así:

  • Cambia el período del informe para incluir más datos y aumentar el número de usuarios por encima del umbral.
  • Cambia las dimensiones o métricas del informe por otras más generales o comunes que no se vean afectadas por la limitación.
  • Crea un nuevo informe personalizado con menos dimensiones o métricas que puedan causar la limitación.
  • Utiliza BigQuery para acceder a los datos sin procesar y realizar consultas personalizadas sin limitación.

¿Cómo elimino el umbral en Google Analytics 4?

Aunque no tenemos una forma de anularlo por completo porque es una política propia de GA4 respecto a la privacidad, hay algunas cosas que puedes hacer para reducir el impacto de la aplicación del umbral:

  • Evita crear segmentos o filtros demasiado específicos que puedan reducir el número de usuarios por debajo del umbral.
  • Evita utilizar dimensiones o métricas personalizadas que puedan contener información sensible o identificable sobre los usuarios.
  • Evita utilizar eventos o parámetros poco comunes que puedan tener pocos usuarios asociados.
  • Utiliza los informes agregados siempre que sea posible, en lugar de los informes desglosados por dimensiones o métricas individuales.

Como ves, estos consejos (que son los oficiales de Google) son una mierda, porque precisamente estás usando una herramienta tan poderosa como GA4 para poder bajar al nivel de detalle y no tener que quedarte con información demasiado general.

Si ninguna de estas opciones es factible o, sencillamente, no resuelven el problema aún te quedan un par de estrategias más para minimizar el impacto del umbral en tus informes.

Desactiva Google Signals

Google Signals es una herramienta de Google Analytics que recopila datos de los usuarios de tu sitio web, para poder identificarlos desde múltiples dispositivos o plataformas. Algunos de estos datos son de tipo demográfico pero la utilidad principal para GA4 es poder tener una visión más precisa de la actividad de tus visitas durante todos los puntos de contacto. Piensa en un usuario que accede a tu web indistintamente desde el móvil o el ordenador, por ejemplo.

Google Signals incorpora detalles como el género, edad e intereses de la visita ya que se trata de datos muy útiles para la creación de audiencias publicitarias que puede usar en Google Ads. Estos datos están a tu disposición en los informes de Usuario > Grupos demográficos.

Signals es uno de los responsables de la aplicación del umbral, por lo que si la pérdida de los detalles demográficos que he comentado no es relevante para tu análisis, o no estás usando audiencias de remarketing para Google Ads, puedes desactivarlo sin mayor problema.

Para ello ve a Administrar > Ajustes de datos > Recogida de datos y apaga el interruptor para dejarlo como en esta imagen:

Este ajuste no tiene carácter retroactivo. Al modificarlo solo afectará a los datos recogidos a partir de este momento. Así que no sirve como solución rápida.

Quiero aclarar que este cambio tiene consecuencias. Los datos demográficos como género, intereses y edad dejan de recogerse e impedirá la creación de audiencias de remarketing para Google Ads. Necesitarás una etiqueta de remarketing de Gogole Ads básica. Tenlo en cuenta si estos aspectos son importantes para tu actividad.

Cambia la Identidad para los informes

Otro ajuste que puedes modificar para reducir el riesgo de que Google te aplique umbral es el de Administrar > Identidad para los informes y cambiarlo a Basado en el dispositivo.

La identidad de informes basada en dispositivos es la más básica. Utilizará solo el ID del dispositivo (también conocido como cookie de origen). Si el mismo usuario usa varios navegadores/dispositivos, GA los tratará como usuarios separados.

Observado es un poco más avanzado. Utiliza datos de las cookies, datos de Google Signals y el user_id. Estas tecnologías ayudan a Analytics a deduplicar usuarios y comprender que una persona que usa varios dispositivos podría seguir siendo la misma persona.

Mezclado es el método más avanzado. Incluye todos los métodos de identidad anteriores, además utiliza el aprendizaje automático para llenar los vacíos y modelar datos. Aunque puedes activarlo de forma general, la modelización de datos no estará disponible hasta que implementes el modo de consentimiento de Google.

Si no ves alguna de las opciones de la captura de pantalla, puede estar oculta detrás de un enlace Mostrar todos.

Ahora la identificación de usuarios será mucho menos precisa, notarás que suben sus métricas. Y esto es normal porque pasarás a distinguir a tus visitas simplemente por las cookies (ID de dispositivo). Un usuario desde móvil, tablet y ordenador se contabilizará como tres usuarios distintos. Perderás la capacidad de distinguirlos por user_id, Google Signals o mediante el modelado. Pero a cambio recuperarás detalles en algunas métricas y dimensiones que habían quedado ocultos tras el umbral.

Este ajuste sí tiene un carácter retroactivo y puedes ver su impacto en cuanto lo cambies. De hecho, puedes modificar el ajuste, ver el informe y volver a cambiarlo para dejarlo como estaba, si lo prefieres.

Conclusión

Como ves, no hay una solución mágica para eliminar de un plumazo el umbral. Sin embargo, siempre que estés dispuesto a sacrificar cierta precisión y detalle en la identificación de usuarios, podrás evitar parte de su impacto.

Los cambios que apliques pueden ser temporales, como por ejemplo para poder acceder a información de un experimento o de un análisis de un evento puntual, pero valora siempre las consecuencias que tiene desactivar Google Signals o modificar la identidad para los informes.

Espero que con estos consejos seas capaz de tomar el control de la aplicación del umbral en GA4.

4 comentarios en «Umbral de GA4: Cómo evitarlo»

  1. GA4 es una mierda y bien gorda.
    Tuve un tiempo las dos versiones, mientras en la antigua veía unas visitas acordes con search console, según GA4 recibía un 95% de visitantes…
    No sé porque diablos ocurre esto pero me estoy planteando dejar de usar analytics.
    La versión anterior ya tenía sus limitaciones, pero lo de esta es horrible

    Responder
  2. Hola, Alan. Hay mucha gente disgustada con los resultados de GA4 y lo entiendo perfectamente porque hay mucho mejorable. Pero personalmente no conozco una herramienta mejor por ese precio 🤷‍♂️ Por otra parte, es natural esa discrepancia que indicas, ya que Search Console no ofrece información de usuarios, sino de clics, que tampoco son exactamente entradas al sitio. Por tanto es natural que no coincida con la métrica de usuarios de GA4.

    Responder
  3. Yo tengo un problema que no puedo ver ni el sexo, ni las edades de los usuarios y eso que tengo casi 100mil visitas los últimos 3 meses, si bien no es un publico descomunal me parece lo suficientemente grande para ver estos datos demográficos pero Google me lo siguen negando entiendo por aplicación del umbral sinceramente es ridículo no puedo aplicar segmentación para publicidad porque GA4 no me arroja datos relevantes

    Responder

Deja un comentario