Cómo reducir el tráfico directo en GA4

El tráfico directo registrado en GA4 supone una de las decepciones más grandes para los recién llegados a la herramienta. Lo miran pensando que refleja el éxito de sus campañas de branding y lo conocida que es su marca.

Nada más lejos de la realidad.

Al menos hasta que domemos un poco nuestro Google Analytics 4.

El tráfico directo en GA4 se refiere a las sesiones de usuario durante las cuales la fuente del tráfico no puede ser determinada específicamente por Google Analytics. Esto suele suceder cuando la información sobre dicha fuente no está disponible o cuando el usuario accede a tu sitio web directamente, es decir, tecleando la URL en el navegador, utilizando un marcador, o a través de un enlace en un documento sin tracking como un PDF o un documento de Word.

En GA4, este tráfico se agrupa en la categoría «Direct» en los informes de tráfico. Pero podemos decir que lo de tráfico directo es un eufemismo en toda regla.

Las razones comunes por las que el tráfico se registra como directo incluyen:

  1. URLs tecleadas o guardadas en marcadores: Cuando un usuario teclea una dirección web directamente en el navegador o utiliza un marcador para visitar el sitio, generalmente no hay información del referente que pueda recogerse.
  2. Enlaces de fuentes no rastreables: Esto puede suceder cuando se hace clic en enlaces de aplicaciones, documentos (PDFs, documentos de Office), o correos electrónicos donde el rastreo no está habilitado o no se pasa la información de referente.
  3. Enlaces https a http: Si un usuario navega de un sitio seguro (HTTPS) a un sitio no seguro (HTTP), el referente no se transfiere por razones de seguridad, y el tráfico cae en el saco del directo.
  4. Configuraciones de navegador o bloqueadores de anuncios: Algunos navegadores o extensiones (como bloqueadores de anuncios o extensiones de privacidad) pueden bloquear o despojar la información de referente.
  5. Mensajería privada: Enlaces compartidos a través de aplicaciones de mensajería privada como WhatsApp, Facebook Messenger, y mensajes directos en redes sociales.
  6. Aplicaciones móviles: Enlaces que se abren desde aplicaciones móviles (como la de Twitter, Facebook o Instagram) donde el referente no se transmite o se pierde en el proceso.
  7. Etiquetado incompleto o incorrecto: Si las campañas no están correctamente etiquetadas con parámetros UTM o si hay errores en la configuración del etiquetado, puede resultar en tráfico que no se atribuye correctamente y se categoriza como directo. Algo con lo que me he ecnotrado muchas veces son fuentes/medios intercambiados por error.
  8. Redirecciones: A veces, las redirecciones entre dominios pueden eliminar la información del referente, especialmente si no están configuradas correctamente.

Como ves, que el tráfico de GA4 sea asignado como directo no siempre significa que el usuario conoce tu marca o tu URL de memoria. A menudo, es tráfico que no ha sido correctamente atribuido debido a las limitaciones técnicas o configuraciones de privacidad.

Por eso es crucial utilizar un etiquetado y seguimiento adecuado para tus campañas y enlaces, minimizando la cantidad de tráfico que se categoriza incorrectamente como directo.

Para empezar, echemos un vistazo rápido a tu tráfico directo.

Ve a los informes de Adquisición (1) en el Ciclo de vida y abre el reporte de Adquisición de tráfico (2). En la tabla puedes buscar «Direct» (3) para aislar el canal que nos interesa y añadir como dimensión secundaria Fuente/medio de la sesión (4). De esa forma empezarás a ver alguna pista de la naturaleza real del tráfico. Finalmente, ordena la tabla por número de Sesiones (5) para atacar primero las fuentes/medios más relevantes.

Reporte de Adquisición de tráfico de GA4 con los 5 puntos de ajuste para medir el tráfico Direct

Este informe es muy mejorable mediante una Exploración ad hoc pero de momento puede servir para hacerte una idea inicial.

Puede usar este mismo procedimiento para identificar el tráfico Unassigned, a veces confundido con el directo mal asignado.

Mientras que el tráfico «Direct» se refiere específicamente a sesiones donde la fuente de tráfico no se puede determinar, «Unassigned» es un término más amplio usado en GA4 para indicar que cualquier tipo de dato esperado en una dimensión o métrica no está asignado o disponible. En el contexto de las fuentes de tráfico, «Unassigned» puede indicar problemas o limitaciones en la recopilación o asignación de datos de fuente de tráfico más allá de las situaciones típicas del tráfico directo.

Veamos ahora cómo resolver algunos de estos problemas para tomar el control de tu tráfico directo.

Pasa tu sitio a https

Si tu sitio web usa http y recibe un enlace de otro sitio web que a su vez usa https, el navegador no pasará la información del referente debido a protocolos de seguridad. La forma más sencilla de resolver esta cuestión es instalando un certificado de seguridad en tu sitio web. Por ejemplo Let’s Encrypt, que es gratuito en la mayoría de hostings. SiteGround ofrece algunos complementos interesantes para facilitar este proceso.

Esta solución tiene un problema. Todos los enlaces que originalmente apuntaban a la versión http de tu sitio web seguirán haciéndolo si el autor no los cambia. Aunque tu servidor hará una redirección de la versión http a la versión https, la información se habrá perdido ya.

Para resolverlo necesitas pedir al sitio original que actualice su enlace. Este es un problema social, no técnico.

Como imaginarás, cuanto antes migres a https menos problemas de este tipo tendrás.

Mejora tu banner de cookies

Si una visita que entra a tu sitio navega a una segunda página sin aceptar previamente las cookies, se perderán los referentes de la URL original, como los UTM o los identificadores de campaña de Google Ads. Si el usuario acepta las cookies en la segunda o sucesivas páginas, no quedará rastro de ellos en la URL y por tanto serán invisibles para la analítica. Es una limitación del propio sistema.

Esto sucede a menudo con banner de cookies poco intrusivos que permiten navegar cómodamente sin ser aceptados o rechazados.

La única solución a esta cuestión es diseñar un banner lo suficientemente molesto como para que el usuario se vea empujado a interactuar con él en la página de aterrizaje.

Corrige o añade tus UTM

Mucho del tráfico que se va a directo suele provenir de visitas que llegan a través de enlaces con UTMs mal construidas o simplemente sin ellas.

Vamos con las primeras.

UTMs con errores

Si creas una exploración con todas las sesiones de tu sitio y añades un filtro para que solo te muestre el tráfico directo y otro para que solo muestre aquellas ubicaciones de página que contengan la cadena «utm», verás todo un rosario de urls con algún problema en su construcción.

A menudo son errores de tipeo, parámetros intercambiados, utms que no existen y cosas así. Asegúrate que los parámetros de las urls siempre empiezan por «?», se separan por «&» y sus valores son utm_medium, utm_source y/o utm_campaign.

En realidad existen algunos parámetros UTM más (de hecho son muy interesantes los nuevos de GA4) pero estos son los más habituales en la asignación de canales de tráfico.

El mejor consejo para evitar errores en el uso de UTMs es organizarlos en una hoja de cálculo y usar así siempre las mismas estructuras y definiciones. En este vídeo (min 37′) puedes ver cómo uso yo una de esas hojas de cálculo donde he integrado un constructor de UTMs para minimizar los errores.

Sesiones sin referrer ni UTMs

Respecto a trafico del que no se recoge el referente y que puedes rescatar añadiendo UTMs al enlace original, los sospechosos más habituales son:

  • Códigos QR (los propios generadores de QR suelen incluir la posibilidad de añadir UTMs).
  • Enlaces en documentos pdf o de procesador de textos.
  • Enlaces de afiliados.
  • Acortadores de enlaces (la mayoría permiten construir los UTM en el propio acortador).
Gestor de UTMs de Bit.ly
Función de adición de parámetros UTM en el acortador de enlaces de bit.ly

Tráfico de bots

No podemos evitarlo (ni queremos en muchos casos) pero nuestras webs están siendo continuamente escaneadas por bots de todo tipo: rastreadores, spammers, DDoS, redes sociales…

El tráfico de este tipo no es real en el sentido de que no representa a un usuario y GA4 hace lo que puede por filtrarlo. Sin embrago no siempre es suficiente.

Si tienes un problema de este tipo la mejor manera de ponerle un parche es usar una CDN. LAs más conocidas suelen tener filtros avanzados y más actualizados con IPs sospechosas que los de Google. Además estudian el comportamiento de los bots para identificarlos y bloquearlos.

Por último, integran un firewall, lo que supone una barrera de seguridad muy recomendable ante potenciales ataques a tu sitio. Puede que no los veas pero, créeme, los estás sufriendo.

URLs sin el script de GA4

Es posible que algunas de las URLs de tu sitio no carguen el script de GA4 (o el de GTM). Puede que porque no necesites medirlas, porque se trate de una intranet o simplemente porque hayas cometido un error.

Todo el tráfico que entre por ellas y derive a otra página que SÍ tenga el código de seguimiento, perderá el referrer original y conservará el de la página de entrada. Es decir… ¡tu propio sitio!

Para evitarlo necesitas identificar esas páginas de entrada sin el código de GA4 y añadírselo, evitar que entre tráfico por ellas o buscar la manera de que conserven sus utms en los enlaces al resto de páginas de tu sitio (aquí hay una buena receta de GTM para próximos posts, ummm)

Pérdida de señales en redirecciones

Si has realizado alguna migración de dominio, de gestor de contenidos, reorganizado la estructura de URLs de tu sitio o incluso poniendo en marcha test AB, es posible que estés gestionando redirecciones de algún tipo en tu hosting. Pueden ser 301, 302 pero también redirecciones por JavaScript. Estas últimas siempre pierden el referrer.

El problema aquí es que las directivas 301 o 302 pueden provocar que la información de referencia o los parámetros UTM se pierdan. También es posible que los scripts o etiquetas de seguimiento se rterasen en su ejecución que GA4 no capture esa información.

Haz alguna prueba de depuración para ver si es el caso. Tendrás que hablar con tu administrador de sistemas o tu desarrollador para resolverlo.

Conclusiones

Como puedes ver hay varios aspectos que debes revisar para tomar el control de tu tráfico directo. La tarea principal es montarte una exploración en GA4 que desglose todo lo que se está atribuyendo al canal Direct y a partir de ahí ir tirando del hilo con dimensiones como:

  • Fuente/medio de la sesión
  • Campaña de la sesión
  • Página de destino y cadena de consulta (los parámetros UTM van en la consulta)
  • URL referente de la página
  • Categoría de dispositivo (para distinguir todo lo relativo a apps y tráfico móvil)

Y todo lo que se te ocurra para investigar la naturaleza del tráfico. Empieza siempre por aquel conjunto de sesiones que cumplan un mismo patrón y que represente un mayor volumen, para maximizar el rendimiento de tu esfuerzo.

Finalmente, asume que nunca vas a poder filtrarlo absolutamente todo. Hay una parte que sencillamente no podemos discernir y que se localiza en varios de los puntos que comentaba al principio del post. Es lo que hay.

Deja un comentario

Información sobre protección de datos

  • Responsable: Pablo Moratinos
  • Fin del tratamiento: Controlar el spam, gestión de comentarios
  • Legitimación: Tu consentimiento
  • Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  • Derechos: Acceso, rectificación, portabilidad, olvido.
  • Contacto: contacto@pablomoratinos.es.
  • Información adicional: Más información en mi política de privacidad.