Análisis de datos: los 5 porqués, correlación y causalidad

El análisis de datos es casi una forma de vida. Así, como si fuera un tuit. Frase lapidaria para adelantarte lo que vas a leer en las próximas lineas (y artículos), donde pretendo introducir una metodología básica sobre toma de decisiones de negocio basada en datos llamada los 5 Porqués o Método Mourinho, como la rebautizamos en 3ymedia.

Y digo que es casi una forma de vida porque puede llegar a modelar la manera en la que te enfrentas a cualquier decisión relevante de tu vida. No solo en el trabajo.

Aquella persona que analiza datos (no pensemos solo en el analista como un profesional) siempre debe iniciar su proceso realizando preguntas. Las preguntas son la parte más importante de todo el camino porque siendo el punto de partida, marcan toda la evolución de nuestro análisis.

Y para hacernos las preguntas que nos lleven a las mejores respuestas existe una técnica muy conocida que es la de los «5 Porqués». En su sencillez radica su éxito.

Técnica de análisis de datos de los 5 Porqués

Este sistema consiste en preguntarnos por qué sucede el problema que queremos resolver o el insight que tenemos detectado y con cada respuesta preguntarnos unas cuantas veces más por qué.

Veámoslo con un ejemplo simple como el de un ecommerce en el que no se cierran las ventas de demasiados carritos:

  1. ¿Por qué el usuario no termina la compra?
    Porque abandona el carrito en el paso del checkout donde se desglosan los precios.
  2. ¿Por qué abandona ahí?
    Porque es donde se añaden los impuestos y el precio se incrementa.
  3. ¿Por qué se añaden en esa momento los impuestos y no antes?
    Porque en las fichas de producto hemos indicado que solo se muestre el precio antes de impuestos.
  4. ¿Por qué hacemos eso?
    Porque la mayor parte de nuestros clientes son empresa y se pueden desgravar los impuestos
  5. ¿Por qué esos usuarios no tienen en cuenta que se los desgravan y abandonan?

En este ejemplo, para la última pregunta podría haber 3 respuestas simples, tres soluciones evidentes:

  • Los visitantes no son empresa o autónomos -> El usuario que me está visitando no es mi público objetivo.
  • En la ficha de producto no se indica o no se ve claramente que el precio no incluye impuestos -> Deberíamos indicar algo tipo «iva no inc.».
  • Algún impuesto no está siendo aplicado correctamente -> Revisar la configuración de impuestos en el ecommerce.

Como ves, el recorrido de preguntas es clave. Se indica una media de 5 porqués pero cada caso puede ser distinto. A veces, en los casos más simples, con menos preguntas puede ser suficiente. En otros casos puedes necesitar alguna más.

Pero cuidado, cuanto más tires del hilo, más desviaciones pueden presentarse y mayor probabilidad de error se dará.

Diferencias entre correlación y causalidad

Durante el procedimiento debes evitar, además, confundir la causalidad con la correlación, ya que puede suponer una trampa mortal en nuestro análisis.

Una correlación entre dos variables no implica causalidad. Dos variables pueden crecer (o decrecer o evolucionar de forma inversa) paralelamente y que una no sea efecto de la otra (llamada causa).

Por resumirlo mucho:

  • Correlación es que dos variables evolucionan simultáneamente de forma proporcional.
  • Causalidad es que una variable causa un efecto sobre la otra.

¿Por qué es importante distinguir estos conceptos en la metodología de los 5 Porqués?

Lo entenderás perfectamente con un par de ejemplos.

Causalidad

Imagina que estás andando en una bicicleta sin cambios y tu objetivo es mantener una velocidad constante de 30km/h durante todo el recorrido.

Inicias el viaje llaneando y desarrollando una fuerza de x Newtons con tus piernas para alcanzar esa velocidad de crucero.

De repente comienzas a ascender una pendiente y tus piernas deben desarrollar una mayor fuerza para mantener la misma velocidad. Pongamos 2x Newtons.

Al descender la pendiente sucede justo lo contrario. ½x Newtons son necesarios para mantener la velocidad.

Repasemos los datos:

  • xN -> 30km/h
  • 2xN -> 30km/h
  • ½xN -> 30km/h

Entre la fuerza aplicada y la velocidad obtenida no existe correlación (no varían proporcionalmente), aunque si causalidad (una es efecto de la otra).

Por tanto estos datos pueden ayudarnos a responder al por qué de nuestra pregunta.

Correlación

Para el segundo caso imagina que hemos descubierto que cuantas más gorras vemos en una playa, más ahogamientos hay.

Alguien podría pensar erróneamente que hay un mayor riesgo de ahogarte si llevas una gorra. Eso indicaría causalidad. Pero parece poco probable ¿verdad?

En realidad lo que sucede es que cuando más aprieta el calor y más sol hace, más gente va a la playa, más utiliza gorra y más se baña. Al haber más gente en la playa, hay más ahogados.

El sol y el calor son la causa, las gorras y los ahogamientos solo están correlacionados entre ellos ya que evolucionan de forma proporcional.

¿Por qué es importante ser conscientes de esta diferencia? Pues porque si no ves que se trata tan solo de una correlación, corres el riesgo de tratar de reducir el porcentaje de ahogados prohibiendo el uso de gorras en la playa. Fíjate que en un caso como este incluso ahondarías en el problema.

Aquí podrás ver algunos ejemplos más y casos particulares de estos dos conceptos

Respondiendo a los porqués

El método de los 5 Porqués es tan simple como efectivo. Sin embargo, a menudo las preguntas o sus respuestas no serán tan evidentes. Es posible que tengas que implementar acciones de medición para responder a los porqués, realizar campañas cualitativas o cuantitativas con diferentes herramientas.

Puede que un informe de Google Analytics, un mapa de calor de MS Clarity o el NPS de tu última encuesta no sea más que la respuesta a la tercera pregunta de tu cadena. Parte de proceso, no la respuesta final.

En 3ymedia School tengo publicado un completo curso de Google Analytics 4, muy práctico, que puede acompañarte en estos primeros pasos

A todo esto le dedicaré algunos post en el futuro. De momento me quedo en este primer paso de hacerte las preguntas que definan el problema, los desafíos del negocio o sus objetivos.

Te invito a dejar un comentario para decirme si te ha resultado de interés el post, si te ha servido para reflexionar o incluso si te ha ayudado a descubrir algún insight de tu negocio. Me encantaría que así fuera.

Deja un comentario

La guía para lanzar tu negocio online con éxito

Estoy escribiendo un libro para Anaya sobre la creación de negocios online. ¿Quieres saber cuándo saldrá publicado y cómo está siendo la investigación?

Puedes ganar un libro y una consultoría gratis 😉

👉 ¡Quiero saber más! 👈

Holler Box