Usamos cookies. Tienes opciones. Las cookies nos ayudan a mantener el sitio funcionando sin problemas e informar sobre nuestra publicidad, pero si deseas realizar ajustes, puedes visitar nuestro Aviso de cookies para más información.
Utilizamos cookies propias y de terceros para analizar su actividad en el sitio web con el objetivo de enviarle publicidad personalizada y mejorar el funcionamiento de la web. Puedes aceptar todas las cookies pulsando el botón “ACEPTAR” o seleccionarlas en función de su funcionalidad pulsando el botón “AJUSTES”.
×

Regresiones predictivas en Adobe Analytics: aprende cómo anticipar tus datos

Adobe Analytics, una de las herramientas analíticas más extendidas del mercado, es conocida por su gran versatilidad para explotar los datos históricos de nuestros clientes. Las innumerables virtudes que poseen algunas de sus funcionalidades - como Workspace, Calculated Métrics Builder o el Segment Builder - han favorecido que su competencia apunte a Adobe como modelo a seguir.

Sin embargo, ¿es posible anticiparnos a nuestros datos históricos y prever resultados futuros? A simple vista, parece una quimera, pero si nos sumergimos en su compositor de métricas calculadas encontraremos múltiples posibilidades que enriquecerán nuestro análisis.

Hoy os voy a presentar cómo elaborar regresiones lineales en la herramienta de una forma relativamente sencilla.

Empecemos por lo básico: regresiones lineales simples

Para no complejizar en exceso el post, vamos a centrarnos en las regresiones lineales. No voy a ahondar excesivamente en detalles a nivel estadístico, por lo que solo ofreceré unas pinceladas para contextualizar el proceso.

La Fórmula que replicaremos en Adobe es la siguiente: Y = aX + b

‘Y’ representará el valor que pretendemos prever (variable dependiente), mientras que ‘X’ será el dato temporal (variable independiente). Por otro lado, ‘A’ será el slope o pendiente y ‘b’ el intercepto.

El objetivo con la métrica que vamos a componer es disponer de una función que se aproxime lo más posible a nuestros datos reales a lo largo del tiempo y nos revele cuál habría sido la evolución lógica y lineal de nuestros resultados.

El primer inconveniente que tendremos que solventar será la utilización del tiempo como variable independiente (X), pues el tiempo no es una métrica. No obstante, podremos salvar este paso utilizando la función acumulativa, la cual funcionará contando el número de filas disponibles.

La idea consiste en asignar a cada fila un número consecutivo, el cual corresponda (en el ejemplo que presentaré a continuación) con el primer, segundo, tercer, etc. mes.

regresiones-predictivas-3

Una vez hemos aprendido cómo generar nuestra variable independiente, podemos construir una métrica calculada que arroje el valor ‘Y’ predicho de una regresión lineal. ¡Ojo! Este ejercicio solo funcionará sobre nuestro histórico, pero ya nos puede servir para realizar comparativas simples entre los resultados esperados estadísticamente y los reales.

Para el siguiente ejemplo emplearé la métrica Visitas como dependiente (valor ‘Y’), además de lo más importante: la función ‘Linear Regression: Predicted Y’ (disponible en el compositor de métricas calculadas). La construcción sería:

regresiones-predictivas-4

Pese a su utilidad, esta métrica calculada presenta una carencia notable: si pretendemos añadir alguna fecha posterior o futura, esos días son incluidos también en el cálculo dejando inoperativo nuestro análisis. Esta falencia también ocurrirá si ampliamos el periodo hasta el día actual.

Analítica predictiva con funciones del Calculated Metrics Builder

Para anticipar nuestros datos en base a nuestro histórico debemos servirnos de otras funciones disponibles en la herramienta, simulando mediante su uso la fórmula con la que arrancamos el artículo: Y = aX + b

Para ello, nos valdremos de ‘Linear Regression Slope’ (‘a’ en la fórmula) y ‘Linear Regression Intercept’ (‘b’). Recordemos, además, que para la X utilizaremos la función acumulativa.

De este modo, la “traducción” de dicha fórmula a nuestro ejemplo sería de este modo:

Visitas futuras = Slope x Incremental + Intercept. Llevado a una construcción típica en silos de Adobe, ésta sería la solución:

regresiones-predictivas-5

Vamos a completar la estructura que hemos presentado en la anterior captura con nuestras variables X (Incremental) e Y (visitas). Simplemente incluyéndolas donde nos marcan las funciones de Adobe.

Tras la construcción de esta métrica nos enfrentamos al mismo problema que en las regresiones lineales simples: si incluimos fechas futuras (no de nuestro histórico) el resultado no es correcto.

regresiones-predictivas-6

¿Qué ha provocado este error? La presencia de valores ‘0’ en nuestras visitas. Al incluir el mes de Agosto (este artículo data de inicios de Julio 2021) Adobe está contemplando ese resultado ‘0’ en el Slope (pendiente) e Intercept. Por ende, requerimos su exclusión para que nuestra métrica predictiva funcione.

Incremental con datos: excluimos datos a cero

Para sortear la problemática que acabamos de mencionar necesitamos generar un incremental que no contabilice los datos ‘0’. En este caso, interviene otra de las funciones avanzadas del Calculated Metrics de Adobe: la función ‘IF’.

regresiones-predictivas-7

¿Cuál es la lógica de este incremental? La captura nos transmite: si las visitas existen acumula las filas, pero si las visitas no existen (son iguales a 0) devuelve como resultado un ‘0’ al acumulativo de la fila.

En la siguiente tabla se puede observar el resultado:

regresiones-predictivas-8

Observamos que en las filas donde el resultado de visitas es 0, el incremental con datos arroja como valor un 0. Además, solamente está acumulando las filas cuando existe tráfico en el site.

Por otro lado, una buena praxis también pasa por contabilizar solamente los datos de meses pasados (en nuestro ejemplo, hasta Junio), ya que no queremos que el dato parcial del mes en curso afecte a nuestra previsión. Así pues, vamos a excluir el dato del mes actual en la composición de la métrica.

(Hemos elegido una exclusión del mes en curso porque pretendemos extraer datos predictivos mensuales. Si cambiamos la dimensión temporal por ‘Días’ tendremos que excluir solamente el día actual).

Esta exclusión solamente precisará la generación de un segmento donde debemos insertar el rango temporal correspondiente: ‘This month’ si queremos calcular el dato predictivo en próximos meses, ‘This week’ si deseamos anticiparnos a las siguientes semanas, etc.

Este segmento formará parte de toda la métrica predictiva calculada:

regresiones-predictivas-9

Asimismo, me gustaría puntualizar que este proceso será más efectivo cuanto mayor sea el histórico con el que trabajemos. En función de esta circunstancia, será recomendable construir la métrica para predecir meses, semanas o días.

Composición final de nuestra métrica predictiva

Una vez hemos desarrollado el incremental con datos, junto con el segmento exclusivo, debemos aplicarlos a la métrica calculada.

En primer lugar, voy a mostrar de forma esquemática la estructura, cuya visualización facilitará la comprensión del proceso:

regresiones-predictivas-10

Finalmente, la métrica predictiva completa tendría el siguiente aspecto:

regresiones-predictivas-11

Si llevamos la métrica final a una tabla en Workspace observamos que los valores correspondientes al histórico coinciden exactamente con los ofrecidos por la Regresión lineal simple. Además, esta métrica predictiva nos anticipa cuáles son las visitas esperadas durante los meses de agosto y septiembre (siempre teniendo en cuenta una evolución lineal de los datos).

Como refleja la imagen, el segmento de exclusión del mes en curso tiene que aplicarse a toda la tabla para que la predicción se amolde al modelo estadístico, obviando el tráfico recibido en el mes de julio.

A continuación, os presento estas dos tablas donde se puede comparar la equidad de los datos históricos (seis primeros meses del año) entre la regresión simple y la predictiva, así como la previsión de visitas para esta última. Comprobamos cómo se ignoran tanto el mes actual como los futuros en el cálculo:

regresiones-predictivas-12

Gracias a este procedimiento podremos estimar datos como las ventas para este año - considerando las cifras recogidas con anterioridad - o prever tendencias de tráfico aplicando cualquier filtro (segmento) a la métrica en WS. Las posibilidades son infinitas si elegimos los componentes adecuados.

Por último, cerramos este post con una representación gráfica final de todo el proceso que hemos explicado a lo largo del texto:

regresiones-predictivas-13

Adobe Analytics, como cualquier herramienta, cuenta con sus limitaciones, aunque muchas veces somos nosotros, los analistas, quienes desconocemos qué esconden todas las funcionalidades disponibles.

Las métricas avanzadas con funciones son un ejemplo de cómo enriquecer nuestros análisis con información valiosa de un modo relativamente sencillo. Solo necesitamos “bucear” en ellas e investigar todas las posibilidades innovadoras que nos brindan. ¿Te atreves a generar tus propias métricas predictivas?

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Fuentes bibliográficas:

Linkedin Pulse

Predictive Regression Analysis – Statistics in Adobe Analytics | Autor: Frederik Werner

Ayuda virtual de Adobe Analytics

Pexels

En nuestra compañía