Errores comunes en Power BI: Modelo de datos

Data Governance

,

Pensamiento de liderazgo

Errores comunes en Power BI: Modelo de datos

Juan Martos | jul 17, 2019

Desde los principios del "Analytics" se ha tenido en cuenta la separación de procesos en distintas aplicaciones y en distintos perfiles y, más o menos, en la mayoría de los casos hemos salido airosos.

Estos procesos se han ido manteniendo pero cada vez se intenta, y se fracasa en la mayoría de los casos, acercar más al lado del usuario final algunos procesos que no entienden y, aunque intentemos aportar algo de conocimiento, la falta de experiencia hace que fracasen y que retornen a TI en busca de ayuda. Pero en este camino a lo mejor hemos perdido a un "científico de datos" que nos aportaría mucho valor a la empresa.

A ninguna empresa se le ocurriría dejar en manos de una persona que sepa manejar un programa de diseño 3D, pero sin conocimientos de ingeniería, la construcción de un pieza clave de un motor de alta competición. Lo mismo tenemos que pensar en el caso del Analytics: cada uno tiene que realizar la tarea que conoce para llegar a un resultado óptimo.

Una vez entrado en contexto voy a desarrollar el primer error común: la generación de modelos de datos, en este caso en Power BI, pero que también sucede en otras herramientas de Analytics o Reporting.

Y sí, relacionar dos tablas es crear un modelo de datos. Sencillo, pero lo es. Bueno o no, porque a un usuario hay que explicarle qué es una relación y aquí empieza lo serio.

Simulación de una llamada a TI:

  • Usuario (U): ¡Hola!
  • TI (TI): ¡Buenas tardes!
  • U: Sí, mira, es que tengo aquí un informe de esos vuestros y, como me dijisteis el otro día que podía "enchufarle" una Excel, lo he hecho pero no puedo poner en un gráfico las ventas y mis datos "cocinados".
  • TI: Si está bien, has relacionado las tablas del modelo original y la nueva que se ha creado al importar tu Excel.
  • U: Pues no me ha dicho nada Power BI!!!
  • TI: Vale, antes de seguir necesito que me respondas a unas cuestiones:
    • ¿Sabes cuál es la primary key de las tablas a relacionar?
    • ¿La relación que quieres hacer es 1 a 1, 1 a N o N a 1?
    • ¿Es de derecha a izquierda o de izquierda a derecha?
  • U:!!!! Mira, mejor me acerco y lo hacemos juntos.
  • TI: Ok. ¡Cuando quieras!

Aquí no termina la historia. A la semana siguiente el usuario se presenta directamente con el ordenador a TI, quejándose de que el informe con el que lleva peleando 3 días con esas relaciones que ahora "controla", no funciona, va lento, cada vez que filtra se pone a "pensar"... Vamos, es imposible ver nada. El experto le dice que le deje el ordenador para revisar el informe y que le llama cuando lo tenga solucionado. Cuando el experto abre el modelo se encuentra con:

  • Había creado un modelo de datos con 16 tablas, de las cuales realmente solo necesitaba 6.
  • Al importar las tablas se ha traído las 236 columnas, aunque solo utiliza 12.
  • Creo recordar que tenía 4 veces el campo Población en distintas versiones.
  • Relaciones circulares.
  • Tablas 1 a N cuando debían ser 1 a 1.

Al final, en media hora se había creado el modelo nuevo con sus relaciones y el informe funcionaba perfectamente.

Pero, claro, este problema llevado al terreno sencillo de un usuario tiene fácil solución, pero cuando el dataset del informe empieza a crecer, se ha publicado para el consumo de la empresa y empiezan a utilizarlo muchos usuarios, alta concurrencia, ¿qué pasa entonces? Porque, claro, el informe que nació para ser utilizado en un entorno más o menos controlado de volumetría y concurrencia, con un modelo de datos bastante complejo, con muchas transformaciones, nuevos KPIs, tablas temporales, etc., en estos momentos “muere” de éxito.

New call-to-action


Ahora es cuando Microsoft empieza a facturar de verdad, porque la primera solución que se nos ocurre es comprar capacidad, pero cuando vemos el precio buscamos otras opciones, como… ¿Y si en vez de importar tanta información nos creamos una conexión directa a la base de datos y otras Import y así aligeramos volumetría?

Para no alargarme, adelanto que no funciona: al relacionar tablas import y tablas direct query no conseguimos nada, porque si tengo que esperar a recibir para tener todos los valores posibles en una relación, otra vez aparecerá el símbolo de “pensar”, y no solo en el refresco del informe, sino cada vez que hacemos un filtro o una selección más o menos importante.

Bueno, ¿entonces qué hacemos?

Solución: en el siguiente capítulo...

 

Consigue una verdadera transformación digital

Desde Techedge, debido a nuestra amplia experiencia, nos ofrecemos a ser tu partner en este proceso clave de una adecuada transformación digital. 

¡Quiero saber más!

¡Suscríbete!