A medida que transcurre el tiempo nuestros modelos más antiguos empiezan a perseguirnos. Seguramente los primeros y antiguos modelos que construimos no contienen todas las mejores prácticas que hay sobre Bi sino que vamos aprendiendo poco a poco con cada proyecto que vamos desarrollando. Cierto es que la experiencia nos invita a construir cada vez mejores modelos.
Sin embargo, ¿Que ocurre con nuestros antiguos desarrollos? lo cierto es que pueden perder eficiencia y hasta fallar en tamaño puesto que no fueron contemplados con las mejores prácticas.
En esta oportunidad me gustaría hacer este pequeño post para revelar cinco buenas prácticas necesarias para construir un modelo con el tamaño indispensable y no excedente.
5 Tips para reducir el tamaño del modelo
- Data Modeling: es esencial para tener la memoria del modelo a su máxima eficiencia que previamente analicemos los orígenes de datos para poder construir un modelo estrella que mantenga el uso de sus hechos y dimensiones de la mejor forma posible.
- Cada columna por su tipo: en muchas oportunidades cuando el origen de datos no es una base de datos con tipos de datos definidos, solemos dejar todo en texto. Ciertamente el tipo de datos de cada columna tiene un peso distinto. Los valores numéricos pesan menos que los de texto. Los enteros que los decimales. Incluso si reducimos el número de decimales también reduciremos el peso de la columna en el modelo.
- Mantener lo necesario: es muy importante no cargar las tablas en su totalidad sino cargar aquello que realmente necesitamos para el modelo. Solo debemos utilizar las columnas que los requerimientos nos pidan para evitar tablas con mucha cantidad de columnas.
- En este punto particular nos puede ayudar a esta limpieza herramientas como Power Bi Cleaner tool y otras que nos reconocen que columnas estamos utilizando en nuestro power bi y cuales no están siendo utilizadas.
- Si ya tenemos el modelo construido hace tiempo y solo queremos quitar las columnas de gran tamaño y no todas ellas, podemos nutrirnos de DAX Studio con su vertipaq analyzer integrado que nos dará definiciones sobre las columnas para conocer cual de ellas ocupa más tamaño y mucha otra información. Aquí un video de como activarlo.
- Relacionado a lo anterior que aveces nos cuesta y nos da pereza hay una característica en las columnas de las tablas que tiene mayor peso que las demás. Éstas son las columnas únicas. Aquellas columnas que son distintas en cada fila de la tabla. Si bien no podemos eliminar los id que nos relacionan las dimensiones con los hechos, si podemos tener presente en no cargar una columna con identificador único en nuestras tablas de hecho, puesto que no son necesarias y ocupan mucho lugar (al punto que puede caer la mitad de tamaño el modelo)
- Una de las más conocidas pero no menor es el tip que ya revele en otro post sobre fechas. Por defecto Power BI tiene incorporada una opción, que podemos encontrar en las opciones de power bi desktop, referida a time intelligence llamada auto-datetime. Eliminando dicha opción reduciremos el modelo quitando todas las tablas fechas que nos genera automáticamente por cada columna fecha que tenemos en nuestras tablas.
Agradezco a Cristian Salgado por la idea de hacer este post y sus aportes atravesando varios de los pasos para reducir un modelo realmente.
¡Espero que pueda reducir el tamaño de sus modelo a partir de éstos consejos!