<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=974250883405448&amp;ev=PageView&amp;noscript=1">
Modelamiento de datos, ¿Aún vigente en la era del Big Data?

Big Data

,

Data Intelligence

,

Innovación

Modelamiento de datos, ¿Aún vigente en la era del Big Data?

Francisco Gaitán Díaz | mar 17, 2022

 

"En 2019 Gartner publicó el articulo “Data Modeling to Support End-to-End Data Architectures” donde se menciona que la complejidad de la arquitectura de datos exige un diseño hábil de los mismos, porque cada elemento de dato debe ser modelado y cada uno puede requerir un modelamiento diferente".

 

Ahora es mucho más frecuente escuchar conceptos como analítica, transformación digital, empresa inteligente, decisiones basadas en datos entre otros, pero para que todos estos conceptos se hagan una realidad, es necesario acumular grandes cantidades de datos, pero más que eso, es necesario tener la capacidad de utilizarlos y para lograrlo es necesario modelarlos.

Ahora que vivimos en la era del Big Data el concepto del Modelo de Datos se torna un poco borroso, debido a que hay demasiada información online insistiendo en que ahora lo único que se debe hacer es utilizar lagos de datos, donde se puede almacenar prácticamente cualquier elemento digital para ser utilizado o analizado rápidamente por decenas de servicios y obtener “Insights” prácticamente al instante, lo cual es parcialmente cierto, solo que no se destaca el hecho que dichos elementos allí almacenados sin un objetivo y unos modelos conceptuales, lógicos y físicos son prácticamente inservibles, en otras palabras, el concepto de modelamiento de datos está más vigente que nunca, como lo ha mencionado durante años en distintas publicaciones Chris Bradley, uno de los principales colaboradores del DMBOK.

 

¿Qué es un modelo de datos?

A diferencia de lo que aún se enseña en muchas universidades y muchos artículos mencionan de forma superficial en Internet, el modelamiento de datos no es el diseño ni la descripción gráfica de una base de dato relacional. Un modelo de datos es la descripción de un negocio (1), claro, no es una descripción con palabras como a primera vista se podría pensar, es una descripción con entidades y relaciones, el modelamiento de datos suelen interpretarse como modelos de base de datos, pero en realidad a nivel corporativo las entidades y las relaciones están inmersos en todos los niveles de la organización, los datos son producidos y utilizados en todos los niveles de la compañía, así que los modelos de datos no son la excepción.

Cuando hablamos de modelamiento de datos debemos tener claro que las organizaciones ahora necesitan gestionar sus datos como activos, similar a como lo ha hecho con personas lugares o cosas hasta el día de hoy. Dichos activos necesitan ser creados, leídos, actualizados, eliminados y/o archivados, sin embargo, ahora tenemos un reto adicional y es que no sólo debemos pensar en cómo se deben modelar los datos, sino que además se debe pensar cómo modelar los metadatos.

                                                                                                                                                                                  (1) Christopher Bradley, CDMP Fellow 2010

¿Qué modelos de datos se deben crear?

Modelo corporativo

CO 2022 artículo modelamiento datos Enterprise ModelPara entender estos conceptos vamos a utilizar un ejemplo. Cuando un arquitecto imagina un nuevo complejo habitacional no está pensando precisamente en los planos detallados de cada una de las unidades, en realidad, esta imaginando un concepto para las personas que podrían llegar a vivir allí, de igual manera cuando pensamos en modelar datos debemos pensar en el concepto del negocio, en lo que representa, aquello que lo diferencia, literalmente es una vista de alto nivel, Wikipedia lo compara con una vista desde un Helicóptero o también podría ser representado como una pirámide, un modelo corporativo suele ser generado por los altos mandos de la organización y los usuarios claves del negocio.

 


Modelo conceptual

CO 2022 artículo modelamiento datos Conceptual ModelSiguiendo con el ejemplo de la arquitectura, el modelo conceptual contiene detalles más específicos como, prestaciones del lugar, centros comerciales, la altura de las torres si son apartamentos, como estarían conectadas las diferentes áreas, entre otras cosas. Hablando de datos, aunque sigue siendo una vista de alto nivel ya podemos identificar entidades y las relaciones entre ellas, de hecho, puede contener la direccionalidad del flujo de datos, pero, sobre todo, es un modelo que permite entender a los usuarios clave la perspectiva centrada en datos de la organización, permite entender como la compañía necesita usar los datos, este modelo debería permitir la redefinición o el refinamiento de los procesos.

Este modelo carece de conceptos técnicos y no debe estar atado a una tecnología en particular, aunque usualmente es construido desde la perspectiva de los usuarios de negocio y los arquitectos de datos.

 

Modelo lógico

CO 2022 artículo modelamiento datos Logical ModelCon respecto al modelo lógico, hablando de arquitectura de nuevo, aquí se encuentran muchos más detalles debido a que se incluyen atributos, por ejemplo, se conoce el tamaño de los apartamentos y de las habitaciones, la cantidad de parqueaderos por unidad, balcón, la distribución de la cocina, entre otros. Con respecto a los datos, éste es el momento de incluir los atributos de los datos dentro de cada una de las entidades, el tipo de relación y las restricciones entre ellas, incluso aquí se puede detallar subtipos de las entidades e incluso niveles de acceso a los datos.

En este modelo de nuevo la participación sigue siendo de los usuarios de negocio y arquitectos de datos, pero el nivel de detalle debe permitir pasar fácilmente al siguiente nivel del modelamiento, incluso sigue existiendo una separación de los componentes netamente técnico, aunque ya se empiezan a plantear el tipo de tecnología que mejor se acopla a la necesidad.

 

Modelo físico

CO 2022 artículo modelamiento datos Phisical Model

Este modelo ya incluye un nivel de detalle absoluto, por ejemplo, al hablar sobre el complejo habitacional que mencionamos se podrá encontrar cómo será la red eléctrica, la red de agua, cuantas luminarias por habitación, la ubicación exacta de cada una de ellas y todos los detalles que harán una realidad el concepto que se visualizó en el modelo corporativo.

Al momento de trabajar con datos primero se tiene por objetivo un entorno netamente tecnológico, aquí ya se establecen técnicamente características específicas de cada uno de los elementos de datos, tamaños, tipo de datos, restricciones y hasta tipo de almacenamiento (aunque este último es una combinación entre arquitectura y modelamiento de datos), por último, según el tipo de software que se utilice, se podrían modelar hasta los metadatos.

 

3 tips estratégicos a tener en cuenta para el modelamiento de datos

  1. Todo tipo de despliegue tecnológico dentro de una empresa tienen el objetivo de utilizar, generar, gestionar o almacenar datos, datos que tienen un propósito específico que no podrían cumplir si no han sido modelados según las necesidades.

  2. Viralizar la adopción de estrategias centradas en datos dentro de la organización se facilita si se cuenta con modelos de datos, debido a que cada tipo de modelo utiliza un tipo de lenguaje acorde a cada tipo de usuario.

  3. Las transformaciones corporativas no se hacen realidad si los usuarios no sienten que han entendido su rol durante y después de la transición, lo cual se convierte en un tropiezo más para las iniciativas. Los modelos de datos muestran entidades, relaciones, flujos, roles y mejor aún, hacen que los usuarios sientan empatía con el lenguaje que se utiliza y les permite entender de forma gráfica desde lo general hasta lo particular los motivos de la iniciativa y su rol dentro de ella.

 

Para concluir, es importante recordar que el modelamiento de datos en un proyecto o iniciativa de datos, no debe empezar en el modelo físico ni lógico, como mínimo debe empezar en el modelo conceptual.

Los modelos se convierten en una herramienta que permite transmitir a los usuarios clave en su lenguaje y con conceptos de negocio los objetivos, la relevancia y la importancia de los datos para la organización dentro en las iniciativas centradas en datos.

Cada tipo de modelo tiene audiencias diferentes, y por eso, contiene diferentes elementos, pero cada nivel complementa al siguiente y eso permite impulsar un entendimiento claro del rol de los datos a nivel corporativo.

Contacta con nosotros

Fuentes
https://video.dataversity.net/video/session-2-data-modeling/
Foundational Data Modeling, Rick Sherman, in Business Intelligence Guidebook, 2015
Data Modeling for the Business: A Handbook for Aligning the Business with IT using High-Level Data Models, Chris Bradley, Donna Burbank, and Steve Hoberman
Imagenes tomadas del Webinar Data Modeling, Christopher Bradley, The 2021 Data Architecture Online event. https://dataarchitectureonline.com/

¡Suscríbete!