Two Flavors Data Centric Model

Llevo mucho tiempo dándole vueltas a escribir un artículo alrededor del mundo de los datos, porque aunque fascinado por las posibilidades y evolución que ha experimentado en los últimos años, por otro lado, tengo la sensación de que esta evolución ha sido algo deslavazada, motivado fundamentalmente por la complejidad que entraña el proceso.

Si hacemos un poco de historia, en la aparición de los sistemas informáticos como CORE de las compañías, partieron de la premisa de construir los mismos siguiendo la estructura departamental de las mismas, lo cual originó que los distintos sistemas operacionales se construyeran con modelos de datos concebidos para ese enfoque.

Poco a poco al ir evolucionando este enfoque departamental de los sistemas informáticos, cuando aparecieron las necesidades de soluciones informacionales, las compañías se vieron en la necesidad de diseñar sistemas analíticos con gran complejidad en los procesos de ingesta y preprocesado de información, para intentar acercarse a una visión más holística de los datos de la compañía.

En paralelo a esta evolución, la tecnología no ha podido resolver una dualidad derivada de un enfoque transaccional necesario para los sistemas operacionales, así como una necesidad de poder mover y procesar grandes volúmenes de datos para propósitos informacionales.

Aparte de esta dualidad, muy presente por cierto en otros campos de la ciencia, aparece la necesidad de las compañías de evolucionar hacia modelos donde es necesario contar con el contexto de la información (información normalmente no estructurada) , así como la necesidad de reaccionar en el corto plazo (sistemas en tiempo real), acabando finalmente por la necesidad de anticiparnos a la realidad (modelos predictivos). Con esta última necesidad de las compañías, la reacción de la mayoría ha sido convertir un modelo de datos con dos enfoques distintos (operacional e informacional) hacia un modelo de tres capas: operacional, informacional y este último al que vamos a denominar entorno analítico.

A partir de esta situación, me surgen las siguientes incógnitas: ¿Son necesarios tres ambientes de datos distintos en las organizaciones?. ¿Aparecerá una tecnología que permita unir la dualidad "transaccional-consulta" en una única tecnología?.

Hasta que la última pregunta tenga una respuesta afirmativa, bajo mi punto de vista y a medio plazo, debemos volver a un entorno de dos sabores de datos en las organizaciones. La tercera revolución de datos, debería absorber a la segunda, permitiendo que las compañías vuelvan a un modelo de dos entornos, uno operacional y otro informacional-analítico. Sin embargo, la mayoría de las compañías normalmente entienden su transformación como la aparición de nuevas tecnologías en el horizonte, olvidando la opción de apagar, de desaprender, de decomisionar sus sistemas legados, lo cual hace que después de que sus procesos de transformación ocurran, llevan consigo una modernización de la instalación (normalmente adoptando nuevas tecnologías), pero con mayor complejidad de mantenimiento (no termino de apagar sistemas antiguos). Por tanto, lleva consigo sin remediarlo un aumento del coste operativo de las compañías (OPEX).

Por otro lado, y aprovecho para tirarme a la piscina, cada vez más la tecnología se está acercando a comportarse de manera similar a la dualidad onda corpúsculo u onda materia, donde según palabras de Stephen Hawking habla de este fenómeno como un "concepto de la mecánica cuántica según el cual no hay diferencias fundamentales entre partículas y ondas: las partículas pueden comportarse como ondas y viceversa”. En cualquier caso, y hasta que este "piscinazo" podamos valorar si será real, parafraseo a una persona importante de la estructura directiva de una empresa en la que estuve trabajando, en la que imploraba: "debemos contribuir a celebrar muchas fiestas del desenchufe", y aceptar que nuestras transformaciones, también llevan consigo el dejar de jugar a algo, el desvincularnos emocionalmente de los esfuerzos que nos llevó el despliegue de muchos sistemas corporativos, permitiendo hacer un duelo lo más rápido posible, y entendiendo que la evolución siempre es posible gracias a la experiencia anterior (su principal contribución y legado, entendiendo esta palabra no como legacy, sino con la acepción de "Aquello que se deja o transmite a los sucesores, sea cosa material o inmaterial.".)

Siempre oigo hablar de modelos data centric, que me da la sensación que todo el mundo entiende como el objetivo de tener un enfoque central y completo del dato. Bajo mi opinión, y después de darle vueltas, creo que debemos adoptar una aproximación con dos sabores de ese modelo céntrico del dato, ya que hasta ahora, no hemos conseguido resolver técnicamente la dualidad transaccional-informacional del dato.

Finalmente, ¿Cuáles serán los avances más inmediatos en las arquitecturas informacionales corporativas?. Bajo mi humilde opinión, las compañías están virando a un modelo de arquitectura orientadas a eventos (Event Driven Architecture) donde los sistemas operacionales se convierten en productores de eventos que lanzan a un bus empresarial (Kafka y similares), donde existen diferentes consumidores que tratan la información del evento para distintos fines: analíticos, informacionales e incluso también operacionales.

Pongamos un par de ejemplos de dos sectores como pueden ser el sector retail y el sector banca. En el primero de ellos, podemos disponer de una plataforma de comercio electrónico que cada vez que un cliente introduzca un artículo en el carrito, dicha plataforma mande un evento, que pueda ser consumido, por diferentes consumidores: uno podría ser un sistema de analítica en tiempo real que ayude a entender la actividad del portal de comercio electrónico, otro consumidor que tenga propósitos informacionales (que produzca un informe con los clientes que no terminan su proceso de compra, ...).

En el campo de la banca, podríamos incluir un evento en el módulo de un core bancario encargado de las cuentas y movimientos, y que cada vez que haya un movimiento nuevo, mande un evento al bus, y sea consumido en un caso, por un consumidor cuyo objetivo sea el estudio de riesgo de un equipo de ciberseguridad (transferencia sospechosa, PBC, etc....) y otro consumidor podría estar interesado en realizar una funcionalidad de PFM (Personal Finance Management) para indicar al cliente su gasto en alimentación).

La ventaja de este modelo es que los sistemas están completamente desacoplados, y disponemos de un modelo NRT (Near Real Time) donde podemos escalar el número de consumidores para distintos propósitos.

Con esta entrada, doy la bienvenida a mi nuevo blog (migrado de Wordpress a Blogger), y con el ánimo de contribuir con un artículo mensualmente.

Gracias a todos por los feedbacks continuos que recibo de estas publicaciones.

Fede

Write once, share everywhere

Buscar este blog

Two Flavors Data Centric Model

Two Flavors Data Centric Model

Comentarios

Publicar un comentario

Entradas populares de este blog

Liderando el cambio