Gobierno de datos, el cimiento para una estrategia basada en la información

Gobierno de datos: el cimiento para una estrategia basada en la información

Analítica de datos – Gobierno de datos

No hay industria que pueda ignorar la relevancia de los datos para su estrategia competitiva, desde los rubros más clásicos como agricultura, ganadería, manufactura, minería; hasta los más modernos y tecnológicos como las telecomunicaciones, el sector financiero, el comercio, etc. Los datos van a seguir siendo generados cada vez más en lugares antes impensados, con el advenimiento del IoT (Internet de las cosas, Internet of Things), un conjunto de estándares y tecnologías que permiten que hasta el elemento más básico pueda generar y trasmitir información. A lo anterior se suma la implementación de las redes 5G, que están especialmente diseñadas para dar cobertura hasta en los lugares más hostiles y con mucho mayor ancho de banda.

Si bien, en un futuro muy cercano se puede avizorar una avalancha de datos disponibles para su análisis, la realidad es que hoy día ya existe muchísima información generada por las organizaciones que superan ampliamente su capacidad de análisis. En este artículo no se tratarán los aspectos tecnológicos relacionados a la capacidad de análisis (almacenamiento, cómputo, algoritmos, entre otros), más bien se tocarán los aspectos organizativos que se traducen en una gestión poco eficiente de la información disponible.

 

Algunos casos de uso de los datos

Sin ahondar en detalle, y solo a modo de ejemplo, se citan algunos casos típicos de análisis de datos y su aplicación estratégica para el negocio.

 

  • Segmentación de clientes: se analizan los clientes según una lista de características pre-definidas; como nivel de consumo promedio, servicios o productos que consume de la empresa, grupo etario, zona geográfica, calidad de pago, etc; y en base a dichas características se agrupan los clientes en grupos similares. Esto permite a la empresa diseñar promociones, productos, servicios y estrategias de retención mejor dirigidas a cada uno de estos grupos.
  • Predicción de fuga: en base al comportamiento que tuvieron clientes anteriores que decidieron pasarse a la competencia, como nivel de consumo, interacciones con el SAC (servicio de atención al cliente), descontratación paulatina de servicio, suspensión del pago por los servicios, sub-utilización de características disponibles en el servicio, se busca detectar patrones de comportamiento para predecir qué otros clientes podrían estar próximos a dejar los servicios de la empresa para pasarse a la competencia.
  • Recomendación de productos: especialmente en los sitios de e-commerce, aunque también puede aplicarse en el comercio tradicional, se analizan los datos de compras anteriores, así, en base a similitudes poder ofrecer al cliente otros productos relacionados a su compra que también podrían interesarle.

Existe una lista muy larga, y según la industria específica, se podrían citar aún más ejemplos específicos. Lo cierto es que, actualmente el análisis de datos ya es una actividad adoptada en empresas de todos los rubros, y quienes no lo estén haciendo aún de forma eficiente, ya están en desventaja.

 

Dificultades típicas en la implementación del análisis de datos

Una de las primeras dificultades para poder aplicar efectivamente el análisis de datos en una organización tiene que ver con aspectos técnicos como: diversidad de sistemas inconexos, con tecnologías incompatibles, en bases de datos con tamaños inmanejables, procesos de transferencia de datos muy pesados, etc. Estos problemas se resuelven o atenúan con la implementación de un Dataware, o Datalake en caso de Big Data (volúmenes muy grandes).

Pero existe otro factor que es clave para el éxito de cualquier iniciativa orientada a dotar de capacidad de análisis a la organización, el Gobierno de Datos. Aunque se tenga a disposición las mejores herramientas tecnológicas, el valor que pueda aportarse a la organización no será el óptimo al menos que toda la organización esté involucrada en el gobierno de los datos.

 

Gobierno de Datos

Esta es una serie de actividades y roles orientados a alinear la estrategia de datos con las estrategias del negocio. Involucra a toda la organización, es transversal a todas las áreas, y apunta principalmente a:

 

  1. Permitir una mejor toma de decisiones
  2. Reducir la fricción operativa
  3. Capacitar a la dirección y al personal en general a adoptar enfoques comunes para problemas de datos
  4. Construir procesos estándar repetibles
  5. Reducir costes y aumentar la eficacia coordinando esfuerzos
  6. Garantizar la transparencia de los procesos
  7. Proteger los datos y otorgar accesos controlados

El DAMA International es una organización sin fines de lucro que impulsa la adopción de las mejores prácticas en manejo de la información, no es la única, pero sería el principal referente en este ámbito. Publican las mejores prácticas y recomendaciones en el DMBOK, el cual se encuentra actualmente en su versión 2.

 

El DMBOK es una colección de procesos y mejores prácticas, orientadas a planificar, especificar, habilitar, crear, adquirir, mantener, usar, archivar, recuperar, controlar y depurar datos.

 

En las secciones siguientes se da un pantallazo de los conceptos principales del DMBOK.

 

Áreas de conocimiento

El DMBOK identifica algunas áreas de conocimiento específicas involucradas en el gobierno de datos, estas se representan en la figura de abajo.

 

Diagrama de gobierno de datos
Diagrama de gobierno de datos

La actividad central del Gobierno de Datos es apoyada por las siguientes áreas de conocimiento más operativas:

 

  • Arquitectura de los datos
  • Modelo y Diseño de Datos
  • Almacenamiento y Operación de Datos
  • Seguridad de Datos
  • Integración e Interoperabilidad de Datos
  • Gestión de Documentos y Contenidos
  • Datos Maestros y de Referencia
  • Almacén de Datos e Inteligencia de Negocio (Data Warehousing & BI)
  • Gestión de Metadatos
  • Calidad de Datos

 

En este contexto, se espera que la organización elabore un programa de gobierno de datos. Este programa define cuestiones estratégicas, como los actores y sus roles dentro del comité de gobierno de datos. Este comité es responsable de delinear las políticas generales sobre acceso, uso, seguridad y calidad de los datos. Y de priorizar los esfuerzos relacionados a datos teniendo en cuenta las prioridades estratégicas de la organización.

 

Un concepto clave es la valoración de los activos de datos. Es el comité el encargado de definir las políticas y criterios para valorizar los activos de datos; es decir, establecer un valor monetario para dichos activos.

 

Las áreas de conocimiento operativas del Gobierno de Datos

 

La intención no es hacer una descripción exhaustiva de las áreas de conocimiento, solo ponerlas en contexto.

 

Existen áreas de conocimiento destinadas a tener transparencia sobre los datos, cosas como tener claro qué representa un conjunto de datos, a partir de cuáles fuentes se conforma, con qué criterios se construye, de qué componentes técnicos depende, entre otros. Las siguientes áreas de conocimiento abordan estos aspectos:

 

  • Arquitectura de los datos
  • Modelo y Diseño de Datos
  • Almacenamiento y Operación de Datos
  • Integración e Interoperabilidad de Datos
  • Gestión de Documentos y Contenidos

Otras áreas velan por la seguridad e integridad de los datos. Atienden aspectos como quiénes pueden acceder a los datos, en qué lugares se almacenan datos que representan la misma información, como se mantiene la integridad y unicidad de los datos dispersos en los diferentes sistemas. Las áreas orientadas a estos aspectos son:

 

  • Seguridad de Datos
  • Datos Maestros y de Referencia
  • Calidad de Datos
  • Gestión de Metadatos

Y por último citamos al área de conocimiento que busca explotar los datos a favor del negocio. Esta área incluye procesos de planificación, implementación y control para proporcionar datos de soporte de decisiones y apoyar a los trabajadores del conocimiento involucrados en informes, consultas y análisis.

 

  • Almacén de Datos e Inteligencia de Negocio (Data Warehousing & BI):

Un tema clave a notar es que el área de conocimiento de Almacén de Datos e Inteligencia de Negocio (Data Warehousing & BI) es solo un área más, y en la secuencia lógica propuesta por el DMBOK se encuentra recién después de haber conformado el comité de gobierno de datos, después de contar con una arquitectura de datos de alto nivel, un modelo de datos de bajo nivel, y varios otros aspectos de seguridad, operativa de implementación, integración, etc.

 

Conclusión

 

Una concepción muy frecuente en nuestro medio (sector público y privado en Paraguay), es que para dotar de capacidad de análisis de datos al negocio, el primer paso es adquirir alguna herramienta tecnológica, y que con esto se resuelve el 80–90% del problema.

 

En la práctica, en casi la totalidad de los casos existe una gran necesidad de formalizar el gobierno de datos primeramente, esto se evidencia por la falta de unificación de términos clave del negocio, por la falta de criterios para relacionar datos provenientes de los diversos sistemas operacionales de la empresa, por la falta de definición de prioridad y niveles de criticidad de los datos acorde a las prioridades del negocio, y varios aspectos más.

 

Es muy común notar procesos de desarrollo de reportes que tardan meses, simplemente porque un mismo término representa distintas cosas en cada área de la empresa. Esta falta de estandarización de términos y criterios también da lugar a otro síntoma muy típico: al cruzar información de distintos reportes del sistema, estos nunca coinciden.

 

Para concluir, es de extrema importancia la adopción paulatina de prácticas de gobierno de datos, a fin de preparar a la organización de cara a la economía de los datos. Con una sólida cultura orientada a los datos, gracias al gobierno de estos, las inversiones en tecnología y recursos humanos serán mucho más fructíferas para el negocio.

Para leer el artículo original, podes seguir a Juan en Medium.