
Diversidad de fuentes.
Como norma, nos enfrentamos a un entorno en el que la información relevante para la empresa se encuentra diseminada por infinidad de fuentes, unas veces estructurada y preparada para ser analizada, en otras ocasiones estructurada, pero con deficiencias en su calidad que no la hacen apta para ser utilizada o podemos tener fuentes de datos con información que no está estructurada y que deberá someterse a un proceso previo para poder ser utilizada.
Datos estructurados
Como hemos anunciado en el párrafo anterior, las fuentes de datos estructuradas son aquellas que organizan la información de manera ordenada y predecible, facilitando su procesamiento y análisis.
Estas fuentes pueden ser bases de datos del ERP o de cualquier otra aplicación que se utilice, hojas de cálculo, archivos CSV, entre otros, donde los datos se almacenan en filas y columnas claramente definidas.
Por ejemplo, una base de datos de clientes tendrá en cada línea la información relativa a ese cliente.
En resumen, las fuentes de datos estructuradas nos permiten almacenar, procesar y analizar información de manera eficiente y sistemática.
En ocasiones estas fuentes pueden contener datos que por la forma en la que se han introducido, o porque hay diferentes personas introduciendo datos, no son homogéneos, tienen faltas ortográficas, errores semánticos, nombres distintos para el mismo proceso, o se han introducido cifras en letras, lo que nos impide utilizarlos sin antes revisarlos y arreglarlos.
Para mejorar la calidad del dato y eliminar errores tenemos herramientas como las apps, que nos permiten definir los tipos de datos de cada campo, o definir un formato, o restringir los valores a unos pocos valores de una lista, consiguiendo que la información se introduzca ya con unos requisitos que reducen drásticamente los errores, y la dejan preparada para ser analizada.
Datos no estructurados
Como datos no estructurados se conocen aquellos datos que no están organizados en una estructura o un modelo diseñado. Estos datos suelen estar categorizados como cualitativos. Los datos no estructurados son los tipos de datos más abundantes, y una vez analizados, pueden usarse para decisiones comerciales, entre muchos otros usos.
Los datos no estructurados suelen estar almacenados en su formato original, por lo que es necesario utilizar diferentes herramientas para poder convertir estos datos en información procesable.
Aunque suele ser más difícil trabajar con ellos, a diferencia de los datos estructurados, suelen contener información más detallada y completa que no está disponible en los datos estructurados.
Como resultado, muchas organizaciones están invirtiendo en tecnologías como machine learning (ML) y procesamiento de lenguaje natural (NLP), o ChatGPT, para analizar mejor y obtener información a partir de los datos no estructurados.
Por ejemplo, la api de ChatGPT nos permite por un coste reducido poder analizar documentos en pdf y extractar la información relevante para contabilizar facturas en el ERP o grabar los pedidos de clientes de forma automatizada. Por lo que es una opción muy interesante para pequeñas y medianas empresas.
Los datos no estructurados existen en formato de texto, imagen, audio o video. Ejemplos de datos de texto serían los correos electrónicos, mensajes de texto, facturas, registros. Ejemplos de datos en imágenes serían resonancias magnéticas, radiografías y tomografías.

Power Automate, antes llamado Microsoft Flow, es una plataforma de automatización y flujo de trabajo basada en la nube que permite a los usuarios:
A continuación, tenemos algunos de los ejemplos de uso de Power Automate;

Un Data Lake o Lago de Datos es un sistema de almacenamiento que permite guardar grandes cantidades de datos estructurados y no estructurados en su estado natural, sin necesidad de convertirlos o procesarlos previamente. Esta definición flexible y amplia hace que los lagos de datos sean ideales para almacenar volúmenes masivos de información de diferentes fuentes y formatos.
Tanto Data Lake como Dataverse son servicios de Microsoft, pero con enfoques distintos:
Dataverse
Data Lake
En resumen, Dataverse es ideal para ser usado como base de datos de aplicaciones y análisis estructurados, mientras que un Data Lake es más versátil y escalable para grandes volúmenes de datos sin procesar.
Se puede ampliar lo que aquí se ha comentado en,
https://learn.microsoft.com/en-us/power-apps/maker/data-platform/why-dataverse-overview.
https://learn.microsoft.com/en-us/power-apps/maker/data-platform/export-to-data-lake.
https://azure.microsoft.com/en-us/resources/cloud-computing-dictionary/what-is-a-data-lake/.
https://learn.microsoft.com/en-us/power-query/dataflows/understanding-differences-between-analytical-standard-dataflows.

Microsoft Dataverse es una solución robusta y flexible para la gestión de datos que ayuda a las organizaciones a ser más eficientes y a impulsar la innovación.
Algunas ventajas de Dataverse son;
Todas estas ventajas se traducen en reducciones de costes administrativos, y en una mejor gestión que debe permitirnos mejorar el beneficio de la empresa.
Se puede ampliar información de Microsoft Dataverse en;
https://learn.microsoft.com/es-es/power-apps/maker/data-platform/why-dataverse-overview
(1) Un lago de datos es un sistema de almacenamiento que permite guardar grandes cantidades de datos estructurados y no estructurados en su estado natural, sin necesidad de convertirlos o procesarlos previamente. Esta definición flexible y amplia hace que los lagos de datos sean ideales para almacenar volúmenes masivos de información de diferentes fuentes y formatos.

Es norma general que cuando empiezas a pedir datos en una empresa, o comienzas a trabajar en un proyecto, te encuentres con que,
Es obvio que esta dispersión de la información no es la ideal para una buena gestión.
Creo que actualmente una herramienta como Dataverse puede ayudar a todas las organizaciones, y especialmente a las pequeñas y medianas empresas a mejorar y centralizar la información relevante para la organización.
Microsoft Dataverse es una plataforma de datos flexible y segura que forma parte de Microsoft Power Platform. Permite a las organizaciones estructurar y almacenar sus datos de manera eficiente, facilitando la creación de aplicaciones personalizadas con poco o ningún código. Con su capacidad para manejar datos relacionales y no relacionales, así como su integración con herramientas de análisis avanzadas y servicios de Microsoft, Dataverse se convierte en una solución integral para la gestión de datos empresariales. Además, su enfoque en la seguridad y el cumplimiento garantiza que los datos estén protegidos en todo momento.
Esta plataforma es ideal para empresas que buscan mejorar su eficiencia operativa, innovar rápidamente y tomar decisiones basadas en datos confiables y actualizados. Dataverse es más que una simple base de datos; es un facilitador de transformación digital que ayuda a las organizaciones a adaptarse y prosperar en el cambiante mundo empresarial.
Además de las tablas que Dataverse tiene en su base de datos, se pueden añadir campos a esas tablas o crear tablas nuevas en función de las necesidades, y estos campos pueden ser de diferentes tipos.
Es relativamente sencillo la definición de relaciones entre las tablas, de reglas de negocio para garantizar la calidad de los datos, o la construcción de formularios o flujos de trabajo para desencadenar automáticamente procesos una vez introducido o actualizado un dato.
Utilizar Microsoft Dataverse nos permite cambiar de ERP sin que sea necesaria una costosa migración de las bases de datos del ERP viejo al nuevo, y nos permite tener una copia de seguridad de nuestros datos en la nube.
En resumen, Dataverse es una solución robusta y flexible para la gestión de datos que ayuda a las organizaciones a ser más eficientes y a impulsar la innovación.