CLAVES PARA REALIZAR UN PROYECTO DE DATOS CON ÉXITO

Conocer la realidad de las empresas canarias y convertir sus datos en activos para obtener respuestas y lograr los objetivos propuestos genera un gran valor añadido para la pyme, además de ayudar a reducir costes, incrementar beneficios, o conocer mejor a los clientes, entre otras ventajas. La ciencia de datos es una disciplina clave para llevar a cabo un proyecto de datos con éxito.

foto blog Cámara Ftva

De manera tradicional, la toma de decisiones en el mundo empresarial se ha basado en el conocimiento sobre el negocio adquirido a través de la experiencia y la percepción humana. La ciencia de los datos, que engloba todas las tecnologías que permiten analizar los datos para extraer conclusiones sobre ellos, ofrece una perspectiva más objetiva y certera de la realidad caótica que a veces representan los datos. Si combinamos la intervención del experto en el negocio con analíticas, modelos predictivos y visualizaciones finales tendremos una herramienta muy potente de transformación digital para hacer crecer nuestro negocio.

Datos necesarios para un proyecto de datos

A la hora de poner en marcha un proyecto de datos, se debe preguntar qué datos se necesitan y dónde se pueden encontrar. Dependiendo del proyecto propuesto, el tamaño del conjunto de los datos necesario puede ser masivo o no. Cada proyecto requiere un conjunto de datos de entrada concreto, con dimensiones específicas y acorde a los objetivos marcados.

Auditoría de los modelos

La aparición del COVID-19 ha evidenciado en mayor medida cómo el contexto que nos rodea puede cambiar rápidamente. Los modelos predictivos son modelos que han aprendido de datos históricos que representan una realidad concreta, y si esta cambia, probablemente estos modelos se desvíen y no nos den una respuesta adecuada. Por ello, es necesario auditar los modelos periódicamente o en situaciones anómalas, para comprobar que las bondades del modelo predictivo se conservan y no tienen comportamientos atípicos. Un modelo de datos que ya no responde correctamente debe ser reemplazado por otro modelo entrenado con datos de un intervalo de tiempo y variables adecuados para que la precisión del modelo sea óptima.

Garbage in, garbage out

Al igual que en otros campos de la ingeniería como el procesamiento de señales, si los datos usados para entrenar un modelo no tienen la suficiente calidad, estos no nos ayudarán a responder a nuestras preguntas debidamente. Los datos de entrada del modelo deben ser previamente explorados para comprobar que las variables contienen información de interés y que están lo más completas posible. A continuación, dicha información debe ser tratada para homogeneizarla, eliminar duplicidades y posibles incongruencias, etc. Debemos tener en cuenta que, el core del proyecto siempre serán los datos.

Data Literacy: alfabetización del dato

Cada vez más las empresas descubren la importancia de custodiar los datos y generar valor añadido a partir de ellos. En la transformación digital de una entidad no sólo será importante detectar aquellos procesos que se puedan digitalizar o automatizar, sino también, el flujo de datos que los recorren y qué información es susceptible de ser almacenada para generar modelos de predicción a través de ellos. La cultura empresarial sobre el dato trata de que todos los empleados conozcan la relevancia de gestionar el dato durante todo su ciclo de vida y poder usarlo para un propósito particular.

Esta es una aportación de Yaiza Santana Santana, ingeniera de Telecomunicación por la Universidad de Las Palmas de Gran Canaria (2017), formación que complementó con distintos programas nacionales e internacionales. Ganadora del Primer premio Categoría Proyecto de Grado o PFC de los Premios Cátedras Telefónica ULPGC (2017) y del Premio ASISA al Mejor Trabajo Fin de Carrera en Tecnologías de la Información y las Comunicaciones aplicadas a la Salud de la XXXVIII edición de los Premios COIT/AEIT (2017). Perfeccionó sus estudios con un Máster Universitario en Ciencia de Datos en la Universitat Oberta de Catalunya y con Programas Ejecutivos en Blockchain e IoT en la Escuela de Organización Industrial. Ha dedicado sus últimos años profesionales al desarrollo de aplicaciones en diferentes entornos, al tratamiento, análisis y modelado de datos masivos (Big Data) y a la gestión de la innovación y de la tecnología para aplicarlo en los modelos empresariales.

La Red CIDE es una iniciativa de la Consejería de Economía, Conocimiento y Empleo del Gobierno de Canarias, impulsada por la Agencia Canaria de Investigación, Innovación y Sociedad de la Información (ACIISI), y cofinanciada en un 85% por el Programa Operativo FEDER Canarias 2014-2020.