Las empresas actualmente pasan por grandes cambios para gestionar la información de sistemas transaccionales y/o datos no estructurados, el poder explotar todos estos cúmulos de grandes cantidades de datos en sistemas inteligentes les da la capacidad a los negocios de obtener insights en tiempo real para la toma de decisiones.
El rol de un científico de datos está en liderar este cambio desde dos frentes los requerimientos del negocio y el poder de extraer conocimiento de los datos para solucionar estos problemas. Entender y proponer soluciones entre estos dos campos es una tarea compleja que incluye tener en cuenta restricciones del modelo de negocio, capacidades técnicas del equipo, capacidades de hardware y viabilidad.
En los proyectos orientados a ciencia de datos se encuentra que un mismo problema puede tener múltiples soluciones desde diferentes enfoques, esto causa que en muchos casos se tenga un alto grado de incertidumbre en los proyectos acerca de cuál es el mejor enfoque. Lo que se realiza desde el campo de inteligencia artificial es crear productos mínimos viables que cumplan los requerimientos del negocio.
En general, para la implementación de un proyecto de IA, se tiene en cuenta el siguiente flujo básico de desarrollo, el cual está sujeto a variación dependiendo de la naturaleza del proyecto.
Antes de definir el proyecto como tal se debe tener en cuenta las capacidades tanto de software como hardware donde el producto se desenvolverá. Nos debemos hacer preguntas tales como:
- ¿El nacimiento del proyecto proviene de una necesidad del negocio o alguna mejora de procesos? Un proyecto que nace bajo una necesidad de negocio se comprenderá y tendrá razón de ser durante todo el desarrollo e implementación. Puede existir innovación sin perder de vista los objetivos del negocio.
- ¿Existen datos suficientes y necesarios para extraer información de calidad?, en muchos casos las empresas no poseen procesos automatizados y digitalizados de recopilación de información, debido a la dependencia de los proyectos de IA a un gran volumen de datos.
Los objetivos iniciales son de suma relevancia para todo el proyecto en cuestión, debido a que define qué resultados se espera en términos de indicadores del negocio, por ejemplo, reducir el costo de la producción del proceso de transporte de pedidos en 20%. Los objetivos deben estar bien definidos tanto en términos del negocio como en términos técnicos.
En el levantamiento de información se evalúa que cada usuario comparta requerimientos en común y se tenga la misma percepción de lo que el producto final cumplirá.
En la recolección capturamos la información requerida de las fuentes de datos que disponga la entidad. Se interactúa con diferentes áreas o si son fuentes externas se debe tener en cuenta la disponibilidad y confidencialidad de los datos provenientes de sistemas externos.
En el pre procesamiento se toma los datos y la información en una formatos arbitrarios y poco amigables, se transforma a estructuras fáciles e intuitivas de manejar por un software o lenguaje de programación.
En el modelamiento analizamos los datos utilizando técnicas estadísticas y de optimización, de forma que hallemos los mejores algoritmos que se desempeñen de forma óptima para los objetivos del proyecto. Con el objetivo de mejorar el rendimiento del modelo se realiza la creación de variables que nos permite agregar información y facilitar al algoritmo de machine learning extraer patrones, este proceso se conoce como feature engineering. Además, se valida que el modelo se comporte de forma estable para experiencias aprendidas y nuevas, a este método se denomina Validación Cruzada (Cross Validation).
En el despliegue el modelo de machine learning se implementa en un producto final puede ser implementado desde un sistema web hasta un dispositivo de internet de las cosas, cabe denotar que existen servicios en la nube (Cloud computing) que facilitan la implementación de estos sistemas.
En el horizonte las empresas están pasando por cambios de transformación digital y consolidando las iniciativas de inteligencia artificial para automatizar los procesos de negocio, esto debe ser apoyado por las empresas y profesionales especializados en el campo de IA.
Bibliografía:
Data Science for Business – Foster Provost & Tom Fawcet
Think like a Data Scientist – Brian Godsey
Rellene este rápido formulario y nos pondremos en contacto en breve.
[contact-form-7 id=»614″ title=»Contact form»]