Ciencia datos modo callejero-redes

Black box

Ciencia de datos en
modo callejero

Slider

Data science en modo callejero

Para alcanzar modelos machine learning precisos, se requiere información completa y relevante, pero en la vida real hay ausencia de datos, falta de etiquetas, recursos limitados y por menores que son el pan en la ciencia de datos; por otro lado, la creatividad y el dominio de otras áreas cobran relevancia en el perfil del data scientist. 

Un buen ejemplo que representa la polarización de este perfil, es la comparación con un músico. Por un lado, está quien se preparó en un conservatorio o una universidad y por el otro, quien adquirió la habilidad de forma empírica en bares y calles.  

¿Cuáles son las percepciones que pueden tener las partes involucradas (cliente y científico) con respecto a las aplicaciones del machine learning y la data en casos concretos? 

Suposiciones del mercado

“La inteligencia artificial es tan sofisticada que puede resolver todos mis problemas, desde reemplazar a mis empleados, hasta diseñar las piezas de software inteligente de la siguiente iteración”.

Gerente de alguna compañía.

Si bien la anterior suposición ejemplificada no pretende generalizar las empresas colombianas, existe todo un espectro de esta postura ante el uso del machine learning. Comenzando con las compañías maduras que tienen su propio equipo para el análisis de datos, hasta el extremo opuesto, donde no cuentan con los perfiles que requiere el área, causando un alto grado de desinformación sobre procesos y alcances de la inteligencia artificial, promovido por las altas expectativas que generan los departamentos comerciales sobre un producto o servicio. 

Suposiciones del científico

“Este problema no se va a solucionar de la manera adecuada, porque no me están entregando los datos que describen completamente el negocio”. – Científico de datos en alguna compañía.

Ahora, desde la perspectiva del científico, pueden presentar resistencia para trabajar en un contexto que muchas veces no es el ideal, o que simplemente no cuenta con los recursos necesarios. 

Esta comparación no pretende clasificar cada extremo como bueno o malo, simplemente cada caso tiene aplicaciones diferentes. Desde nuestro punto de vista, encontrar el equilibrio entre el conocimiento, la flexibilidad y la creatividad, favorece la satisfacción del cliente y le otorga más habilidades al científico para abordar el problema desde diferentes ángulos.  

Necesidad y reto

Necesidades y retos

En nuestro contexto, el reto para la inteligencia artificial es lograr madurez en la relación con la industria, que permita alcanzar los objetivos de los productos y consolidar el conocimiento del área, sus límites y aplicaciones pedagógicas como parte del proceso de iteración. 

A continuación enumeramos tres casos relacionados con las suposiciones del mercado sobre el aprovechamiento de datos, desde el más pesimista hasta el contexto ideal. En cada uno está presente el interés inicial del cliente, el trabajo realizado, las metodologías, técnicas y materiales utilizados durante el proceso.

Caso 1: Identificación sobre texto

Interés: Transformar el proceso médico utilizando inteligencia artificial.

El trabajo real: Identificar medicamentos, patologías y eventos de interés en las  historias clínicas escritas en forma de texto libre.

Material utilizado: Red neuronal bidireccional + convolucional para representación a nivel de caracteres + glove para representación a nivel de palabra + campo aleatorio condicional para modelar secuencias de etiquetas.

Cuadro identificación de texto

Caso 2: Estimación de precio

Interés: Predecir el valor comercial de un apartamento en Bogotá.

El trabajo real: Consolidar, explorar y modelar el conjunto de datos, para estimar el valor comercial de un apartamento según algunas de sus características.

Material utilizado: Ingeniería de características + redes neuronales (modelo deep & wide) + descriptiva del error.

Caso 3: Predicción en economía

Interés: Anticipar la tendencia económica sectorial.

El trabajo real: Consolidar, explorar, clasificar, predecir y visualizar históricos de transacciones en comercio y tendencias de búsqueda en Google.

Material utilizado: Series de tiempo + ingeniería de características + bosques aleatorios + eXtreme Gradient Boosting + Google Trends.

Predicción en economía

Como conclusión a las suposiciones de ambos extremos, hemos entendido que las soluciones más contundentes se obtienen de la interacción, el diálogo, el conocimiento y la comprensión de ambas partes: industria y ciencia. 

Nuestra propuesta: “diseñamos nuevos futuros a través de datos”, representa la generación de valor desde la información para la ideación de nuevos productos y servicios, entendiendo y supliendo las necesidades de los públicos objetivo. 

Para lograr este objetivo, en Grupodot contamos con un área dedicada exclusivamente al análisis de datos, conformada por diversos perfiles como físicos, diseñadores, economistas, publicistas, ingenieros y filósofos. Todos ellos aportan, desde sus campos de conocimiento, al análisis, diseño y construcción de diferentes tipos de producto donde se aplican técnicas de inteligencia artificial.  

0 Comentarios

Deja tu comentario

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>