Episodio 37 - 2018-02-25
En este episodio tuvimos la oportunidad de conversar con Jesús Calejero, Jefe de ciencia de datos en Funidelia, empresa de e-commerce en la industria de entretenimiento y disfraces. Esta empresa ha experimentado gran crecimiento en el último par de años y pudimos hablar de estas experiencias. Con una perspectiva fresca y clara Jesús nos dió con pasión, energía y experiencias reales muchas buenas prácticas para crecer prácticas de ciencias de datos en startups.
Jesús llegó al mundo de ciencia de datos desde la estadística. Luego de estudiar informática hizo un master en estadística aplicada y desde el 2010 está trabajando como científico de datos. Inicialmente como un consultor en distintas empresas interesadas en explotar el valor de sus datos y luego pasó a Frogtek, empresa con carácter social y enfocada en tecnología para puntos de ventas, con oficinas en Colombia, México y España. Cuando Jesús entró en la empresa eran sólo 20 y le tocó ver el crecimiento de la empresa y de la práctica e ciencia de datos en la misma desde una actividad unipersonal hasta el involucramiento de distintas áreas en los proyectos de datos.
Con las experiencias de Jesús re-definimos el diagrama de Venn del Científico de datos agregando la importancia de la comunicación. Jesús dió un buen ejemplo donde en Frogtek un producto de datos bueno no estaba siendo suficientemente explotado por problemas de comunicación y falta de entendimiento. El científico de datos debe integrar en sus equipos y prácticas al cliente / usuario para poder lograr que los productos de datos generen impacto.
También pudimos hablar de la importancia del control y seguimiento a los proyectos de ciencia de datos. Los modelos y algoritmos deben evolucionar constantemente y los proyectos no terminan con la entrega sino que se deben re-evaluar con cierta frecuencia. Hablamos de los experimentos y métricas para poder realmente apoyar la toma de decisiones en lo referente a productos.
Luego pasamos a hablar sobre el caso de Funidelia y de como fué evolucionando la práctica de ciencia de datos en esta interesante empresa. Partiendo por tomar algunos proyectos que ya estaban operativos para luego meterse mas de lleno a aportar a todas las áreas de la empresa, desde producto hasta áreas más operativas. Mucho del enfoque está en entender bien al usuario y saber que ofrecer en cada momento entendiendo bien el contexto de quien compra un disfraz. Para esto han trabajado por ejemplo en algoritmos de segmentación de usuarios y de ordenamiento de artículos en base al comportamiento previo del usuario.
De forma interesante Jesús nos comenta que en Latinoamérica es más claro el rol de un científico de datos para entender a los usuarios y obtener retorno en la inversión, mientras que en España la expectativa es la de ver “que es lo que nos puedes sacar de valor de los datos”.
Pudimos tocar proyectos puntuales como el de utilizar ciencia de datos para apoyar a un grupo de ventas que rápidamente tenía que definir si los prospectos potenciales tenían alto o bajo potencial de conversión. A partir de este tipo de análisis, relativamente simples, se puede impactar al negocio y generar altos retornos. Jesús habló de buenas prácticas para tomar un proyecto ya funcionando para luego mejorarlo sin ir por la vía de comenzar desde cero y alargar los tiempos de los proyectos.
También pudimos meternos en los fierros y entender el stack utilizado por Jesús en las empresas en la que ha pasado. En general utilizando R, RStudio Server, R Shiny Server y Jenkins y alguna base de datos ha sido suficiente para estar operativo en ambientes de producción. Para comparación de productos e imágenes están comenzando a utilizar TensorFlow. En algunos casos puntuales también utilizó las APIs de BigML y BigQuery.