El episodio comienza con una breve historia de cómo un científico de este calibre con tanto impacto en Data Science optó por meterse en matemática para luego hacer una carrera en investigación en Data Mining.
Obviamente cubrimos una buena explicación de los datos complejos y la matemática simbólica. Diday partió de la necesidad de describir algunas cosas con más que números y así llegamos a clases que muestran un set de unidades. Hablamos sobre intervalos, distribuciones y otras formas de mostrar variabilidad en los números.
Imaginando un dataset donde cada celda que describe una observación es una distribución o intervalo hablamos de la creación de los vectores simbólicos para poder simplificar procesos con grandes datos. El profesor Diday habló de aplicaciones en energía, meteorología y salud.
También cubrimos la importante colaboración existente entre el ángulo ingenieril, aportando el lado del hardware y poder de procesamiento de arquitecturas cada vez más complejas, y el ángulo científico, que busca simplificar el problema y la representación de lo datos de maneras muy eficientes.
Un episodio muy interesante para los que quieren ser parte de la industria de ciencia de datos entendiendo la base científica de la misma. Para los interesados en saber más sobre el tema e incluso interactuar con el profesor Diday recuerden que el estará presente el 30 y 31 de Marzo para la conferencia www.BigDataLatam.com.
Diday et al. 2013. The symbolic data analysis paradigm, discriminate discretization and financial application
Bouteiller et al. 2012. Non destructive electrochemical characterizations of reinforced concrete corrosion - basic and symbolic data analysis. DOI: 10.1515/corrrev-2011-0029
Ochs et al. 2016. From the symbolic analysis of virtual faces to a smiles machine. DOI: 10.1109/TCYB.2015.2411432
Haddad et al. Approche symbolique pour l’extraction de thématiques: application à un corpus issu d’appels téléphoniques
Diday 2016. Thinking by classes in data science: the symbolic data analysis paradigm. DOI: 10.1002/wics.1384
Guinot et al. 2015. Strategies evaluation in environmental conditions by symbolic data analysis: application in medicine and epidemiology to trachoma. DOI 10.1007/s11634-015-0201-2