Suscripciones

Entrevista con Marcelo Rinesi

Episodio 7 - 2016-07-24


Esta es una entrevista SUPER interesante donde tocamos varios temas de las experiencias de Marcelo Rinesi como científico de datos.

Primero hablamos de sus experiencias en la industria de vídeo juegos donde la ciencia de datos se utiliza de 2 maneras diferentes: como caja negra utilizando modelos existentes y aplicando o relacionando los juegos multi-jugador masivos con el mundo real en cuanto a los modelos que aplican a ambos. Por ejemplo aplicar modelos económicos del mundo real a mundos virtuales. Aquí tocamos el concepto de comportamiento emergente donde el todo es mas complejo que cada una de las partes. También hablamos de lo interesante que es en este mundo de vídeo juegos poder utilizar ciencia de datos para hacer inferencias y generar modelos y luego generar entrevistas con jugadores para ayudar a la interpretación de estos modelos para toma de decisiones.

También conversamos sobre la diferencia entre diseño y aplicación de algoritmos versus aplicación de heurísticas. En el proceso de aprendizaje (de máquinas) pasamos de no saber algo a utilizar heurísticas para finalmente tener algoritmos que explican bien ciertos comportamientos.

El corazón de la entrevista estuvo basado en un proyecto de informática urbana que realizó Marcelo con datos abiertos del Gobierno de la ciudad de Buenos Aires. Marcelo tomó los datos de atención ciudadana y siguió el siguiente proceso:

  • Definir preguntas para los datasets. En este caso una ciudad presenta muchas preguntas relevantes y en el caso de reclamos es interesante ver su distribución geográfica y los patrones que se podían percibir.
  • Obtener los datos, en este caso bajando los archivos csv del portal de datos abiertos de la ciudad.
  • Limpiar los datos. Marcelo curó los datos para que hacerlos utilizables (limpieza y uniformización de los datos) en este caso utilizando R (lenguaje y entorno con muchas librerías), Python (lenguaje de programación genérico) y scripts.
  • Aplicar modelo. Marcelo utilizó los paquetes R maptools y mapStat con modelos de análisis de datos espaciales para ver la densidad real de casos (incluidos los que no se ven en el dataset).
  • Generar producto. En este caso el producto fueron unas visualizaciones en mapas de densidad.
  • Contar una historia. En base al análisis se generan historias y nuevas preguntas que luego se pueden ir a resolver con análisis mas profundo.

Ejemplos de los mapas que Marcelo puede generar con estos datos son los siguientes.

Valores inferidos para los datos de atención ciudadana en la Ciudad de Buenos Aires

Ademas hablamos de la importancia de automatizar, documentar y ser MUY ordenado para este tipo de procesos. Entender cada paso del proceso es importante. Para esto Marcelo hizo un script para bajar los datos, otro para leer los csv para procesarlos y limpiarlos dejándolos listos, y un último script para modelar y hacer los gráficos.

También quedó claro en la conversación que la ciencia de datos ayuda a modelar pero con el correcto contexto y mejores procesos puede también ayudar a generar nuevas ideas. Por el contrario, aplicar matemáticas sin recordar que detrás hay personas que están siendo modeladas puede generar problemas grandes.

Y el final de esta entrevista hablando del futuro de la industria de ciencia de datos y como esto va a ser ubicuo en todo lo que hacemos y vivimos fué un perfecto cierre!. Marcelo: Gracias totales!!!

“Across the Glass”

Cuento corto de Marcelo Rinesi del libro Tactical Awareness

You stop walking when your earring whispers. You learned it young: it’s impossible to keep track of what places the police algorithms, as they ponder your real-time profile, decide you cannot be allowed to enter today. Better to follow your phone’s instructions and avoid crossing the shifting, invisible lines. A bit ahead there’s a cute boy you’ve seen before. You smile at him and he smiles back. Then he notices where you’re standing and why, stops smiling, and walks away. You can’t follow him. You don’t know if you want to.

Si quieren los 100 cuentos de 100 palabras de Marcelo, el libro se puede bajar del website de Marcelo.

Otra links a Marcelo Rinesi: