David es desarrollador, graduado de políticas públicas de CMU, apasionado por temas de pobreza y desigualdad, y muy bueno en definir problemas y preguntas que se pueden resolver con ciencia de datos.
Durante la entrevista David habló de su background técnico desde que como emprendedor creó sistemas de bases de datos para gobiernos municipales hasta que con R y el Hadleyverse (empaquetado como tidyverse), Python y PostgreSQL entre otras cosas logró crear infraestructura y cultura de ciencia de datos en FII (Family Independence Initiative) que es donde trabaja actualmente.
Luego nos metimos en detalle en el caso de FII y como esta ONG vió el valor de explotar los datos para generar impacto. En base a esto David comenzó a definir e implementar la infraestructura para poder acceder datos y comenzar a contestar preguntas en usando ciencia de datos. Tomamos un proyecto puntual de ranking crediticio para familias de escasos recursos y tocamos detalles de los datos que alimentan sus data pipelines, el tipo de inferencias y el impacto de este estudio.
Finalmente hablamos de forma mas general acerca del espacio de impacto social y el rol que la ciencia de datos puede (o no) llegar a llenar en próximos años. Esta parte del podcast se puso muy interesante evaluando distintos escenarios que se pueden dar en próximos años y estudiando la situación actual de los Datos en el mundo de las ONGs y los inversionistas en este tipo de organizaciones (Impact investors).