Biólogos dateros y programadores

Episodio 51 - 2020-04-12


John estudió biología en la universidad de Ohio, y luego hizo su doctorado en genética en la universidad de Chicago. A lo largo de su carrera se vió muy expuesto a la programación y a entender la dinámica de los investigadores que tienen que hacer análisis reproducible.

Como biólogo se fué dando cuenta de su interés por la programación, cosa que pareciera ser relativamente común. En esta parte de la entrevista Frans y John compartieron razones por las cuales son bastantes los biólogos en el mundo de ciencia de datos. Los une el interés de entender cómo funcionan las cosas y hacer que las cosas funcionen.

John decidió hace tiempo crear un paquete para ayudar a sus colegas en el mundo de la investigación en esto de hacer investigación reproducible. Lo hizo juntando lo mejor de rMarkdown y su potencial para juntar texto y gráficas de forma elegante, con GIT y su facilidad para el control de versiones de forma simple, y finalmente el web hosting de páginas llevando el HTML generado a GitHub Pages, GitLab y otras.

John también nos contó sobre un muy interesante proyecto de datos sobre tuberculosis latente y activa. Un muy lindo caso del uso de datos para poder afectar de forma positiva las soluciones de salud. Hablamos del patógeno exitoso que afecta a tantos, la diferencia entre quienes tienen la tuberculosis latente y a quienes se les manifiesta de forma activa, la célula que es parte de la solución, el secuenciado de ARN y el uso de redes elásticas para análisis.

Finalmente, conversamos sobre tendencias para el mundo de bio informática y para el mundo de datos en general. John enfatizó la importancia cada vez mas relevante que tiene la nube. Mientras que antes queríamos tener todo el análisis en nuestra computadora o cluster, ahora la nube facilita el procesamiento. También se refirió a JavaScript y su potencial para la diversidad en visualizaciones, usando librerías como D3 por ejemplo.

John compartió algunas de las fuentes que él utiliza para mantenerse al día. Una de ellas, la subscripción a la lista de emails de R Weekly (https://rweekly.org/), y varios twitter rockstarts en el mundo de investigación reproducible como:

Links relevantes