Noticias Suscripciones

R-Studio y un ethos para desarrollar la comunidad R con Jeff Allen

Episodio 32 - 2017-07-30


Jeff Allen es un ingeniero de software que trabaja con R Studio desde su oficina en Dallas. Jeff estuvo involucrado en el desarrollo de Shiny Server y R Studio Connect. Con un background en desarrollo de software y luego trabajar con un grupo de investigación en bio-informática (bio-estadística) Jeff se fué metiendo en Ciencia de Datos, R y R Studio.

En la conversación pudimos hablar sobre la cultura y forma de trabajo del equipo distribuido de R Studio. Cada vez mas se ven empresas que tienen el talento humano distribuído y R Studio es una de esas empresas exitosas trabajando bajo este modelo. Los co-fundadores de R Studio son de Seattle y Boston por lo cual esto comenzó temprano en la forma de trabajo de la empresa. Para ser efectivos usan muchas herramientas para trabajar de forma remota y además tienen reuniones anuales o se encuentran durante eventos.

En la conversación pudimos hacer la pregunta clásica para un developer en ciencia de datos: lenguajes de preferencia? Jeff mencionó como R al inicio fué dificil pero luego se convirtió cuando se metió mas profundamente en análisis y visualización de datos. Mencionamos como para desarrolladores Python es más familiar y para estadísticos R y R Studio son más naturales.

Pudimos hablar sobre aspectos de carrera y como Jeff se conectó con los fundadores de R Studio en conferencias en conversaciones acerca de paquetes que debían desarrollarse para luego decidir dar el salto e irse a trabajar a R Studio. Una de las cosas que ´enamoró´ a Jeff con R Studio fué la forma en que esta empresa desarrolla las cosas y un buen ejemplo es R Shiny que es algo en lo que Jeff estuvo involucrado desde el inicio.

¿Cual es el ingrediente que hace especial a R Studio? Tanto Frans como Diego son admiradores de la cultura empresarial de R Studio y esta pregunta no podía pasarse por alto. Jeff comentó que una de las cosas ´cool´ de esta empresa es el tener una versión de código abierto y esto la hace muy valiosa como empresa y como contribuyente al ecosistema. Un segundo aspecto interesante es el mix de gente talentosa en distintas áreas trabajando en los diferentes proyectos. La misión de crear herramientas para hacer R mas utilizable genera un ´ethos´ fuerte.

Pudimos comentar sobre el roadmap para entender el camino y lo que se viene. La respuesta fué que todo lo que hacen en R Studio gira alrededor de hacer R muy atractivo y competitivo desarrollando paquetes útiles siempre de código abierto. Todos los productos y proyectos pueden ser explicados en base a esta filosofía.

¿Y Microsoft en el Ecosistema de R? Hicimos esta pregunta y Jeff comentó que suma mucho tener una jugador grande como Microsoft metiéndose en el ecosistema. Esta participación hace que R se pueda ver cada vez mas como un lenguaje apto para ´producción´. La existencia del R Consortium con sponsors del calibre de Microsoft contribuyen a la consolidación de R.

¿El paquete Plumber? Exponer código R como una API HTTP es un problema relevante que Jeff (y otros) encontraron hace tiempo y tenía sentido resolverlo. Plumber lleva R a la conversación de Web APIs que es tan importante en la actualidad. Tal como lo describe Frans, Plumber permite que el código R se pueda comunicar de forma amigable con máquinas (de forma análoga a como Shiny permite que el código R se pueda comunicar amigablemente con humanos). Actualmente Jeff está escribiendo un libro para hacer el paquete Plumber aún más explícito a la comunidad.

¿Desarrollo de código abierto? ¿interacciones con la comunidad? Jeff tuvo la experiencia de liderar el desarrollo del paquete de código abierto Plumber y con esto pudo ver lo bueno, lo malo y lo feo. Definitivamente es positivo poder tener el código abierto a la comunidad para así poder recibir feedback. A veces se hace complicado manejar la expectativa de usuarios que esperan que todo funcione perfectamente sin necesariamente hacer contribuciones, pero esto es balance que hay que manejar para la creación de paquetes de código abierto.

Respecto a cómo se mantiene Jeff informado de lo que está pasando en el mundo de Data Science, Jeff mencionó que en su caso en particular tiende a mirar el blog de R Studio, R Bloggers y algunas otras fuentes.

Links relevantes