Tareef, Posit y el rol del código abierto en el desarrollo de la industria de datos

Episodio 85 - 2023-01-29


Un interesante episodio con Tareef Kawaf, presidente de Posit (antes RStudio) desde el 2013. Tareef nos comentó que está basado en Boston y también cubrimos su carrera a través de empresas como Digital, ATG, Rockus y Brightcove para luego encontrarse con RStudio. En su carrera y en posiciones como VP de ingeniería Tareef encontró la importancia de manejar los datos para liderar equipos de ingeniería y producto. Esto lo llevó a una reunión con JJ Allaire, fundador de RStudio. Una historia muy interesante.

En su rol como presidente, y trabajando de cerca con JJ, les toca cubrir todos los aspectos requeridos para que Posit siga impactando positivamente la industria y el ecosistema de ciencia de datos. Esto implica ver temas de producto, mercados, organización y manejar el correcto balance entre invertir en open source y potenciar el negocio para hacerlo sostenible en el tiempo y de impacto al ecosistema. En este rol tiene la suerte de interactuar con organizaciones de diferentes tamaños en múltiples latitudes y entender el estadío en su evolución hacia el buen uso de los datos para impactar el negocio.

Uno de los temas que tocamos, es el variado estadío en uso de datos en organizaciones a lo largo del globo. Desde las que con un analista (y sin necesariamente pensar en big data) pueden usar el stack de código abierto y todas sus librerías para generar productos de datos de impacto. Y luego llegar a organizaciones que tienen equipos incipientes de datos donde 3 a 5 personas pueden cubrir todos los aspectos que van desde pensar un producto de datos, prototiparlo y modelarlo, publicarlo y testearlo para finalmente ponerlo en producción de forma escalable. Finalmente, las organizaciones que con varias decenas a cientos de profesionales de datos definen stacks con múltiples tecnologías para diferentes usos y casos de negocio.

También hablamos sobre el futuro y fuimos concluyendo en que cada vez más, las nuevas generaciones aprenden a escribir código y que hacia adelante se va haciendo más relevante el apetito por aprender y el acceso a herramientas que faciliten análisis y método científico. En paralelo al entendimiento que potencia el análisis y la reproducibilidad así como también entender el impacto se van a ir dando soluciones que de forma bastante automatizada generan soluciones en base a descripciones simples y de alto nivel.

Links relevantes