A propósito de los 25 años de R y 50 años de Data Science (Parte 1)

A propósito de los 25 años de R y 50 años de Data Science (Parte 1)

Artículo de Opinión elaborado por Arturo Chian

“For a long time I have thought I was a statistician, interested in inferences from the particular to the general. But as I have watched mathematical statistics evolve, I have had cause to wonder and to doubt. …All in all I have come to feel that my central interest is in data analysis, which I take to include, among other things: procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which apply to analyzing data”.

Hace 50 años, John Tukey llamó a una reforma académica en estadística, a través de uno de los más importantes papers de esa época, llamado “The Future of Data Analysis”, donde señalaba la necesidad futura de una ciencia cuyo interés sea aprender de la data o análisis de datos. Hace unos 20 a 10 años, John Chamber, Jeff Wu, Bill Cleveland y Leo Breiman, dieron una serie de argumentos, de forma independiente sobre expandir los límites de la estadística teórica: Chambers enfatizaba la importancia de la preparación de datos, más que el modelaje estadístico; Breiman, prefería enfatizar la predicción antes que la inferencia; y Cleveland y Wu sugerían llamar a este nuevo campo Data Science por su estrecha relación a la data.

Y fue así estimado lector, donde emerge un fenómeno: se abre paso a los programas de Data Science en las principales universidades del mundo: Berkeley, MIT, NYU, Michigan, Yale, y un gran etcétera.

Hace 25 años, en agosto de 1993, nace una comunidad más que un lenguaje, Ross Ihaka junto a Robert Gentleman, dan inicio a R; con autorización de Chambers (creador del lenguaje S donde R se basó), para crear el software que utiliza Facebook, Google, Microsoft, Yale, Berkeley, MIT y por supuesto BEST (nosotros). utilizamos en el día a día.

Y es que, la historia de R no se puede separar de la ciencia de datos y ni de la estadística. La creación de nuevos paquetes ha contribuido a la comunidad de diversas formas, desde mejoras gráficas, hasta mejoras en creación de reportes, o la forma en cómo manejar la data… Comunidades como R Ladies, UseR, R Finance, EARL, entre muchas otras, nos muestra hasta qué punto puede llegar a sentirse el espíritu R en el mundo y desde diversas ciencias, estadística, bioestadística, economía, psicología, finanzas, negocios, etc.

Finalmente, para este post, les dejamos unos papers, sumamente deliciosos:

  1. John Tukey: “The Future of Data Analysis” (1962)
  2. John Chambers: “Greater or Lesser Statistics: A Choice for Future Research” (1993)
  3. Leo Breiman: “Statistical Modeling: The Two Cultures” (2001)
  4. William S. Cleveland: “Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics” (2001)

¡En nuestro siguiente post estaremos comentando a cerca de estos importantes papers! ¡Los invitamos a conocer nuestro curso Fundamentos de Data Science con R donde veremos más de estos interesantes tópicos!

Referencias

Donoho (2017). 50 Years of Data Science, Journal of Computational and Graphical Statistics

Tukey (1962). The future of Data Analysis, The Annals of Mathematical Statistics

Stodden (2012), Reproducible Research: Tools and Strategies for Scientific Computing Computing in Science and Engineering

Chambers (1998). Programming with Data, Springer

Wickham (2014). Advanced R, Chapman & Hall/CRC Press

Anónimo (2018) Reflections on 25+ Years of “50 Years of Data Science”. Blog personal de Yihui recuperado de: https://yihui.name/en/2018/08/25-years-of-data-science/

 

Leave a Reply

Your email address will not be published.