¡Pásame el RPack!: Todo lo que necesitas saber de los paquetes de R (Parte 1)

¡Pásame el RPack!: Todo lo que necesitas saber de los paquetes de R (Parte 1)

Artículo de Opinión elaborado por Arturo Chian

Para todos los R useRs o, usuarios de R en el buen español, siempre encontrarán un paquete que se amolde para sus necesidades, ya sea para graficar, manejar data pesada, lidiar con web scraping, desarrollar modelos de reportes (¡Word, Excel, PowerPoints, PDF, HTML!), crear data products, aprender algo específico, leer citas famosas, y por supuesto, ¡jugar! (ojo no es broma) además de muchas cosas útiles y no tan útiles…

Y es que los paquetes son algo propio y maravilloso de la filosofía R [1], que mencionamos en nuestro artículo anterior.  Pero… Exactamente ¿qué es un paquete?

De acuerdo a uno de los Data Scientist más respetados en el medio (Wickham 2015), un paquete es la unidad fundamental  de calidad de código compartible. Un paquete tiene todo lo que un usuario necesita: Código, data, documentación, tests y no podía faltar, lo fácil de compartirlo y distribuirlo… Y es que, en el CRAN, hay más de 13 mil paquetes a mayo 2018. ¿Qué es el CRAN? En español se traduciría como Red Integral de Archivos R (Comprehensive R Archive Network), que es para los mortales, la fuente más usada para descargar e instalar paquetes. El CRAN es un repositorio que cumplen con ciertos estándares altos de calidad y licencia, por parte de los CRAN maintainers.

¿Por qué crear un paquete? Una razón contundente puede ser compartir de forma amigable y adecuada tu código. Porque así como un usuario de nivel básico en R, alguien que inicia recién al maravilloso mundo de R, sabe manejar cualquier paquete de forma básica, con toda seguridad podrá aprender a usar fácilmente el tuyo…

Pero ¿qué pasa si no quiero compartirlo? Hilary Parker, otra famosa Data Scientist, comenta, incluso si no quieres compartirlo, piensa en todo el tiempo que te puedes ahorrar para ti o tu equipo… Y no sólo ello, Robert M Flight, otro famoso Data Scientist, afirma que también puede ser muy útil cuando realizas una investigación, dado que almacenas todo en un solo paquete. Toda tu data limpia, data bruta, código de análisis, reportes… ¿Algo más para pedir?

La filosofía detrás de muchos paquetes en R es: si puede ser automatizado, ¡automaticémoslo! Y por supuesto, compártelo a la comunidad. El paquete devtools, es justo el que ayuda a que el proceso sea lo más sencillo y menos doloroso posible. Ya habrá otro momento para tocar este tema en otros artículos, dada la densidad del paquete…

Y para finalizar por ahora… Próximamente lanzaremos nuestros  RPacks! Bestpacks! #pásameelRPack! de BEST. ¡Prepárense!

[1] Ojo no confundir con librerías como las de Python o Stata que son parecidos en términos de utilidad, pero ligeramente distinto conceptualmente. Las diferencias entre paquetes y librerías, los tocaremos a detalle en una próxima discusión.

Referencias

Wickham, Haddley  (2015) R Packages: Organize, Test, Document, and Share Your Code. O’Reilly Media. Disponible en: https://www.amazon.com/Packages-Organize-Test-Document-Share/dp/1491910593

Flight  (2014) “Deciphering life: One bit at a time”, Disponible en: http://rmflight.github.io/posts/2014/07/analyses_as_packages.html

Parker  (2014) “Writing an R package from scratch“, Disponible en: https://hilaryparker.com/2014/04/29/writing-an-r-package-from-scratch/

El presente artículo de opinión, elaborado por el autor, tiene carácter divulgativo con datos de elaboración propia y/o procedentes o basadas en fuentes que consideramos fiables, sin que hayan sido objeto de verificación independiente de Behavioral Economics and Data Science Team (BEST), por tanto, no ofrece garantía, expresa o implícita, en cuanto a su precisión, integridad o corrección, advirtiendo que dichos puntos de vista corresponden al autor y no necesariamente la posición de BEST.

 

Leave a Reply

Your email address will not be published.