Como objetivo para el 2022 mi novia desea aprender R y yo deseo ayudarle a hacerlo. Con eso en mente decidí aprovechar para conforme avancemos en sus cursos ir construyendo un repositorio de introducción a R para quienes también deseen aprender este lenguaje. Seguramente hay muchos otros cursos mejores, pero sabiendo que este curso esta pensando en ella, pueden asumir que esta construído con mucho cariño y planea ser muy entendible para ir guiando de la mejor forma que pueda quien desee seguirlo.
Esta pregunta es fácil de responder. Basta con googlearla y encontraremos varios blogs que hablan de las ventajas de aprender R. Cómo genetista R es junto con Bash y unos toques de otros lenguajes mi pan de cada dia, pero viendo los análisis que Kary (estudiando tratamiento de aguas residuales) hace, sé que también le será útil. R permite hacer análisis independientemente de donde vingan esos datos: biología, mercadotecnía, ingeniería, etc. Es más, yo he usado R hasta para ayudarle a un primo a analizar acciones de las bolsas de EUA. Algunos puntos de lo que sin llegar a ser experto se puede hacer en R:
- Exploración de datos y obtención de estadisticos de resumen.
- Realizar pruebas estadísticas frecuentistas básicas.
- Visualizar datos mediante la elaboración de gráficos.
- Evaluar modelos que describan el comportamiento de nuestros datos.
- Implementar métodos de aprendizaje computacional (Machine Learning).
- Aprovechar las 18,650 (a Enero del 2022) paqueterías en el repositorio CRAN, MÁS todas las demás en otros repositorios como Bioconductor o GitHub.
- E incluso contribuir uno mismo construyendo funciones o paqueterías nuevas para analizar sets de datos.
Lo mejor, todo esto es GRATIS.
Lo primero que necesitamos es tener instalado R y RStudio en nuesta computadora. R funciona en un entorno independiente a nuestro sistema operativo por lo que puede ser trabajado en Windows, Mac y distribuciones Linux. Agrego aquí un video con las instrucciones de instalación, pero también puedes seguir las siguientes pasos.
R es como tal el lenguaje que aprenderemos a usar y el motor con el que realizará todos los procesos que aprenderas a usar. Para instalarlo:
- Entra al siguiente vínculo: https://cloud.r-project.org/.
- Selecciona el sistema operativo con el que estas trabajando.
- Posteriormente cada sistema operativo tendrá sus propias instrucciones. Aquí seguiré con la instalación de Windows siendo el sistema más popular.
- Daremos clic en "Instalar por primera vez".
- Finamente daremos en clic en descargar R para Windows. Es probable que la versión mas reciente de R al momento de que leas este tutorial es diferente a la que había en Enero del 2022. No te preocupes, todo lo fundamental seguirá funcionando de la misma forma.
- Una vez que se descargue el instalador, dar doble clic y seguir las instrucciones en pantalla.
Mientras R es el motor que usaremos en nuestros calculos RStudio funciona como un tablero que nos permitirá visualizar de forma más eficiente nuestro código y programar de forma más sencilla. No es escencial contar con RStudio y algunos puristas prefieren trabajar únicamente con R, pero en mi experiencia resulta muy conveniente y no le he visto ninguna desventaja a implementarlo. Para instalar RStudio haremos lo siguiente:
- Entra al siguiente vínculo: https://www.rstudio.com/products/rstudio/download/.
- Descargaremos la versión gratuita de RStudio.
- El sitio web de RStudio automaticamente identificará la versión recomendada para nuestro equipo. Descargaremos el ejecutable que nos recimiende.
- Finalmente daremos doble clic en el ejecutable que acabamos de descargar y seguiremos las instrucciones en pantalla.
La forma más recomendable para trabajar el curso es descargar este repositorio completo. Mientras este repositorio vaya actualizandose quiere decir que cada vez que termine una nueva sección tendrás o que descargar nuevamente el repositorio o descargar solamente los scripts de las clases que no tengas. Para descargar todo el repositorio haremos lo siguiente:
-
Daremos clic en el botón verde de código y posteriormente le pediremos a R que descargue todo el repositorio el un comprimido ZIP.
-
Exploraremos las carpetas de nuestro sistema y escogeremos el lugar donde guardaremos el curso. Finalmente daremos clic en el botón de "Save".
-
Tras completar la descarga daremos clic derecho en la carpeta comprimida y la descomprimiremos en la ubicación que hemos escogido. Al descomprimirla podemos usar el descompresor default de nuestracomputadora o algun programa como WinRar o WinZip.
-
¡Y listo! todo el curso se encuentra ya en tu computadora. Dentro observaras las carpetas de cada clase.
-
Al acceder a cada una de ellas observaras dos archivos. Uno con extensión ".R" y otro con extensión ".RProj". En el ejemplo puedes ver para la primera clase el archivo
01_Basico.R
yBasico.Rproj
. El primero es un archivo de texto que contiene el script con las instrucciones de ese curso, mientras que el segundo es un archivo de proyectos de RStudio. Después veremos cuál es la función de este segundo objeto, pero por mientras es importante que al momento de iniciar una clase sea el archivo .Rproj el que abramos con RStudio. Trabajar con archivos de proyectos es una muy buena práctica al momento de que queramos compartir con otras personas nuestros códigos. -
Al dar doble clic y abrir el proyecto de RStudio nos abrirá dicho programa. Podremos comprobar que todo ha funcionado correctamente si nos aparecé dentro de RStudio ek nombre de la clase que seleccionamos.
Tras abrir Rstudio configuraremos nuestra interfaz. Para hacer eso primero ubicaremos la barra de herramientas (aquí remarcada en rojo), en ella encontraremos una diversa cantidad de menus que nos permiten realizar opciones como crear nuevos archivos de texto para scripts, guardar nuestros trabajos o cargar archivos guardados:
Dar clic en la barra de herramientas en Tools > Global Options...
, haciendo que se abra una pantalla como la siguiente:
De aquí daremos clic en Pane Layout
.
Esta pantalla nos permite configurar el acomodo que tendran las diferentes pantallas que nos ofrece RStudio, mi consejo es que lo configures como se muestra en la imagen anterior. Es decir, Source
en la pantalla superior izquierda, Console
en la inferior izquierda, Plots
y Viewer
en la inferior derecha y el resto de las pantalla en la superior derecha.
Ahora veremos que es cada elemento de nuestra pantalla de RStudio:
A. En la sección que asignamos como Source
apareceran los archivos de texto en los que escribiremos nuestros códigos.
B. En esta sección veremos un conjunto de pestañas que nos permitiran conocer las configuraciones y opciones más importantes en RSTUDIO. Las dos más relevantes por ahora serán las pestañas Environment
y Files
. La primera nos permitirá conocer los objetos que iremos creando en R y la segunda los archivos que se encuentran en nuestro directorio de trabajo.
C. La consola de R es el centro de ejecución de R, ahí se nos irá imprimiendo el resultado de nuestros comandos.
D. En esta pantalla observaremos los gráficos que iremos creando.
Con esto terminas tu introducción a R y RStudio, ¡Comencemos a programar!