Recursos Adicionales

Materiales de aprendizaje seleccionados para R y análisis de datos

Descripción General

Esta página ofrece recursos de aprendizaje adicionales organizados por tema del curso. Estos materiales complementan el DataTax R Course y te permiten profundizar o explorar temas avanzados.

NoteCómo Usar Estos Recursos
  • Principiantes: céntrate en la sección de Recursos Básicos (Core Resources)
  • Durante el curso: consulta los recursos específicos por tema a medida que completas cada módulo
  • Al finalizar: explora los Temas Avanzados para continuar tu aprendizaje

Recursos Básicos (Core Resources)

Estos libros y tutoriales comprensivos forman la base de la práctica moderna en R. Los recomendamos para todos los niveles.

R for Data Science (2nd Edition)

Autores: Hadley Wickham, Mine Çetinkaya-Rundel y Garrett Grolemund
Enlace: https://r4ds.hadley.nz/

La guía definitiva para hacer ciencia de datos con R. Nuestro curso sigue la estructura pedagógica de R4DS (2e), adaptada al contexto de administración tributaria. Es la referencia más importante para aprender R.

Ideal para: principiantes hasta nivel intermedio
Cubre: todos los temas del curso más modelado, comunicación y flujo de trabajo

Capítulos clave alineados con el curso: - Cap 1-2: Introducción y fundamentos del workflow → Módulo 1 - Cap 7-8: Importación de datos → Módulo 2
- Cap 3-5, 12: Transformación de datos con dplyr → Módulo 3 - Cap 6: Data tidying (reformulación) → Módulo 4 - Cap 9-11: Visualización con ggplot2 → Módulo 5


Data Science for Economists (and Everyone Else)

Autor: Grant McDermott
Enlace: https://grantmcdermott.com/ds4e/

Excelentes materiales de curso de Grant McDermott sobre workflows de ciencia de datos con R. Especialmente fuerte en prácticas modernas de R, control de versiones y reproducibilidad.

Ideal para: quienes buscan una instrucción práctica y orientada al workflow
Cubre: fundamentos de R, data wrangling, visualización, regresión, datos espaciales, big data

Destacados: - Explicaciones claras del ecosistema tidyverse - Integración con Git/GitHub para reproducibilidad - Ejemplos prácticos de economía y políticas públicas - Introducción a cómputo en paralelo y herramientas para big data


Introduction to Econometrics with R

Autor: Florian Oswald
Enlace: https://scpoecon.github.io/ScPoEconometrics/

Libro interactivo de econometría con R. Excelente para administraciones tributarias interesadas en inferencia causal, evaluación de políticas y análisis de regresión.

Ideal para: usuarios listos para ir más allá del análisis descriptivo hacia el modelado econométrico
Cubre: regresión lineal, inferencia causal, datos de panel, variables instrumentales

Por qué es valioso: - Ejemplos e intuición relevantes para políticas públicas - Tutoriales y ejercicios interactivos - Puente entre data wrangling y análisis econométrico - Enfoque en relaciones causales con datos administrativos


swirl: Learn R, in R

Enlace: https://swirlstats.com/

Tutoriales interactivos de R que se ejecutan directamente en tu consola de R. Sin configuración adicional: solo instala el paquete y empieza.

Ideal para: principiantes absolutos que desean práctica guiada y manos a la obra
Cubre: fundamentos de programación en R, importación/limpieza de datos, modelos de regresión, inferencia estadística

Cómo usarlo:

install.packages("swirl")
library(swirl)
swirl()

Ventajas: - Aprendizaje práctico directamente en R - Retroalimentación inmediata sobre tu código - Completamente gratuito y autogestionado - Múltiples cursos disponibles para distintos niveles


YaRrr! The Pirate’s Guide to R

Autor: Nathaniel Phillips
Enlace: https://bookdown.org/ndphillips/YaRrr/

Introducción divertida y accesible a R con temática pirata. A pesar del enfoque lúdico, es una guía completa.

Ideal para: principiantes que quieren una introducción amena y menos formal
Cubre: fundamentos de R, estructuras de datos, visualización, estadística, escritura de funciones

Destacados: - Libro gratuito de ~250 páginas - Videos complementarios - “Pirate plots” para mejorar visualizaciones - Ejemplos claros y buenas explicaciones


Big Book of R

Autor: Oscar Baruffa
Enlace: https://www.bigbookofr.com/

Colección curada de más de 400 libros gratuitos de R organizados por tema. Tu biblioteca definitiva de R.

Ideal para: encontrar recursos especializados sobre cualquier tema relacionado con R
Cubre: desde lo básico hasta temas avanzados (machine learning, análisis espacial, Shiny, aplicaciones por dominio)

Por qué guardarlo en favoritos: - Buscable por tema - Se actualiza regularmente - La mayoría de recursos son gratuitos - Cubre tópicos especializados difíciles de hallar en otros sitios


Plataformas de Aprendizaje Interactivo

DataCamp

Enlace: https://www.datacamp.com/

Plataforma interactiva popular con videos y ejercicios prácticos en el navegador.

Introduction to R (curso gratuito)
Punto de partida ideal con ejercicios interactivos y datos reales

Pros: - No necesitas instalar software - Retroalimentación inmediata en ejercicios - Rutas de aprendizaje estructuradas - Seguimiento de progreso

Nota: hay cursos gratuitos; el acceso completo requiere suscripción


Harvard Data Science: R Basics

Instructor: Rafael Irizarry
Enlace: edX - Harvard Data Science Series

Curso gratuito de Harvard analizando un conjunto de datos reales de crimen mientras aprendes fundamentos de R.

Ideal para: aprendices visuales y prácticos que quieren instrucción de calidad universitaria
Cubre: tipos de datos, vectores, ordenación, gráficos básicos, data wrangling

Qué lo hace especial: - Aprendizaje mediante datos reales - Excelente instructor con explicaciones claras
- Parte de una serie integral de ciencia de datos - Gratis para auditoría (el certificado es de pago)


Recursos por Módulo del Curso

Módulo 1: Introduction to R

R for Data Science - Workflow Basics
Capítulo 2 y Capítulo 4
Base para escribir código R claro y legible

Grant McDermott - Introduction to R
Diapositivas y notas
Guía de inicio rápido en R con buenas prácticas modernas

swirl - R Programming: The basics
Lecciones interactivas en la consola de R

YaRrr! - Capítulos 3-6
Introducción a R, vectores y estructuras de datos básicas

Hands-On Programming with R
https://rstudio-education.github.io/hopr/
Excelente complemento enfocado en fundamentos de programación en R


Módulo 2: Data Import & Export

R for Data Science - Data Import
Capítulo 7 y Capítulo 8
Cobertura integral de lectura de archivos y bases de datos

Grant McDermott - Data I/O
Trabajo con distintos formatos, APIs y bases de datos

Documentación de readr
https://readr.tidyverse.org/
Referencia oficial para lectura de datos rectangulares

Importación con data.table
https://rdatatable.gitlab.io/data.table/
Importación rápida para conjuntos muy grandes (millones de filas)

swirl - Getting and Cleaning Data
Lecciones interactivas sobre importación y limpieza


Módulo 3: Data Wrangling with dplyr

R for Data Science - Data Transformation
Capítulo 3 y Capítulo 4
Referencia central para los verbos de dplyr: filter, select, mutate, summarize, group_by

R for Data Science - Numbers & Strings
Capítulo 12 y Capítulo 13
Trabajo con datos numéricos y manipulación de texto

Grant McDermott - Data Wrangling
Ejemplos prácticos y workflows
Escenarios reales de limpieza de datos

Documentación de dplyr
https://dplyr.tidyverse.org/
Referencia oficial con ejemplos de cada función

Data Transformation Cheat Sheet
PDF de RStudio
Referencia rápida de funciones dplyr

YaRrr! - Capítulos 7-9
Data wrangling con base R y enfoques tidyverse


Módulo 4: Reshaping & Joining Data

R for Data Science - Data Tidying
Capítulo 5
Reestructurar datos entre formatos ancho y largo

R for Data Science - Joins
Capítulo 19
Combinar conjuntos de datos con joins y operaciones de conjuntos

Documentación de tidyr
https://tidyr.tidyverse.org/
Referencia oficial para funciones de reestructuración

Grant McDermott - Data Wrangling (continuación)
Técnicas avanzadas de reformulación y unión de datos


Módulo 5: Data Visualization with ggplot2

R for Data Science - Data Visualization
Capítulos 9-11
Introducción completa a ggplot2: capas, estéticas y facets

Data Visualization: A Practical Introduction
Autor: Kieran Healy
Enlace: http://socviz.co/

Magnífico libro sobre visualizaciones efectivas con ggplot2. Va más allá de la mecánica e incluye principios de buen diseño.

Ideal para: quienes crean gráficos para reportes, presentaciones o publicaciones
Cubre: fundamentos de ggplot2, principios de diseño, mapas, salida de calidad editorial

Por qué leerlo: - Te enseña a pensar qué hace efectiva una visualización - Conjuntos de datos reales y ejemplos relevantes para políticas públicas - Cómo refinar gráficos para comunicación profesional - Excelente para administraciones tributarias que reportan a equipos directivos

ggplot2 Book
https://ggplot2-book.org/
Referencia completa de Hadley Wickham

R Graphics Cookbook
https://r-graphics.org/
Recetario para crear tipos específicos de gráficos

Grant McDermott - Data Visualization
Ejemplos prácticos y workflows modernos de ggplot2

Data Visualization Cheat Sheet
PDF de RStudio
Referencia rápida de geoms y aesthetics de ggplot2

YaRrr! - Capítulo 10
Introducción al plotting en base R y pirate plots


Temas Avanzados

¿Listo para ir más allá de lo básico? Estos recursos cubren programación avanzada en R y aplicaciones especializadas.

Programación Avanzada en R

Advanced R (2nd Edition)
Autor: Hadley Wickham
Enlace: https://adv-r.hadley.nz/

Profundiza en los conceptos de programación de R. Lectura esencial para dominar R.

Ideal para: usuarios intermedios y avanzados
Cubre: funciones, entornos, POO, programación funcional, optimización de rendimiento

Cuándo leerlo: - Tras completar este curso - Cuando quieras escribir tus propias funciones y paquetes - Cuando necesites optimizar el rendimiento - Para entender cómo funciona R “por dentro”

Temas clave para administraciones tributarias: - Cap 6: Functions (código reutilizable) - Cap 9: Functionals (map, reduce, apply) - Cap 23: Medición de rendimiento - Cap 24: Mejora de rendimiento


Aprendizaje Estadístico y Modelado

An Introduction to Statistical Learning
Autores: Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani
Enlace: https://www.statlearning.com/

Introducción de referencia a machine learning y modelado estadístico, con código y laboratorios en R.

Ideal para: usuarios listos para modelado predictivo y ML
Cubre: regresión, clasificación, remuestreo, regularización, árboles, clustering

Aplicaciones en administración tributaria: - Scoring de riesgo para selección de auditorías - Predicción de comportamiento de cumplimiento
- Clasificación de tipos de contribuyentes - Detección de anomalías en cadenas de IVA - Pronóstico de recaudación

Cómo usarlo: - Empieza tras dominar los Módulos 1-4 - Trabaja los laboratorios en R - Enfócate en caps. 2-4 para fundamentos - Caps. 5-6 para validación cruzada y selección de modelos


Datos Espaciales y GIS

Geocomputation with R
Autores: Robin Lovelace, Jakub Nowosad, Jannes Muenchow
Enlace: https://r.geocompx.org/

Guía integral de análisis de datos geográficos con R.

Ideal para: trabajar con datos tributarios espaciales (regiones, distritos)
Cubre: estructuras espaciales, sistemas de coordenadas, mapas, operaciones espaciales

Aplicaciones tributarias: - Mapear recaudación por región - Analizar patrones espaciales de cumplimiento - Visualizar cobertura de oficinas tributarias - Análisis de riesgo geográfico

Requisitos: completa antes el curso, especialmente el Módulo 5 (visualización)


Text Mining y NLP

Text Mining with R: A Tidy Approach
Autores: Julia Silge y David Robinson
Enlace: https://www.tidytextmining.com/

Aprende minería de texto con principios tidy usando el paquete tidytext.

Ideal para: analizar datos no estructurados (comentarios, descripciones, documentos)
Cubre: análisis de sentimientos, frecuencia de términos, relaciones de texto, topic modeling

Aplicaciones tributarias: - Analizar correspondencia de contribuyentes - Clasificar descripciones de negocios - Minería de notas e informes de auditoría - Análisis de sentimiento de feedback

Requisitos: completa primero los Módulos 1-4


Reportes y Documentos Reproducibles

R Markdown: The Definitive Guide
Autores: Yihui Xie, J.J. Allaire, Garrett Grolemund
Enlace: https://bookdown.org/yihui/rmarkdown/

Guía completa para crear reportes, presentaciones y sitios reproducibles con R Markdown.

Ideal para: automatizar reportes y crear documentos profesionales
Cubre: PDF/HTML/Word, presentaciones, dashboards, sitios web, libros

Aplicaciones tributarias: - Reportes mensuales de cumplimiento - Resúmenes de auditorías - Dashboards de datos - Documentación interna

R Markdown Cookbook
https://bookdown.org/yihui/rmarkdown-cookbook/
Recetas y consejos prácticos para tareas comunes en R Markdown


Big Data y Rendimiento

Grant McDermott - Big Data in Economics
Manejo eficiente de grandes volúmenes con data.table, bases de datos y cómputo en paralelo

data.table
https://rdatatable.gitlab.io/data.table/
Manipulación veloz de datos grandes (10M+ filas)

Ideal para: trabajar con padrones completos de contribuyentes o datos transaccionales

Efficient R Programming
https://csgillespie.github.io/efficientR/
Escribe código R más rápido y eficiente


Comunidad y Ayuda

Dónde Pedir Ayuda

RStudio Community
https://community.rstudio.com/
Foro amigable de preguntas y respuestas para usuarios de R

Stack Overflow - etiqueta R
https://stackoverflow.com/questions/tagged/r
Preguntas técnicas específicas de programación

R for Data Science Online Learning Community
https://www.rfordatasci.com/
Grupos de estudio y apoyo comunitario


Mantenerse al Día

R Weekly
https://rweekly.org/
Boletín semanal con noticias y recursos de R

R-bloggers
https://www.r-bloggers.com/
Agregador de entradas de blogs y tutoriales de R

#RStats en Twitter/X
Sigue el hashtag #RStats para tips, noticias y actualizaciones de la comunidad


Materiales de Referencia Rápida

Cheat Sheets (descargas PDF)

Todos disponibles en https://rstudio.github.io/cheatsheets/

Esenciales para este curso: - RStudio IDE - Data Import (readr, readxl) - Data Transformation (dplyr) - Data Tidying (tidyr) - Data Visualization (ggplot2)

Para temas avanzados: - String Manipulation (stringr) - Dates and Times (lubridate) - Factors (forcats) - R Markdown / Quarto

Back to top