Recursos Adicionales
Materiales de aprendizaje seleccionados para R y análisis de datos
Descripción General
Esta página ofrece recursos de aprendizaje adicionales organizados por tema del curso. Estos materiales complementan el DataTax R Course y te permiten profundizar o explorar temas avanzados.
- Principiantes: céntrate en la sección de Recursos Básicos (Core Resources)
- Durante el curso: consulta los recursos específicos por tema a medida que completas cada módulo
- Al finalizar: explora los Temas Avanzados para continuar tu aprendizaje
Recursos Básicos (Core Resources)
Estos libros y tutoriales comprensivos forman la base de la práctica moderna en R. Los recomendamos para todos los niveles.
R for Data Science (2nd Edition)
Autores: Hadley Wickham, Mine Çetinkaya-Rundel y Garrett Grolemund
Enlace: https://r4ds.hadley.nz/
La guía definitiva para hacer ciencia de datos con R. Nuestro curso sigue la estructura pedagógica de R4DS (2e), adaptada al contexto de administración tributaria. Es la referencia más importante para aprender R.
Ideal para: principiantes hasta nivel intermedio
Cubre: todos los temas del curso más modelado, comunicación y flujo de trabajo
Capítulos clave alineados con el curso: - Cap 1-2: Introducción y fundamentos del workflow → Módulo 1 - Cap 7-8: Importación de datos → Módulo 2
- Cap 3-5, 12: Transformación de datos con dplyr → Módulo 3 - Cap 6: Data tidying (reformulación) → Módulo 4 - Cap 9-11: Visualización con ggplot2 → Módulo 5
Data Science for Economists (and Everyone Else)
Autor: Grant McDermott
Enlace: https://grantmcdermott.com/ds4e/
Excelentes materiales de curso de Grant McDermott sobre workflows de ciencia de datos con R. Especialmente fuerte en prácticas modernas de R, control de versiones y reproducibilidad.
Ideal para: quienes buscan una instrucción práctica y orientada al workflow
Cubre: fundamentos de R, data wrangling, visualización, regresión, datos espaciales, big data
Destacados: - Explicaciones claras del ecosistema tidyverse - Integración con Git/GitHub para reproducibilidad - Ejemplos prácticos de economía y políticas públicas - Introducción a cómputo en paralelo y herramientas para big data
Introduction to Econometrics with R
Autor: Florian Oswald
Enlace: https://scpoecon.github.io/ScPoEconometrics/
Libro interactivo de econometría con R. Excelente para administraciones tributarias interesadas en inferencia causal, evaluación de políticas y análisis de regresión.
Ideal para: usuarios listos para ir más allá del análisis descriptivo hacia el modelado econométrico
Cubre: regresión lineal, inferencia causal, datos de panel, variables instrumentales
Por qué es valioso: - Ejemplos e intuición relevantes para políticas públicas - Tutoriales y ejercicios interactivos - Puente entre data wrangling y análisis econométrico - Enfoque en relaciones causales con datos administrativos
swirl: Learn R, in R
Enlace: https://swirlstats.com/
Tutoriales interactivos de R que se ejecutan directamente en tu consola de R. Sin configuración adicional: solo instala el paquete y empieza.
Ideal para: principiantes absolutos que desean práctica guiada y manos a la obra
Cubre: fundamentos de programación en R, importación/limpieza de datos, modelos de regresión, inferencia estadística
Cómo usarlo:
install.packages("swirl")
library(swirl)
swirl()Ventajas: - Aprendizaje práctico directamente en R - Retroalimentación inmediata sobre tu código - Completamente gratuito y autogestionado - Múltiples cursos disponibles para distintos niveles
YaRrr! The Pirate’s Guide to R
Autor: Nathaniel Phillips
Enlace: https://bookdown.org/ndphillips/YaRrr/
Introducción divertida y accesible a R con temática pirata. A pesar del enfoque lúdico, es una guía completa.
Ideal para: principiantes que quieren una introducción amena y menos formal
Cubre: fundamentos de R, estructuras de datos, visualización, estadística, escritura de funciones
Destacados: - Libro gratuito de ~250 páginas - Videos complementarios - “Pirate plots” para mejorar visualizaciones - Ejemplos claros y buenas explicaciones
Big Book of R
Autor: Oscar Baruffa
Enlace: https://www.bigbookofr.com/
Colección curada de más de 400 libros gratuitos de R organizados por tema. Tu biblioteca definitiva de R.
Ideal para: encontrar recursos especializados sobre cualquier tema relacionado con R
Cubre: desde lo básico hasta temas avanzados (machine learning, análisis espacial, Shiny, aplicaciones por dominio)
Por qué guardarlo en favoritos: - Buscable por tema - Se actualiza regularmente - La mayoría de recursos son gratuitos - Cubre tópicos especializados difíciles de hallar en otros sitios
Plataformas de Aprendizaje Interactivo
DataCamp
Enlace: https://www.datacamp.com/
Plataforma interactiva popular con videos y ejercicios prácticos en el navegador.
Introduction to R (curso gratuito)
Punto de partida ideal con ejercicios interactivos y datos reales
Pros: - No necesitas instalar software - Retroalimentación inmediata en ejercicios - Rutas de aprendizaje estructuradas - Seguimiento de progreso
Nota: hay cursos gratuitos; el acceso completo requiere suscripción
Harvard Data Science: R Basics
Instructor: Rafael Irizarry
Enlace: edX - Harvard Data Science Series
Curso gratuito de Harvard analizando un conjunto de datos reales de crimen mientras aprendes fundamentos de R.
Ideal para: aprendices visuales y prácticos que quieren instrucción de calidad universitaria
Cubre: tipos de datos, vectores, ordenación, gráficos básicos, data wrangling
Qué lo hace especial: - Aprendizaje mediante datos reales - Excelente instructor con explicaciones claras
- Parte de una serie integral de ciencia de datos - Gratis para auditoría (el certificado es de pago)
Recursos por Módulo del Curso
Módulo 1: Introduction to R
R for Data Science - Workflow Basics
Capítulo 2 y Capítulo 4
Base para escribir código R claro y legible
Grant McDermott - Introduction to R
Diapositivas y notas
Guía de inicio rápido en R con buenas prácticas modernas
swirl - R Programming: The basics
Lecciones interactivas en la consola de R
YaRrr! - Capítulos 3-6
Introducción a R, vectores y estructuras de datos básicas
Hands-On Programming with R
https://rstudio-education.github.io/hopr/
Excelente complemento enfocado en fundamentos de programación en R
Módulo 2: Data Import & Export
R for Data Science - Data Import
Capítulo 7 y Capítulo 8
Cobertura integral de lectura de archivos y bases de datos
Grant McDermott - Data I/O
Trabajo con distintos formatos, APIs y bases de datos
Documentación de readr
https://readr.tidyverse.org/
Referencia oficial para lectura de datos rectangulares
Importación con data.table
https://rdatatable.gitlab.io/data.table/
Importación rápida para conjuntos muy grandes (millones de filas)
swirl - Getting and Cleaning Data
Lecciones interactivas sobre importación y limpieza
Módulo 3: Data Wrangling with dplyr
R for Data Science - Data Transformation
Capítulo 3 y Capítulo 4
Referencia central para los verbos de dplyr: filter, select, mutate, summarize, group_by
R for Data Science - Numbers & Strings
Capítulo 12 y Capítulo 13
Trabajo con datos numéricos y manipulación de texto
Grant McDermott - Data Wrangling
Ejemplos prácticos y workflows
Escenarios reales de limpieza de datos
Documentación de dplyr
https://dplyr.tidyverse.org/
Referencia oficial con ejemplos de cada función
Data Transformation Cheat Sheet
PDF de RStudio
Referencia rápida de funciones dplyr
YaRrr! - Capítulos 7-9
Data wrangling con base R y enfoques tidyverse
Módulo 4: Reshaping & Joining Data
R for Data Science - Data Tidying
Capítulo 5
Reestructurar datos entre formatos ancho y largo
R for Data Science - Joins
Capítulo 19
Combinar conjuntos de datos con joins y operaciones de conjuntos
Documentación de tidyr
https://tidyr.tidyverse.org/
Referencia oficial para funciones de reestructuración
Grant McDermott - Data Wrangling (continuación)
Técnicas avanzadas de reformulación y unión de datos
Módulo 5: Data Visualization with ggplot2
R for Data Science - Data Visualization
Capítulos 9-11
Introducción completa a ggplot2: capas, estéticas y facets
Data Visualization: A Practical Introduction
Autor: Kieran Healy
Enlace: http://socviz.co/
Magnífico libro sobre visualizaciones efectivas con ggplot2. Va más allá de la mecánica e incluye principios de buen diseño.
Ideal para: quienes crean gráficos para reportes, presentaciones o publicaciones
Cubre: fundamentos de ggplot2, principios de diseño, mapas, salida de calidad editorial
Por qué leerlo: - Te enseña a pensar qué hace efectiva una visualización - Conjuntos de datos reales y ejemplos relevantes para políticas públicas - Cómo refinar gráficos para comunicación profesional - Excelente para administraciones tributarias que reportan a equipos directivos
ggplot2 Book
https://ggplot2-book.org/
Referencia completa de Hadley Wickham
R Graphics Cookbook
https://r-graphics.org/
Recetario para crear tipos específicos de gráficos
Grant McDermott - Data Visualization
Ejemplos prácticos y workflows modernos de ggplot2
Data Visualization Cheat Sheet
PDF de RStudio
Referencia rápida de geoms y aesthetics de ggplot2
YaRrr! - Capítulo 10
Introducción al plotting en base R y pirate plots
Temas Avanzados
¿Listo para ir más allá de lo básico? Estos recursos cubren programación avanzada en R y aplicaciones especializadas.
Programación Avanzada en R
Advanced R (2nd Edition)
Autor: Hadley Wickham
Enlace: https://adv-r.hadley.nz/
Profundiza en los conceptos de programación de R. Lectura esencial para dominar R.
Ideal para: usuarios intermedios y avanzados
Cubre: funciones, entornos, POO, programación funcional, optimización de rendimiento
Cuándo leerlo: - Tras completar este curso - Cuando quieras escribir tus propias funciones y paquetes - Cuando necesites optimizar el rendimiento - Para entender cómo funciona R “por dentro”
Temas clave para administraciones tributarias: - Cap 6: Functions (código reutilizable) - Cap 9: Functionals (map, reduce, apply) - Cap 23: Medición de rendimiento - Cap 24: Mejora de rendimiento
Aprendizaje Estadístico y Modelado
An Introduction to Statistical Learning
Autores: Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani
Enlace: https://www.statlearning.com/
Introducción de referencia a machine learning y modelado estadístico, con código y laboratorios en R.
Ideal para: usuarios listos para modelado predictivo y ML
Cubre: regresión, clasificación, remuestreo, regularización, árboles, clustering
Aplicaciones en administración tributaria: - Scoring de riesgo para selección de auditorías - Predicción de comportamiento de cumplimiento
- Clasificación de tipos de contribuyentes - Detección de anomalías en cadenas de IVA - Pronóstico de recaudación
Cómo usarlo: - Empieza tras dominar los Módulos 1-4 - Trabaja los laboratorios en R - Enfócate en caps. 2-4 para fundamentos - Caps. 5-6 para validación cruzada y selección de modelos
Datos Espaciales y GIS
Geocomputation with R
Autores: Robin Lovelace, Jakub Nowosad, Jannes Muenchow
Enlace: https://r.geocompx.org/
Guía integral de análisis de datos geográficos con R.
Ideal para: trabajar con datos tributarios espaciales (regiones, distritos)
Cubre: estructuras espaciales, sistemas de coordenadas, mapas, operaciones espaciales
Aplicaciones tributarias: - Mapear recaudación por región - Analizar patrones espaciales de cumplimiento - Visualizar cobertura de oficinas tributarias - Análisis de riesgo geográfico
Requisitos: completa antes el curso, especialmente el Módulo 5 (visualización)
Text Mining y NLP
Text Mining with R: A Tidy Approach
Autores: Julia Silge y David Robinson
Enlace: https://www.tidytextmining.com/
Aprende minería de texto con principios tidy usando el paquete tidytext.
Ideal para: analizar datos no estructurados (comentarios, descripciones, documentos)
Cubre: análisis de sentimientos, frecuencia de términos, relaciones de texto, topic modeling
Aplicaciones tributarias: - Analizar correspondencia de contribuyentes - Clasificar descripciones de negocios - Minería de notas e informes de auditoría - Análisis de sentimiento de feedback
Requisitos: completa primero los Módulos 1-4
Reportes y Documentos Reproducibles
R Markdown: The Definitive Guide
Autores: Yihui Xie, J.J. Allaire, Garrett Grolemund
Enlace: https://bookdown.org/yihui/rmarkdown/
Guía completa para crear reportes, presentaciones y sitios reproducibles con R Markdown.
Ideal para: automatizar reportes y crear documentos profesionales
Cubre: PDF/HTML/Word, presentaciones, dashboards, sitios web, libros
Aplicaciones tributarias: - Reportes mensuales de cumplimiento - Resúmenes de auditorías - Dashboards de datos - Documentación interna
R Markdown Cookbook
https://bookdown.org/yihui/rmarkdown-cookbook/
Recetas y consejos prácticos para tareas comunes en R Markdown
Big Data y Rendimiento
Grant McDermott - Big Data in Economics
Manejo eficiente de grandes volúmenes con data.table, bases de datos y cómputo en paralelo
data.table
https://rdatatable.gitlab.io/data.table/
Manipulación veloz de datos grandes (10M+ filas)
Ideal para: trabajar con padrones completos de contribuyentes o datos transaccionales
Efficient R Programming
https://csgillespie.github.io/efficientR/
Escribe código R más rápido y eficiente
Comunidad y Ayuda
Dónde Pedir Ayuda
RStudio Community
https://community.rstudio.com/
Foro amigable de preguntas y respuestas para usuarios de R
Stack Overflow - etiqueta R
https://stackoverflow.com/questions/tagged/r
Preguntas técnicas específicas de programación
R for Data Science Online Learning Community
https://www.rfordatasci.com/
Grupos de estudio y apoyo comunitario
Mantenerse al Día
R Weekly
https://rweekly.org/
Boletín semanal con noticias y recursos de R
R-bloggers
https://www.r-bloggers.com/
Agregador de entradas de blogs y tutoriales de R
#RStats en Twitter/X
Sigue el hashtag #RStats para tips, noticias y actualizaciones de la comunidad
Materiales de Referencia Rápida
Cheat Sheets (descargas PDF)
Todos disponibles en https://rstudio.github.io/cheatsheets/
Esenciales para este curso: - RStudio IDE - Data Import (readr, readxl) - Data Transformation (dplyr) - Data Tidying (tidyr) - Data Visualization (ggplot2)
Para temas avanzados: - String Manipulation (stringr) - Dates and Times (lubridate) - Factors (forcats) - R Markdown / Quarto