Procesamiento y Validación de Bases de Datos usando R
El presente curso, tiene como principal objetivo brindar a los estudiantes las herramientas de programación necesarias para enfrentar procesamientos de información, ya sea en trabajo de encuestas o registros administrativos. Esto, enfocado en las primeras etapas de un procesamiento de datos, es decir, en la validación y depuración de la información disponible.
Horario
Lunes y miércoles de 19:00 a 21:00 hs
a partir del lunes 23 de octubre
(5 sesiones)
Participantes
20 Cupos Disponibles
¡No te quedes fuera!
CLP$100.000
Paga con Transferencia Electrónica, Tarjetas Crédito/Débito, PayPal o Criptomonedas
Sobre el Curso
Objetivo general:
Brindar a los estudiantes las herramientas necesarias para el trabajo de depuración, validación y procesamiento de bases, con la finalidad de preparar la información para los posteriores trabajos estadísticos y de análisis que se realizan dentro de un proyecto de investigación. Todo lo anterior utilizando herramientas de programación y análisis que brinda el software R, utilizando su interfaz Rstudio.
Objetivos específicos:
- Introducir a los estudiantes en la herramienta Rstudio, en su lógica de utilización y conceptos básicos para enfrentar tareas de programación (conocimientos técnico-teóricos, librerías, objetos, listas, data frame, entre otros conceptos básicos para su uso).
- Aproximar a los estudiantes a la comprensión del flujo de un producto estadístico en términos generales, para posteriormente introducirlos específicamente en la sección del proceso donde se depura y valida un base de datos.
- Aproximar a los estudiantes a las diferentes problemáticas asociadas al levantamiento de información, ya sea de registros administrativos o de encuestas. Esto es, problemas de registros, falta de información, estructuras de bases de datos, entre otros problemas de depuración.
- Introducir a los estudiantes en diferentes técnicas de programación para solucionar problemas de origen en los datos, esto es: realizar cruces entre bases de datos, modificación de estructura, identificación de duplicados, corregir variables de texto, separar o unir columnas, entre otras técnicas de programación.
- Entregar herramientas para que los estudiantes puedan evaluar sus scripts de procesamiento, orientado a una programación limpia y de fácil entendimiento y replicabilidad.
Estudiantes de pregrado (cuarto año en adelante) y postgrado del área de las Ciencias Sociales, Humanidades, y Ciencias de la Empresa, Marketing y Administración. Profesionales de las mismas áreas mencionadas.
- Conocimiento básico de la herramienta R y Rstudio, en cuanto a programación, paquetes, objetos, etc.
- Conocimiento de Excel en cuanto a formatos (.xlsx, .csv, xls) y lógica de uso de la herramienta, para facilitar la comprensión de los problemas que se plantearán en el curso.
- Acceso a una conexión estable a internet.
Descarga el Programa completo de este curso
Programa del Curso
Sesión 1
En esta primera sesión se revisarán los conceptos básicos para comprender la herramienta R y su interfaz Rstudio, desde la instalación y utilización de librerías, hasta el trabajo con objetos, valores y listas. Importación y exportación de diferentes tipos de datos.
Introducción a las primeras herramientas de programación para depurar bases de datos con dplyr.
Sesión 2
Sesión 3
Revisión de diferentes tipos y formas de datos que se podrían presentar en un levantamiento estadístico, ya sea de encuesta o registros administrativos.
Revisión de problemáticas asociadas a un mal registro de información e introducción a técnicas de programación para solucionar estas problemáticas
Sesión 4
Continuación en la revisión de técnicas para el procesamiento y validación de bases de datos, desde revisión y depuración hasta relacionar bases de datos con diferentes tipos de datos (bases a nivel de hogar y persona, estilo Casen).
Sesión 5
Revisión de técnicas avanzadas para el procesamiento de bases de datos. Esto, con el objetivo de optimizar las líneas de código que se utilizan en un procesamiento estadístico (map, for, listas de objetos y/o data frames, entre otras).
Formato de presentación para los scripts que se utilizan para el procesamiento (tips, de programación, como utilización de notas, explicación de códigos, etc).
Pequeña introducción a funciones.
Facilitador

Abel Matías Olivares Roca
Sociólogo (UAH) y Magíster en Metodologías de Investigación Social de la Universidad Diego Portales.
Actualmente se desempeña como Analista especialista de datos en la Encuesta Nacional Urbana de Seguridad Ciudadana (ENUSC) en el Instituto Nacional de Estadística.
Posee experiencia comprobada en procesamiento y análisis de información cuantitativa en encuesta como Casen, ENUSC y otros proyectos de evaluación de programas sociales a partir de metodologías cuantitativas