Text Mining en R para Ciencias Sociales
La explosión de datos digitales ha llevado a un creciente interés en el análisis de texto, el cual puede ser de gran utilidad para las ciencias sociales debido a que gran parte de su investigación se basa en el estudio de documentos, encuestas y otros datos textuales. El text mining (minería de texto) permite a los investigadores explorar grandes cantidades de información textuales y extraer conocimientos valiosos y significativos utilizando métodos estadísticos y de aprendizaje automático, como la identificación de patrones y tendencias en los datos.
Con la disponibilidad de herramientas de software como R y RStudio, el análisis de texto se ha vuelto más accesible para los investigadores y profesionales. Estas herramientas ofrecen una amplia gama de paquetes de análisis de texto que permiten a los usuarios procesar y analizar grandes cantidades de datos textuales de manera eficiente y efectiva.
Este curso está diseñado para brindar las habilidades necesarias para utilizar técnicas avanzadas de text mining en R. Los participantes aprenderán a utilizar diversas técnicas de análisis de texto, desde la representación de palabras hasta el modelado de tópicos, y obtendrán una comprensión más profunda de cómo el procesamiento del lenguaje natural (NLP) puede ser aplicado en el análisis de datos en las ciencias sociales
Horario
Miércoles de 19:00 a 21:30 hrs.
a partir del miércoles 22 de noviembre
(5 sesiones)
Participantes
20 Cupos Disponibles
¡No te quedes fuera!
CLP$100.000
Paga con Transferencia Electrónica, Tarjeta Crédito/Débito, Pay Pal o Criptomonedas
Sobre el Curso
En este curso de 5 sesiones se enseñará a los estudiantes los fundamentos del procesamiento del lenguaje natural y técnicas avanzadas de minería de texto. Se cubrirán técnicas como TF-IDF, análisis de sentimientos, modelos de tópicos como Latent Dirichlet Allocation (LDA) y Structural Topic Model (STM), y técnicas de word embedding como Word2vec y glove. Los participantes obtendrán habilidades en la manipulación, visualización y análisis de datos de texto utilizando R y RStudio.
Objetivo general:
Enseñar a los participantes técnicas avanzadas de análisis de texto utilizando R y RStudio.
Objetivos específicos:
- Comprender los fundamentos del procesamiento del lenguaje natural (NLP).
- Familiarizarse con técnicas de minería de texto avanzadas como TF-IDF, análisis de sentimientos, modelos de tópicos y word embedding.
- Desarrollar competencias en el uso de R y RStudio para manipular, analizar y visualizar datos de texto.
- Proporcionar a los participantes la habilidad para implementar técnicas de minería de texto en situaciones reales.
Estudiantes de pregrado y posgrado, y profesionales en ciencias sociales interesados en aprender técnicas avanzadas de análisis de texto
- Conocimientos básicos en estadística y programación en R y RStudio.
- Se requiere un conocimiento general de metodología y técnicas de investigación.
- Cada estudiante deberá contar con un computador operativo con conexión estable a internet.
- Es deseable un manejo intermedio del idioma inglés.
El curso se basará en la metodología de enseñanza activa, donde los estudiantes aprenderán a través de la práctica y la resolución de problemas reales. Se realizarán talleres prácticos y se asignarán ejercicios para completar fuera del aula.
Descarga el Programa completo de este curso
Programa del Curso
Sesión 1
Introducción a la minería de texto y R
- Introducción a técnicas de análisis de texto en R.
- Preprocesamiento de texto: tokenización, limpieza, stemming y lematización.
- Modelos de representación de texto con bag of words y TF-IDF.
- Análisis de sentimientos
Sesión 2
Fundamentos de modelos de tópicos
- Modelos de tópicos probabilísticos
- Latent Dirichlet Allocation (LDA)
- Structural Topic Model (STM)
Sesión 3
Modelamiento de texto con modelos de tópicos
- Evaluación de modelos y selección de número de tópicos
- Especificación de modelos e interpretación de resultados
- Visualización de tópicos con LDAvis y stmBrowser
Sesión 4
Fundamentos de Word Embedding
- Modelos de Word Embedding
- Word to vector (Word2vec)
- Gloval Vectors (GloVe)
Sesión 5
Modelamiento de texto con Word Embedding
- Análisis semántico: Similaridad y analogía entre palabras.
- Visualización de vectores de palabras: PCA (Análisis de componentes principales) y t-SNE (t-Stochastic Neighbor Embedding).
- Herramientas y recursos adicionales para la minería de texto en R.
- Discusión de proyectos de los participantes y preguntas frecuentes
Facilitador

Ignacio Toledo
Ingeniero Civil Electrónico, Doctorado (Ph.D.) en Ciencias de la Complejidad Social de la Universidad del Desarrollo y una Maestría (M.Sc.) en Ciencias de la Ingeniería con mención en Ingeniería Eléctrica de la Universidad de Concepción.
Ha desempeñado roles de analista de datos en distintos contextos, tanto en la industria como en la academia. Anteriormente, se desempeñó como científico de datos y coordinador de analítica en los Programas TIDEM y RedBios, liderados por la Facultad de Diseño de la Universidad del Desarrollo (UDD) y financiados por el Gobierno Regional del Biobío.
Actualmente, ejerce como investigador en la Facultad de Diseño de la Universidad del Desarrollo. Su investigación se distingue por el uso de métodos provenientes de las ciencias sociales computacionales para el estudio de ecosistemas regionales de innovación, la gestión del diseño, el diseño e innovación sostenible, y el diseño sistémico.
¿Tienes alguna duda?
QGIS
El objetivo de esta clase es aproximar a los usuarios y usuarias a las técnicas y herramientas de análisis espacial mediante el uso de Sistemas de Información Geográfica aplicando el software QGIS.
Horario
Curso Online
Usuarios
15 Cupos Disponibles
Medios de Pago
Paga con transferencias y tarjetas Credito / Debito
Sobre el Curso
Aproximar a los usuarios y usuarias a las técnicas y herramientas de análisis espacial mediante el uso de Sistemas de Información Geográfica aplicando el software QGIS.
Se espera que al final del curso cada participante haya integrado los conocimientos necesarios para elaborar cartografías, descargar datos de diferentes fuentes, analizar datos cualitativos y cuantitativos desde un punto de vista espacial, y aplicar herramientas de geoprocesamiento mediante los cuales podrá elaborar análisis, estadísticas y distintos tipos de productos cartográficos.
- Profesionales de cualquier área ligada al análisis espacial, ya sea del área de Ciencias Sociales, Naturales e incluso Ciencias de la Salud. Estudiantes de pregrado de las áreas anteriormente mencionadas, el curso es mayormente afín a contenidos presentes en la carrera de Geografía.
Al ser un curso de nivel inicial, no se requieren conocimientos previos en el uso de la herramienta ni en metodologías asociadas.
Cada estudiante deberá contar con un computador operativo. Para mejorar la experiencia, es deseable contar con una segunda pantalla para ver la instrucción al mismo tiempo que se trabaja. Esta puede ser cualquier equipo Smarthpone con la aplicación Google Meets instalada o un monitor mediante conexión HDMI.
Se requiere tener instalada la versión 3.12 de QGIS, la cual será proporcionada una vez se realice la inscripción en el curso.
- Se debe tener al menos un 75% de asistencia a clases para obtener el certificado oficial de QGIS
- Si no se cumple con este requisito, se entrega un diploma virtual (no certificado por QGIS) a quien lo solicite
Descarga el Programa completo de este curso
Programas del Curso
Modulo Teorico
- Definición de cartografía
- Aportes de la Cartografía al análisis de la superficie terrestre y sus fenómenos
- Datos Geográficos
- Naturaleza de los datos geográficos.
- Componentes de los datos.
- Componente espacial.
- Componente temático.
Modulo Teorico
- Descarga de mapas base WEB a QGIS.
- Elaboración de capas vectoriales.
- Creación de archivos SHP
- Composición de tablas de atributos
- Cálculo de estadísticas en tablas de atributos de datos vectoriales
Modulo Teórico
- Conceptos de construcción de mapas
- Modelos Conceptuales
- Modelos de Representación
- Modelo Vectorial
- Modelo Ráster
- Componentes de un mapa
- Tipos de información geográfica
- Datos Cualitativos
- Datos Cuantitativos
Módulo Práctico
- Elaboración de mapas
- Marco de datos
- Escala
- Sistemas de coordenadas
- Leyenda
- Simbología de coberturas
- Semiología gráfica
- Tipos de mapas temáticos
- Mapas Cualitativos
- Mapas Cuantitativos
Módulo Teórico
- Modelos de representación vectorial:
- Definición y características
- Propiedades
- Fuentes de datos
- Bases de datos oficiales (Censo, Casen, EOD, etc)
- Coordenadas GPS
- Propiedades de los datos vectoriales
Módulo Práctico
- Traspaso de datos a un mapa mediante coordenadas GPS obtenidas en terreno
- Herramientas de geoprocesamiento vectorial
- Unión de tablas de atributos
- Cortar
- Conversión de sistemas de coordenadas
- Áreas de influencia
- Selección por atributos
- Lectura de estadísticas
Módulo Teórico
- Modelos de representación ráster:
- Definición y características
- Propiedades
- Fuentes de datos
- Teledetección e imágenes satelitales
- Interpolación
- Herramientas de extracción de datos desde/hacia otras coberturas.
Módulo Práctico
- Operaciones ráster
- Interpolación
- Agregar datos de superficie
- Pendiente
- Orientación
- Mapas de sombras
- Análisis multivariado mediante la calculadora de procesos ráster
- Estudios de caso
Módulo Teórico
- Fuentes de datos vectoriales
- Herramientas avanzadas de análisis vectoriales
- Herramientas de geoproceso
- Herramientas de geometría
- Herramientas de análisis
- Herramientas de investigación
- Herramientas de gestión de datos
- Gráficos y estadísticas aplicables a SIG
- Técnicas de análisis multivariante en SIG.
Módulo Práctico
- Interfaz de herramientas de geoprocesamiento vectorial
- Estudios de caso para análisis del medio físico
- Estudios de caso para análisis del medio humano
- Técnicas de representación de datos
- Cartografías
- Diagrama de barras
- Diagrama de cajas
- Histogramas
Módulo Teórico
- Modelos de representación vectorial:
- Definición y características
- Propiedades
- Fuentes de datos
- Bases de datos oficiales (Censo, Casen, EOD, etc)
- Coordenadas GPS
- Propiedades de los datos vectoriales.
Módulo Práctico
- Traspaso de datos a un mapa mediante coordenadas GPS obtenidas en terreno
- Herramientas de geoprocesamiento vectorial
- Unión de tablas de atributos
- Cortar
- Conversión de sistemas de coordenadas
- Áreas de influencia
- Selección por atributos
- Lectura de estadísticas
Facilitador

Felipe Castro Gutiérrez
- Geógrafo de la Universidad Católica de Temuco.
- Magíster (c) en Planificación Territorial. Docente de pregrado con 5 años de experiencia en las áreas de Cartografía, Sistemas de Información Geográfica, Teledetección y Planificación Territorial para carreras como Geografía, Ingeniería en Geomensura, Agronomía, Geología, Antropología y Arqueología.