7 de agosto de 2018

Sesión 1. Objetivos.

  • Alinear expectativas entre alumnos, alumnas y profesor.
  • Conocer algunas peculiaridades de la plataforma R.
  • Instalar R y Rstudio.
  • Configurar una cuenta de DropBox para compartir información.

Sobre este curso.

  • Toma como punto de partida los conocimientos de estadística de los estudiantes.
    • Sólo repasaremos algunos métodos estadístico básicos en su implementación en R.
    • (O no)
  • Se centra en el análisis de variables categóricas, frecuentes en el análisis sociológico.
  • No utiliza al lenguaje matemático como vehículo primordial.

Temarios posibles

  • Análisis exploratorio.
    • Sumarios y gráficos1
  • Modelos lineales con efectos fijos (regresión).
  • Análisis multivariado.
    • Análisis de Correspondencias Múltiples y Análisis de clases latentes.
  • Análisis de encuestas y datos ponderados.
    • Estimación de estadísticos e intervalos de confianza.

  • Cartografía digital.
  • Análisis de redes.
  • Minería de textos (NLP).
  • Programación con paradigma funcional con R.2

La plataforma R.

R es simultaneamente dos cosas:

  • Un lenguaje de programación especializado en el análisis estadístico.
  • Una plataforma de ejecución para ejecutar los comandos de R.

Fue creado como una implementación de fuente abierta del lenguaje S por Ihaka y Gentleman, en la Unversidad de Auckland.

  • Está disponible de forma libre bajo la licencia GNU/GPL.
  • Lo desarrolla un núcleo de programadores responsables del proyecto, pero lo han extendido miles de programadores a través de librerías.
  • CRAN (Comprehensive R Archive Network) tiene más de 10.000 paquetes que extienden a R.

R vs. otros softwares estadísticos.

  • Interface basada en línea de comandos.
  • Las instrucciones se cargan en una consola o a través de archivos de sintaxis.
  • Extensible a través de librerías.
  • Ampliamente documentado (mayoritariamente en inglés).

    • Documentación en el sistema interno de ayuda con la función help()
    • Documentación detallada en artículos de la revista R Journal.
    • Ejemplos de uso en viñetas.
    • Preguntas y respuestas en la sección R de www.stackoverflow.com

  • Gratuito.
  • Parco en los resultados.
    • Ejecute primero, consulte después.
    • Asigne un nombre a un objeto.

Instalación de R.

  • La versión actual de R es la 3.5.1. Feather Spray
  • El instalador para Windows se descarga desde https://cran.r-project.org/bin/windows/base/
  • Es conveniente descargar e instalar después que R el entorno RStudio de www.rstudio.com
  • Para generar archivos PDF desde R es necesario también instalar pandoc y la distribución de correspondiente a su plataforma.
    • Y conocer lo básico del lenguaje Markdown.

Sintaxis en R.

  • Para pasar comandos a R es necesario respetar la sintaxis del lenguaje.
    • R es sensible a las mayúsculas. Hola \(\neq\) hola \(\neq\) holA
  • Como en cualquier otro lenguaje, hay varias maneras de expresar lo mismo.
  • Podemos pensar a R como un lenguaje compuesto por sustantivos -estructuras de datos- y verbos -funciones.
  • Los resultados del análisis también son datos. Podemos analizar con R los resultados una función de R.

Funciones en R.

  • Las funciones tienen un imput que especificamos como argumentos y devuelven un output que podemos guardar en la consola o asignar un nombre.
    • R es orientado a objetos. Siempre crea un objeto con los resultados de una función, si no le asignamos un nombre a ese objeto invoca silenciosamente la función print() y muestra los resultados en la consola.
    • Los objetos tienen asignada una clase, de ese modo R puede saber que método aplica.
  • Las funciones en R tienen la misma estructura funcion(argumento, argumento)
    • Normalmente el primer argumento son los datos.
    • help("función") nos muestra la sintaxis básica de una función, el tipo de datos que acepta y lo que nos regresa.
    • example("funcion") muestra en consola un ejemplo de uso de una función.

Ayuda