- Introducir conceptos básicos de estadística.
- Introducir a la notación matemática usual en estadística.
- Probar en R algunos de los conceptos aprendidos.
9 de octubre de 2018
Concepto | Definición | Notación |
---|---|---|
POBLACIÓN | total de sujetos o unidades de análisis de interés en el estudio | Mayúsculas: \(N\) |
MUESTRA | cualquier subconjunto de los sujetos o unidades de análisis de la población, en el cual se recolectarán los datos | Minúsculas: \(n\) |
PARÁMETRO | una medida resumen calculada sobre la población | Directo o letras griegas \(\mu\) |
ESTADÍSTICO | una medida resumen calculada sobre la muestra | Con sombrero: \(\bar{x}\) |
Buscan un valor representativo de una variable. Asumimos que el valor “central” es el más represetativo.
\[\bar{x}=\frac{\sum{x}}{n}\]
\[x=[25, 41, 15, 16]\]
\[\bar{x}=\frac{25+41+15+16}{4}\]
\[\bar{x}=24.15\]
sum(x)/length(x)
x = c(24, 41, 15, 16, 16) ifelse(length(x)%%2 == 0, (sort(x)[floor((length(x)+1)/2)] + sort(x)[ceiling((length(x)+1)/2)])/2, sort(x)[(length(x)+1)/2] )
## [1] 16
\[x=[22, 45, 22, 18, 31, 65, 22, 31, 31]\] ## Moda en R
R
no tiene una función interna para calcularla.mode()
regresa el modo de almacenamiento interno de un objeto. Una propiedad interna de R.## [1] "16"
Se puede usar la librería modeest::
Buscan dar cuenta de la homogeneidad o heterogeneidad de una variable. Cuán concentrados o dispersos están sus valores con respecto a una medida de tendencia central.
Diferencia entre el valor máximo y mínimo de una variable.
\[Var(x) = \frac{\displaystyle\sum_{i=1}^{n}(x_i - \mu)^2} {n}\]
Sumatoria de los desvíos a la media al cuadrado entre la n
\[\sigma = \sqrt{Var(x)}\]
Al reducir \(Var(x)\) a su raíz cuadrada se expresa en unidades naturales de la variables.
\[iqr(x) = Q_3^x-Q_1^x\]
IQR()
EN MAYUSCULAS!