VÍDEO DE INTRODUCCIÓN
HISTORIA DE LA ESTADÍSTICA :
"Gottfried Achenwall" "Sir John SInclair"
El término alemán Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el análisis de datos del estado, es decir, la "ciencia del Estado" (también llamada aritmética política de su traducción directa del inglés). No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico Sir John Sinclair (1754-1835).
En su origen, por tanto, la Estadística estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadística nacionales e internacionales. En particular, los censos suministran información regular acerca de la población
Ya se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el número de personas, animales o ciertas mercancías. Hacia el año 3000 a.C los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C.
Medidas de tendencia central
Son indicadores estadísticos que muestran hacia que valor (o valores) se agrupan los datos.
Esta primera parte la dedicaremos a analizar tres medidas de tendencia central:
• La media aritmética
• La moda
• La mediana
Media aritmética (µ o X )
Es el valor resultante que se obtiene al dividir
la sumatoria de un conjunto de datos sobre el número total de datos. Solo
es aplicable para el tratamiento de datos cuantitativos, si trabajamos con la población, este indicador
será µ; en el caso de que estemos trabajando con una muestra, el símbolo será
X .
Observe que la variación de ambas fórmulas anteriormente mostradas, radica en el tamaño de los datos (N
identifica el tamaño de la población, mientras que n el de la muestra).
EJERCICIO :
El profesor de la materia de estadística desea conocer el promedio de las notas
finales de los 10 alumnos de la clase. Las notas de los alumnos son:
¿Cuál es el promedio de notas de los alumnos de la clase?
SOLUCIÓN:
Aplicando la fórmula para datos no agrupados tenemos:
µ = ,3 4
Cabe anotar que en el ejemplo estamos hablando de una población
correspondiente a todos los alumnos de la clase (10 alumnos en total). El
promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media
aritmética.
En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que
la media aritmética es sensible a los valores extremos cuando tratamos con pocos
datos. El 0,0 es una nota atípica comparada con las demás, que están ubicadas
entre 3,0 y 4,2.
Media aritmética para datos agrupados
En el capitulo 2 explicábamos dos tipos de tablas de frecuencias (A y B). Cuando
los datos se agrupan en tablas tipo A, la media aritmética es igual a la división de
la sumatoria del producto de las clases por la frecuencia sobre el número de datos.
EJERCICIO media aritmética para datos agrupados en tablas tipo A
La siguiente tabla de frecuencia muestra el número de preguntas de 81
encuestados sobre un Test que consta de solo seis preguntas
PASO 1: Realizar la sumatoria del producto resultante de las clases por su
frecuencia absoluta. Para efectos del cálculo de la media, deberíamos sumar 15
veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la última
clase:
PASO 2: Dividir la sumatoria sobre el número total de datos.
En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es
3,41) preguntas buenas.
EJERCICIO : media aritmética para datos agrupados en tablas tipo B
Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:
SOLUCIÓN
Las marcas de clase representan a los intervalos de clase, por ejemplo,
suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces,
al desconocer los 3 valores exactos que están dentro de dicho intervalo.
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de
clase por su frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el número total de datos.
EJERCICIO: comparativa entre el cálculo de la media aritmética para
datos no agrupados y datos agrupados en tablas tipo B
Calcular la media aritmética a los siguientes datos sin agrupar y agrupándolos en
una tabla de frecuencia tipo B (suponga que los datos son poblacionales):
SOLUCIÓN
Calculemos la media para los datos sin agrupar:
Luego construyamos la tabla tipo B y calculemos su media aritmética con el fin de
comparar ambos resultados:
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de
clase por su frecuencia absoluta
PASO 2: Dividir la sumatoria sobre el número total de datos.
.
LA MEDIANA
Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales. La definición de geométrica se refiere al punto que divide en dos partes a un
segmento. Por ejemplo, la mediana del segmento AB es el punto C.
Existen entonces dos segmentos iguales:
EJERCICIO: mediana para datos no agrupados (cantidad de datos
impar)
Encontrar la mediana para los siguientes datos:
SOLUCIÓN
PASO 1: Ordenar los datos.
PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
La mediana es 3, dejando 5 datos a cada lado.
LA MODA
indica el valor que más se repite, o la clase que posee mayor frecuencia, En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.
EJERCICIO: La moda para datos no agrupados
Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la
marca de gaseosa que más consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3
Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3
SOLUCIÓN
PASO 1: Determinar las frecuencias de cada valor de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
PASO 2: la moda representa el valor que más se repite. En este caso es la
marca 1.
Mo = Marca 1
EJERCICIOS
♥ Se realizo una pregunta a 8 personas del día (numero) en que nacieron. Hallar la media, la mediana y la moda; los resultados fueron estos:
- 6 Junio
- 18 Mayo
- 4 Julio
- 19 Abril
- 17 Diciembre
- 02 Mayo
- 01 Junio
- 20 Enero
SOLUCIÓN:
La Media:
La Mediana:
06 - 18 - 04 - 19 - 17 - 02 - 01 - 20
La Moda:
Los números que mas se repiten, son los menores a 10, en este caso el :
- 06
- 04
- 02
- 01
EJERCICIOS PARA REALIZAR EN CLASE
1) El siguiente cuadro muestra la distribución de la renta anual (en miles de soles) en que incurren 50 viviendas:
Marca de Clase | 18.85 | 21.55 | 24.25 | 26.95 | 29.65 | 32.35 | 35.05 |
N° de Viviendas | 3 | 2 | 7 | 7 | 11 | 11 | 9 |
a) Halle e interprete según el enunciado
i) Media, mediana y moda.
ii) Desviación estándar y coeficiente de variabilidad.
b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26 000 soles pero menores que 32 000 soles.
c) Si las rentas menores que 28 300 soles se incrementaron en 2 500 soles y las rentas mayores o iguales que 28 300 soles se redujeron en un 30%. Calcule la nueva renta promedio.
2) Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos mínimos requeridos. Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.
Los resultados se dan a continuación:
Prueba | |||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
Puntaje obtenido por A | 57 | 55 | 54 | 52 | 62 | 55 | 59 |
Puntaje obtenido por B | 80 | 40 | 62 | 72 | 46 | 80 | 40 |
a) Halle e interprete la media, mediana y moda de los dos candidatos.
b) Estadísticamente ¿Cuál de los candidatos debe ser contratado? Fundamente su respuesta.
3) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviación estándar de 3.4 cm. Posteriormente se verificó que la media usada tenia 4 cm de menos.
Rectifique los estadígrafos mencionados.
4) Una asistencia social desea saber cual es el índice de natalidad en 2 distritos de Lima para lo que encuestó a 10 familias de cada distrito con los siguientes resultados
A | 0 | 6 | 1 | 2 | 3 | 1 | 4 | 3 | 6 | 4 |
B | 3 | 4 | 1 | 4 | 2 | 3 | 1 | 5 | 4 | 3 |
a) Calcule la media, mediana y moda para cada distrito e interprételos.
b) Considera Ud. que en el distrito B, el número de hijos por familia es más homogéneo que en el distrito A.
5) La producción de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el departamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn. con 1440000 de variancia, en que departamento se puede decir que la producción de papa es más homogénea
6) El salario promedio en una ciudad es de 11 000 u.m. con una variancia de 2 000 u.m. ¿Cuales serán la nueva media y la nueva variancia si se efectúan los siguientes cambios:
a) Se aumenta 810 u.m a todos
b) Se aumenta el 15 % de su salario a cada trabajador
c) Si se duplican los sueldos
7) En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desviación estándar de 20 puntos
En el curso B los alumnos obtienen una media de 80 y desviación estándar de 16. Ante un reclamo se decide subir en 5% mas 5 puntos adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidió disminuir la quinta parte de la calificación.
Después de los mencionados ajustes ¿Cual es el puntaje medio de los 50 alumnos?
8) Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40 zonas del país
Y1´=20 f2-f5=2 Y5´= 100 f1=4 f3=20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase.
a) Reconstruya los intervalos de clase y obtenga las frecuencias absolutas
b) Calcule la media, la mediana y moda e interprételos
c) Calcule la variancia, desviación estándar y coeficiente de variabilidad
9. Cuál de los siguientes grupos de intervalos de clase es correcto para agrupar datos sobre la edad registrada en años y meses cumplido? | a- 0-4.9; 5-9.9; 10-14.9; 15-19.9; 20-49.9; 50-79.9; 80-más. b- 0-5; 5-10; 10-15; 15-20; 21-más. c- 0-1; 2-3; 4-5; 6-7; 8-más. d- a y c son correctos. |
10. Comparando una serie de datos que se presenta, como una frecuencia simple con una serie de datos que se presenta como en una distribución de frecuencias de intervalos de clase, cuál de las siguientes propuestas es verdadera? | a- La media es más exacta, cuando se calcula en una distribución de intervalos de clase. b- No hay diferencias entre una y otra. c- La media es usualmente más exacta cuando calculamos de una distribución simple. d- El tamaño de los intervalos de clase tiene relativamente poca importancia. |
JUEGOS DE LÓGICA ONLINE
Slow and Blow
Coloca las bombas estratégicamente para que puedas acabar con el rey indeseado de este juego.
WEB GRAFIA:
http://190.121.143.77/textos/metodologia/estadistica/capitulo-iv.pdf
http://es.wikipedia.org/wiki/Estad%C3%ADstica
GOOGLE:
BUSQUEDA: EJERCICIOS DE MEDIDA DE TENDENCIA CENTRAL / OPCION #3
[DOC] Ejercicios: Medidas de Tendencia Central y Medidas de Variabilidad
tarwi.lamolina.edu.pe/~jporras/Medidas%20de%20TCyV.doc