El siguiente Blog se presenta como recurso didactico para el contenido programatico de Estadistica General de la facultad de Educación de la Universidad José María Vargas. Con el contenido y las actividades presentadas en blog, acompañado del trabajo del alumno se logrará un óptimo aprendizaje.
Una medida del grado de variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable.
Lo mas frecuente, sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de tendencia central.
Para las variables cuantitativas, las medidas de dispersión mas utilizadas son la desviación media y la desviación típica.
Desviación media (DM)
Se conoce también como promedio de desviación. Es igual a la media aritmética de las desviaciones de una serie de valores respecto de su media aritmética. Para una serie de N valores: X1, X2, X3,… Xn, se define a través de la siguiente expresión:
Desviación típica (S):
Se define como la raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos con respecto a la medida aritmética y se considera como el indicador de variación o dispersión más importante.
Coeficiente de variación (CV)
Se define como el cociente que resulta de dividir la desviación típica entre la medida aritmética de la serie de datos, multiplicado luego por cien para que su resultado venga expresado en porcentaje.
Varianza (S2)
La varianza se define como el cuadrado de la desviación típica. Su mayor utilidad se presenta en la estadística inductiva. Se puede determinar como una medida de variación promedio y se obtiene dividiendo la variación total por el número de medidas.
Coeficiente de Shepeard (CS)
Se define como el cociente que resulta de dividir el intervalo de clases al cuadrado entre doce para luego restarlo con la varianza para ser utilizado en las distribuciones cuando ya se debe haber hecho un examen completo de la situación.
Parámetros estadísticos. Medidas de centralización. Media aritmética. Mediana. Moda
Parámetro Estadístico
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
De centralización. Nos indican en torno a qué valor (centro) se distribuyen los datos
De posición dividen un conjunto de datos en grupos con el mismo número de individuos.
De dispersión. nos informan sobre cuánto se alejan del centro los valores de la distribución.
MEDIDAS DE TENDENCIA CENTRA
De centralización
Es un valor, que es típico o representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.
Se pueden definir varios tipos de medidas de tendencia central, las más comunes son la media aritmética o brevemente media, la mediana y la moda
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Es un valor, que es típico o representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una distribución.
La media aritmética
La media aritmética o media de un conjunto de N números se representa por
Observaciones sobre la media aritmética
1 La media se puede hallar sólo para variables cuantitativas.
2 La media es independiente de las amplitudes de los intervalos.
3 La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
4 La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
Ejemplo para datos NO agrupados
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Ejemplo para datos agrupados
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
Mediana
Definición de mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativa
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me= 9.5
Cálculo de la mediana para datos agrupados
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
Moda
La moda es el valor que más se repite en una distribución.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
La moda es el valor que más se repite en una distribución
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
. Cálculo de la moda para datos agrupados
los intervalos tienen la misma amplitud.
. Ejemplo
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
2º Los intervalos tienen amplitudes distintas.
. Ejemplo
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de frecuencias de todas las clases y se expresa generalmente como el porcentaje.
Ejemplo: La frecuencia relativa de 66-68 de la tabla es
14/80 =0,175
17,5%
La suma de todas las frecuencias de todas las clases da 100%
Frecuencias Acumuladas
La frecuencia total de todo los valores menores que el límite real superior de clase de un intervalo inclusive.
Por ejemplo: la frecuencia acumulada hasta el intervalo de clase 66 -68 inclusive en la tabla es
12 + 16 + 14 = 42, el significado es que 42 estudiantes tienen alturas menores a 68,5.
La tabla que representa las frecuencias acumuladas se llama distribución de frecuencias acumuladas.
Hay casos que es preferible considerar una distribución de frecuencia acumulada de todos los valores mayores o iguales al límite inferior real
Frecuencias Relativas Acumuladas
Es frecuencia acumulada dividida por el total de frecuencias se expresa generalmente como el porcentaje.
Ejemplo: La frecuencia relativa de 66-68 de la tabla de frecuencias acumuladas menor que es: 42/80 =0,525 5
La última frecuencia acumulada que es “menor que 74,5” da 100%
Tipos de Curvas de Frecuencias
Las curvas de frecuencias presentan determinadas formas características:
1. Las curvas de frecuencias simétricas o bien formadas se caracterizan por el hecho de que las observaciones del máximo central tienen las misma frecuencias.
2. Las curvas de frecuencias moderadamente asimétrica se caracterizan por la cola de la curva a un lado del máximo central es mayor.
3. Las curvas en forma de J o de J invertida, el máximo se presenta en un extremo.
4. Las curvas en forma U, tiene el máximo en ambos extremos.
5. Las curvas de frecuencias bimodal, tiene dos máximo.
6. Las curvas de frecuencias multimodal, tiene más de dos máximo.