4.6.4. El número que explica
1. Introducción
Si recuerdas, cuando comenzamos esta experiencia preguntando sobre cuánto tiempo nos iríamos de viaje de estudios, o cuánto dinero nos podíamos gastar, quizá te sorprendiera la disparidad de las respuestas a algunas preguntas. Por ejemplo, algunos de tus compañeros querrían irse menos tiempo de viaje que tú. Otros estarían dispuestos a gastar más dinero para hacer un viaje con mejores servicios.
¿Cómo representa el valor elegido a todos los de una población?.
Por ejemplo, si la media de días que queréis ir de viaje es 5 días y la mayoría de respuestas son cercanas, por ejemplo, 4 o 6 días, podemos decir que la media representa el sentir general de la clase. Pero si había compañeros que sólo querían ir 2 días de viaje y otros estar 10, la media calculada podría no ser tan buena y no dejara contento a nadie.
Los parámetros de dispersión nos permiten medir esa dispersión de los datos, completando la representatividad de los parámetros de centralización a los que están asociados.
En este apartado vamos a estudiar este tipo de medidas de dispersión asociadas a la media.
Lectura facilitada
Recuerda cuando se preguntó por los días que querías ir de viaje
y el dinero que podrías gastar.
Cada compañero y compañera respondió algo diferente.
Ahora, ¿cómo se representa la media de toda la población?
Por ejemplo: la mayoría de compañeros y compañeras
han elegido 4 o 6 días para ir de viaje.
La media de días para ir de viaje es 5 días.
La media representa a los compañeros que han elegido 4 o 6 días.
Pero hay compañeros y compañeras que quieren ir 2 o 10 días.
Para esos compañeros y compañeras la media de 5 días
son pocos días de viaje y no están contentos.
Los parámetros de dispersión nos ayudan a analizar lo cerca
o lo lejos que están los datos de una medida.
Por ejemplo, lo cerca o lo lejos que están de la media.
Ahora vas a estudiar la medida de dispersión asociada a la media.
2. Desviación típica
Las dos medidas de dispersión más usadas son la desviación típica y la varianza.
La varianza se representa por \( \sigma^2 \).
La desviación típica se define como la raíz cuadrada de la varianza y se representa por la letra griega \( \sigma \).
La desviación típica y la varianza miden la dispesión de los datos con respecto a la media, es decir, lo "lejos o cerca" que están estos valores que toma la variable con respecto a la media.
Así, si los datos están lejos de la media, la desviación típica y la varianza serán grandes y si están concentrados respecto a ella, serán pequeñas.
¿Y por que hay dos medidas si sirven para lo mismo?
Pues porque la varianza es más sencilla de calcular, pero viene expresada en las mismas unidades que la variable pero al cuadrado, lo que hace más difícil su interpretación.
Y la desviación típica se tarda más en calcular, pero viene expresada en las mismas unidades que la variable y es más fácil de interpretar. La desviación típica es la que más vas a usar.
Veamos un ejemplo para entenderlo bien.
Las respuestas obtenidas al preguntar los días que queremos irnos de vacaciones en dos de los grupos en que hemos dividido la clase han sido:
Grupo 1: 3, 4, 6, 7 Media = 5 días Varianza = 2.5 dias2 Desviación típica = 1.58 días |
Grupo 2: 1, 2, 8, 9 Media = 5 días Varianza = 12.5 dias2 Desviación típica = 3.53 días |
En el próximo apartado verás cómo se calcula la varianza y la desviación típica.
Primero fíjate en la varianza, viene expresada en días2, que no se entiende muy bien qué es.
Y ahora fíjate en los valores que toma la varianza y la desviación típica. Las dos medidas son más pequeñas en el grupo 1, y los valores del grupo 3, 4, 6, y 7 están todos "más cerca" de la media que los valores del grupo dos 1, 2, 8 y 9.
Como en el grupo 1 la varianza y la desviación típica son más pequeñas que en el grupo 2 puedes afirmar que la media del grupo 1 representa mejor lo que los integrantes del grupo quieren.
Lectura facilitada
Las medidas de dispersión más utilizadas son la varianza y la desviación típica.
La varianza se representa \( \sigma ^2 \).
La desviación típica es la raíz cuadrada de la varianza.
La desviación típica se representa \( \sigma \).
La varianza y la desviación típica miden lo cerca o lejos
que están los datos de la media.
La varianza es más sencilla de calcular.
La varianza es más difícil de interpretar, se mide en unidades al cuadrado.
La desviación típica se tarda más en calcular.
La desviación típica se mide en la misma unidad que la variable.
Ejemplo:
En un grupo de cuatro alumnos, los votos con el número de días que ir de vacaciones son: 3 días, 4 días, 6 días y 7 días.
La media es 5 días, la varianza es 2.5 días y la desviación típica es 1.58 días.
En otro grupo los votos han sido: 1 día, 2 días, 8 días y 9 días.
La media es 5 días, la varianza 12.5 días y la desviación típica 3.53 días.
Los votos del primer grupo están más cerca de la media que los votos del segundo grupo.
Por eso, la varianza y la desviación típica del primer grupo es menor.
Notación matemática
A la columna que usamos para calcular la desviación típica se le llama xi2·ni.
3. ¡Vamos con un ejemplo!
Siempre se calcula primero la varianza, y después se calcula la desviación típica haciendo la raíz cuadra de la varianza.
Para calcular la varianza, añadimos una nueva columna a la tabla de frecuencias, que ya hemos empleado en la media. En ella multiplicaremos el cuadrado de cada una de las modalidades de la variable por su frecuencia. Posteriormente, sumaremos los valores de dicha columna, la dividimos entre el tamaño de la población y restamos el cuadrado de la media.
Observa cómo se hace paso a paso:
1. Añade una columna para calcular la varianza
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | |
4 | 7 | 28 | |
5 | 8 | 40 | |
6 | 6 | 36 | |
7 | 4 | 28 | |
Totales | 30 | 147 |
2. Completa la primera fila elevando al cuadrado la modalidad y multiplicando por su frecuencia
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | |
5 | 8 | 40 | |
6 | 6 | 36 | |
7 | 4 | 28 | |
Totales | 30 | 147 |
3. Completa la segunda fila elevando al cuadrado la modalidad y multiplicando por su frecuencia
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | \( 4^2 \cdot 7 =112 \) |
5 | 8 | 40 | |
6 | 6 | 36 | |
7 | 4 | 28 | |
Totales | 30 | 147 |
4. Completa todas las filas de las modalidades de la misma manera, elevando al cuadrado la modalidad y multiplicando por su frecuencia
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | \( 4^2 \cdot 7 =112 \) |
5 | 8 | 40 | \( 5^2 \cdot 8 = 200 \) |
6 | 6 | 36 | \( 6^2 \cdot 6 = 216 \) |
7 | 4 | 28 | \( 7^2 \cdot 4 =196 \) |
Totales | 30 | 147 |
5. Completa la fila de los totales sumando todos los valores de esa columna
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | \( 4^2 \cdot 7 =112 \) |
5 | 8 | 40 | \( 5^2 \cdot 8 = 200 \) |
6 | 6 | 36 | \( 6^2 \cdot 6 = 216 \) |
7 | 4 | 28 | \( 7^2 \cdot 4 =196 \) |
Totales | 30 | 147 | 769 |
6. Calcula la varianza dividiendo el total de la columna para la varianza entre el tamaño de la muestra y restándole la media al cuadrado
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | \( 4^2 \cdot 7 =112 \) |
5 | 8 | 40 | \( 5^2 \cdot 8 = 200 \) |
6 | 6 | 36 | \( 6^2 \cdot 6 = 216 \) |
7 | 4 | 28 | \( 7^2 \cdot 4 =196 \) |
Totales | 30 | 147 | 769 |
\( \sigma^2 = \displaystyle \frac{769}{30} -4.9^2 =1.62 \)
7. Calcula la desviación típica haciendo la raíz cuadrada de la varianza
Días que queremos irnos de viaje | Frecuencia absoluta |
Columna de la media \( x_i \cdot n_i \) |
Columna de la varianza \(x_i^2 \cdot n_i \) |
3 | 5 | 15 | \( 3^2 \cdot 5 =45 \) |
4 | 7 | 28 | \( 4^2 \cdot 7 =112 \) |
5 | 8 | 40 | \( 5^2 \cdot 8 = 200 \) |
6 | 6 | 36 | \( 6^2 \cdot 6 = 216 \) |
7 | 4 | 28 | \( 7^2 \cdot 4 =196 \) |
Totales | 30 | 147 | 769 |
\( \sigma = \displaystyle \sqrt{1.62}=1.27 \)
Si los datos están agrupados en intervalos tienes que utilizar las marcas de clase en vez de las modalidades, igual que en el cálculo de la media.
Lectura facilitada
Primero se calcula la varianza.
Para calcular la desviación típica tienes que hacer
la raíz cuadrada de la varianza. \( \sqrt{\sigma^2}\)
Para calcular la varianza añadimos una columna nueva a la tabla de frecuencias.
Multiplicamos el cuadrado de cada modalidad por su frecuencia absoluta \( x_i ^2 \cdot n_i \)
Recuerda que la modalidad son las respuestas que tienes.
Luego sumaremos los valores de la columna nueva
y dividimos el resultado entre el tamaño de la población.
Por último, restamos el cuadrado de la media.
¿Por qué se hacen esos cálculos?
¿Quieres saber por qué hay que hacer todas esas cuentas para calcular la varianza y la desviación media?
Con estas medidas pretendes averiguar si los valores que toma la variable están cerca o lejos de la media.
Si le restas a la media el valor de la variable obtienes la distancia a la que se encuentra.
\( \overline{x} -x_i \)
Pero cuando el valor es más pequeño que la media sale positivo y cuando el valor es mayor sale negativo, y si sumas los resultados se cancelan unos con otros y no te sirve el resultado.
Para evitar ese problema, antes de realizar la suma elevas el resultado al cuadrado y obtienes siempre un número positivo.
\( \left( \overline{x} -x_i \right) ^2\)
La varianza se define como la media de todas esas distancias al cuadrado. Por tanto, para calcularla tienes que multiplicar cada distancia por su frecuencia, sumar y dividir por el tamaño de la muestra.
\( \sigma^2 = \frac{\Sigma \left( \overline{x}-x_i \right) ^2 \cdot n_i}{N} \)
Para realizar los cálculos esta fórmula no es muy apropiada, pero desarrollando su expresión se obtiene otra que resulta más sencilla de utilizar.
\( \sigma^2 = \frac{\Sigma x_i ^2 \cdot n_i}{N}-\overline{x}^2 \)
Si te fijas esta es la fórmula que hemos usado para calcular la varianza.
Por último, si quieres una fórmula para calcular la desviación típica sólo tienes que hacer la raíz cuadrada de la varianza:
\( \sigma =\displaystyle \sqrt{\displaystyle \frac{\Sigma x_i ^2 \cdot n_i}{N}-\overline{x}^2} \)
4. ¡No te desvíes!
¡Anímate a elegir más de una de las siguientes opciones de esta actividad! En cada una de ellas descubrirás las características y la utilidad de los desviación típica para interpretar datos de una encuesta.
Opción A: Calcula tú la desviación típica paso a paso
Vamos a calcular la desviación típica en un ejercicio muy parecido.
Días que queremos irnos de viaje | Frecuencia absoluta |
2 | 1 |
3 | 4 |
4 | 4 |
5 | 1 |
Totales | 10 |
Lo primero es completar la tabla con la columna que usamos para la media (que vamos a llamar Columna de la media) y una nueva columna que llamaremos Columna de la varianza.
Dale al botón empezar y sigue los pasos que se indican.
Opción B: Calcula la desviación típica sin ayuda
Calcula la desviación típica de este ejemplo:
Dinero que queremos gastar en el viaje | Marca de clase | Frecuencia |
[0,200) | 100 | 6 |
[200,400) | 300 | 9 |
[400,600) | 500 | 12 |
[600,800) | 700 | 3 |
Totales | 30 |
Retroalimentación
La desviación típica vale 183.30 €
Si no te ha salido eso puedes ver cómo se calcula avanzando en esta presentación
1. Añade una columna para calcular la media
Dinero que queremos gastar en el viaje | Marca de clase | Frecuencia |
Columna para la media \( x_i \cdot n_i \) |
[0,200) | 100 | 6 | 600 |
[200,400) | 300 | 9 | 2700 |
[400,600) | 500 | 12 | 6000 |
[600,800) | 700 | 3 | 2100 |
Totales | 30 | 11400 |
2. Calcula la media
Dinero que queremos gastar en el viaje | Marca de clase | Frecuencia |
Columna para la media \( x_i \cdot n_i \) |
[0,200) | 100 | 6 | 600 |
[200,400) | 300 | 9 | 2700 |
[400,600) | 500 | 12 | 6000 |
[600,800) | 700 | 3 | 2100 |
Totales | 30 | 11400 |
Divide el total de la columna de la media entre el tamaño de la población:
\( \overline{x}=\displaystyle \frac{11400}{30}=380 \quad € \)
3. Añade una columna para calcular la varianza
Dinero que queremos gastar en el viaje | Marca de clase | Frecuencia |
Columna para la media \( x_i \cdot n_i \) |
Columna para la varianza \(x_i ^2 \cdot n_i \) |
[0,200) | 100 | 6 | 600 | 60000 |
[200,400) | 300 | 9 | 2700 | 810000 |
[400,600) | 500 | 12 | 6000 | 3000000 |
[600,800) | 700 | 3 | 2100 | 1470000 |
Totales | 30 | 11400 | 5340000 |
4. Calcula la varianza
Dinero que queremos gastar en el viaje | Marca de clase | Frecuencia |
Columna para la media \( x_i \cdot n_i \) |
Columna para la varianza \(x_i ^2 \cdot n_i \) |
[0,200) | 100 | 6 | 600 | 60000 |
[200,400) | 300 | 9 | 2700 | 810000 |
[400,600) | 500 | 12 | 6000 | 3000000 |
[600,800) | 700 | 3 | 2100 | 1470000 |
Totales | 30 | 11400 | 5340000 |
Divide el total de la columna de la varianza entre el tamaño de la población y réstale la media al cuadrado.
\( \sigma^2=\displaystyle \frac{5340000}{30}-380^2=33600 \quad €^2 \)
5. Calcula la desviación típica
Haz la raíz cuadrada de la varianza.
\(\sigma = \sqrt{33600}=183.30 € \)
Opción C: Analiza y completa
Lea y complete
Opción D: Obtén los datos, calcula y analiza
Es tu turno de elaborar una tabla con datos que hayas obtenido entre tus compañeros y calcular la desviación típica.
Debes hacer lo siguiente:
- Pregunta a 10 personas (compañeros de otra clase, familiares o amigos) el número de días que les gustaría irse de viaje.
- Elabora una tabla con las columnas necesarias para el cálculo de la media y la desviación típica en tu cuaderno.
- Analiza lo bien que la media representa las respuestas de todos fijándote en el valor que has obtenido de la desviación típica.
- Compara tus resultados con los obtenidos por dos compañeros de clase fijándote en los valores de la media y de la desviación típica que habéis obtenido.
Clavis dice ¡No pierdas la perspectiva!
Aunque vimos que las medidas de tendencia central son muy cómodas, has podido comprobar que, en ocasiones, reducirlo todo a un número nos hace perder la perspectiva de la realidad. Las medidas de dispersión nos ayudan a matizar ese número que resume. Debes tener esto en cuenta para cuando te enfrentes a la tarea final.
Obra publicada con Licencia Creative Commons Reconocimiento Compartir igual 4.0