segunda-feira, 13 de julho de 2020

A mediana e a amplitude inter-quartis

Uma outra forma de sumarizar dados é em termos dos quantis ou percentis. Essas medidas são particularmente úteis para dados não simétricos.
A mediana (ou percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e. metade dos dados têm valores maiores do que a mediana, a outra metade tem valores menores do que a mediana.
Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados.
Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo.
Eles são obtidos ordenando os dados do menor para o maior, e então conta-se o número apropriado de observações: ou seja é $ \frac{n+1}{4}$, $ \frac{n+1}{2}$ e $ \frac{3(n+1)}{4}$ para o quartil inferior, mediana e quartil superior, respectivamente.
Para um número par de observações, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior).
A medidade de dispersão é a amplitude inter-quartis, IQR $ =$ Q3 $ -$ Q1, i.e. é a diferença entre o quartil superior e o inferior.
Exemplo. O número de crianças em 19 famílias foi
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10
A mediana é o (19+1) / 2 = $ 10^{o}$ valor, i.e. 3 crianças.
O quartil inferior e superior são os valores $ 5^{o}$ e $ 15^{o}$, i.e. 2 e 6 crianças, portanto amplitude inter-quartil é de 4 crianças. Note que 50% dos dados estão entre os quartis inferior e superior.

leg.ufpr.br

Nenhum comentário:

Postar um comentário