Desvio padrão: introdução
Desvio padrão é uma medida estatística que indica o grau de dispersão ou variabilidade de um conjunto de dados em relação à sua média. Em outras palavras, ele nos diz o quão “espalhados” ou “agrupados” os valores de um conjunto estão.
Quando falamos em análise de dados, entender a variabilidade é tão importante quanto conhecer o valor central (a média). O desvio padrão nos fornece essa informação de forma quantitativa, permitindo comparações mais precisas entre diferentes conjuntos de dados.
Estudar o desvio padrão é fundamental para estudantes que se preparam para vestibulares e o ENEM, pois ele é frequentemente cobrado em questões que envolvem interpretação de gráficos, tabelas e análise estatística.
Características do Desvio Padrão
As principais características do desvio padrão são:
- Medida de Dispersão: Sua função primária é quantificar a variabilidade dos dados.
- Sensível a Valores Extremos: Valores muito distantes da média influenciam significativamente o desvio padrão.
- Unidade de Medida: Possui a mesma unidade de medida dos dados originais. Se os dados são em metros, o desvio padrão também será em metros.
- Não Negativo: O desvio padrão é sempre maior ou igual a zero. Um desvio padrão zero indica que todos os valores do conjunto são idênticos.
- Comparabilidade: Permite comparar a dispersão entre diferentes conjuntos de dados, mesmo que suas médias sejam distintas.
O que Significa um Desvio Padrão Alto ou Baixo?
A interpretação do valor do desvio padrão depende do contexto. Geralmente, podemos fazer as seguintes considerações:
Desvio Padrão Baixo
Um desvio padrão baixo indica que os valores do conjunto de dados tendem a estar próximos da média. Isso sugere que os dados são mais homogêneos e previsíveis.
Por exemplo, se medirmos a altura de um grupo de crianças de uma mesma turma, e o desvio padrão for baixo, significa que a maioria das crianças tem alturas semelhantes à média da turma.
Desvio Padrão Alto
Um desvio padrão alto indica que os valores do conjunto de dados estão mais dispersos em relação à média. Isso sugere que os dados são mais heterogêneos e menos previsíveis.
Se, em outro exemplo, medirmos a população de cidades brasileiras, o desvio padrão será alto. Isso ocorre porque existem cidades muito grandes (como São Paulo) e cidades muito pequenas, distantes da média populacional.
Cálculo do Desvio Padrão
O cálculo do desvio padrão envolve algumas etapas. Vamos considerar um conjunto de dados amostral, que é o mais comum em estudos estatísticos.
Etapa 1: Calcular a Média (x̄)
Some todos os valores do conjunto de dados e divida pelo número total de valores (n).
Etapa 2: Calcular os Desvios em Relação à Média
Para cada valor (xi) no conjunto de dados, subtraia a média: (xi – x̄).
Etapa 3: Elevar os Desvios ao Quadrado
Eleve ao quadrado cada um dos desvios calculados na etapa anterior: (xi – x̄)². Isso garante que todos os valores sejam positivos e dá maior peso aos desvios maiores.
Etapa 4: Calcular a Variância Amostral (s²)
Some todos os desvios quadrados e divida pelo número de observações menos um (n – 1). Esta é a variância amostral.
$$ s^2 = \frac{\sum_{i=1}^{n} (x_i – \bar{x})^2}{n-1} $$
Etapa 5: Calcular o Desvio Padrão Amostral (s)
Extraia a raiz quadrada da variância amostral. Este é o desvio padrão amostral.
$$ s = \sqrt{s^2} = \sqrt{\frac{\sum_{i=1}^{n} (x_i – \bar{x})^2}{n-1}} $$
Observação: Se estivermos lidando com uma população inteira (e não uma amostra), dividimos por ‘n’ na Etapa 4, e o símbolo para o desvio padrão populacional é a letra grega sigma (σ).
Exemplo de Cálculo do Desvio Padrão
Vamos calcular o desvio padrão de um pequeno conjunto de dados: as notas de 5 alunos em uma prova: {7, 8, 6, 9, 5}.
Etapa 1: Calcular a Média
$$ \bar{x} = \frac{7 + 8 + 6 + 9 + 5}{5} = \frac{35}{5} = 7 $$
A média das notas é 7.
Etapa 2: Calcular os Desvios em Relação à Média
- (7 – 7) = 0
- (8 – 7) = 1
- (6 – 7) = -1
- (9 – 7) = 2
- (5 – 7) = -2
Etapa 3: Elevar os Desvios ao Quadrado
- 0² = 0
- 1² = 1
- (-1)² = 1
- 2² = 4
- (-2)² = 4
Etapa 4: Calcular a Variância Amostral
$$ s^2 = \frac{0 + 1 + 1 + 4 + 4}{5 – 1} = \frac{10}{4} = 2.5 $$
A variância amostral é 2.5.
Etapa 5: Calcular o Desvio Padrão Amostral
$$ s = \sqrt{2.5} \approx 1.58 $$
O desvio padrão das notas é aproximadamente 1.58. Isso indica que, em média, as notas se afastam cerca de 1.58 pontos da média de 7.
Importância do Desvio Padrão na Análise de Dados
O desvio padrão é uma ferramenta essencial em diversas áreas:
- Mercado Financeiro: Para avaliar o risco de um investimento, onde um desvio padrão maior geralmente indica maior volatilidade.
- Controle de Qualidade: Para monitorar a consistência de produtos em linhas de produção.
- Pesquisas Científicas: Para analisar a variabilidade em experimentos e estudos.
- Medicina: Para entender a variação normal em parâmetros de saúde (como pressão arterial) em uma população.
Compreender o desvio padrão permite ir além da média, oferecendo uma visão mais completa da distribuição e da confiabilidade dos dados.
Exercícios com Gabarito
1. (ENEM 2021) Uma escola oferece aos seus alunos duas opções de cursos de idiomas: inglês e espanhol. As turmas de inglês têm, em média, 30 alunos, com um desvio padrão de 2 alunos. As turmas de espanhol têm, em média, 28 alunos, com um desvio padrão de 4 alunos.
Com base nessas informações, é correto afirmar que:
- a) As turmas de inglês são mais numerosas que as de espanhol.
- b) O número de alunos nas turmas de espanhol é mais variável que nas de inglês.
- c) O número de alunos nas turmas de inglês é mais variável que nas de espanhol.
- d) A média de alunos em ambas as turmas é a mesma.
- e) O número de alunos nas turmas de espanhol é mais consistente que nas de inglês.
Resposta: Alternativa b: O desvio padrão é uma medida de variabilidade. Como o desvio padrão das turmas de espanhol (4 alunos) é maior que o das turmas de inglês (2 alunos), o número de alunos nas turmas de espanhol é mais variável.
2. (Vestibular – Adaptado) Um professor calculou o desvio padrão das notas de seus alunos em uma prova e obteve o valor de 0. Ele pode concluir que:
- a) A prova foi muito difícil, e todos os alunos tiraram notas baixas.
- b) A prova foi muito fácil, e todos os alunos tiraram notas altas.
- c) Todos os alunos obtiveram exatamente a mesma nota.
- d) A média das notas foi zero.
- e) Metade dos alunos tirou notas abaixo da média e metade acima.
Resposta: Alternativa c: Um desvio padrão igual a zero significa que não há dispersão nos dados. Isso ocorre quando todos os valores são idênticos, ou seja, todos os alunos tiraram a mesma nota.