Distribuição normal: introdução
A distribuição normal é um dos conceitos mais importantes e amplamente utilizados em probabilidade e estatística. Ela descreve como os valores de uma variável aleatória contínua se distribuem em torno de uma média.
Conhecida também como curva de Gauss ou curva em forma de sino, a distribuição normal é fundamental para modelar fenômenos naturais e sociais. Ela aparece em diversos campos, desde a biologia e física até as ciências sociais e engenharia.
Compreender a distribuição normal é crucial para a interpretação de dados, realização de testes de hipóteses e tomada de decisões em muitas áreas. Seu estudo é essencial para estudantes de Ensino Médio, vestibulandos e universitários.
Características
As principais características da distribuição normal, que dão origem à sua famosa forma de sino, são:
- Simetria: A curva é simétrica em relação à sua média, o que significa que 50% dos dados estão à direita da média e 50% à esquerda.
- Média, Mediana e Moda Coincidem: No centro da distribuição, a média, a mediana e a moda têm o mesmo valor.
- Formato de Sino: A curvatura se eleva gradualmente até um ponto máximo na média e depois decai gradualmente nas extremidades, aproximando-se do eixo horizontal sem tocá-lo.
- Assintótica ao Eixo Horizontal: As “caudas” da curva se estendem infinitamente em ambas as direções, aproximando-se do eixo das abscissas, mas nunca o tocando. Isso indica que, embora improváveis, todos os valores são teoricamente possíveis.
- Área Total Sob a Curva é 1 (ou 100%): A área total compreendida entre a curva e o eixo horizontal é igual a 1, representando a probabilidade total de todos os eventos.
- Determinada por Média e Desvio Padrão: A forma da curva é definida por dois parâmetros: a média (μ), que determina a posição do centro da curva, e o desvio padrão (σ), que determina sua “largura” ou dispersão.
Parâmetros da Distribuição Normal
A forma e a posição de uma distribuição normal são completamente determinadas por apenas dois parâmetros. Compreender esses parâmetros é fundamental para interpretar a curva.
- Média (μ): A média é o valor central da distribuição, indicando a localização do pico da curva. Se a média aumenta, a curva se desloca para a direita; se diminui, ela se desloca para a esquerda.
- Desvio Padrão (σ): O desvio padrão mede a dispersão ou a variabilidade dos dados em torno da média.
- Se o desvio padrão é grande, a curva será mais larga e achatada, indicando que os dados estão mais espalhados.
- Se o desvio padrão é pequeno, a curva será mais estreita e alta, indicando que os dados estão mais concentrados próximos à média.
Distribuição Normal Padrão (Z)
Uma variação muito importante da distribuição normal é a Distribuição Normal Padrão. Ela é uma distribuição normal específica com média igual a 0 (μ = 0) e desvio padrão igual a 1 (σ = 1).
Qualquer valor X de uma distribuição normal qualquer pode ser convertido em um valor Z da distribuição normal padrão usando a fórmula de padronização:
Z = (X − μ) / σ
Onde:
- Z é o valor padronizado (escore Z).
- X é o valor na distribuição original.
- μ é a média da distribuição original.
- σ é o desvio padrão da distribuição original.
Essa padronização permite comparar dados de diferentes distribuições normais, independentemente de suas médias e desvios padrão originais. As tabelas da distribuição normal padrão (tabela Z) são amplamente utilizadas para calcular probabilidades associadas a diferentes valores de Z.
A Regra Empírica (68-95-99,7)
Uma característica prática e muito útil da distribuição normal é a Regra Empírica, também conhecida como regra 68-95-99,7. Ela descreve a porcentagem aproximada de valores que caem dentro de um certo número de desvios padrão da média.
- Aproximadamente 68% dos dados estão dentro de 1 desvio padrão da média (μ ± 1σ).
- Aproximadamente 95% dos dados estão dentro de 2 desvios padrão da média (μ ± 2σ).
- Aproximadamente 99,7% dos dados estão dentro de 3 desvios padrão da média (μ ± 3σ).
Essa regra oferece uma forma rápida de entender a concentração dos dados em distribuições normais, sem a necessidade de cálculos complexos.
Exemplo de Aplicação
Para compreender melhor a distribuição normal e a Regra Empírica, considere o exemplo abaixo:
Exemplo:
A altura dos homens adultos em uma determinada população segue uma distribuição normal com média de 175 cm e desvio padrão de 7 cm.
1. Qual porcentagem de homens tem altura entre 168 cm e 182 cm?
2. Qual porcentagem de homens tem altura entre 161 cm e 189 cm?
No exemplo acima, podemos identificar:
- Média (μ) = 175 cm
- Desvio padrão (σ) = 7 cm
Analisando a pergunta 1:
- 168 cm representa μ − 1σ (175 − 7 = 168)
- 182 cm representa μ + 1σ (175 + 7 = 182)
De acordo com a Regra Empírica, aproximadamente 68% dos homens têm altura entre 168 cm e 182 cm.
Analisando a pergunta 2:
- 161 cm representa μ − 2σ (175 − (2×7) = 175 − 14 = 161)
- 189 cm representa μ + 2σ (175 + (2×7) = 175 + 14 = 189)
De acordo com a Regra Empírica, aproximadamente 95% dos homens têm altura entre 161 cm e 189 cm.
Exercícios com Gabarito
1. (ENEM-2022)
Uma pesquisa sobre o tempo de duração da bateria de um novo modelo de smartphone indicou que a duração segue uma distribuição normal com média de 24 horas e desvio padrão de 2 horas. Usando a regra empírica (68-95-99,7), qual intervalo de tempo inclui aproximadamente 95% das baterias testadas?
- a) Entre 22 e 26 horas
- b) Entre 20 e 28 horas
- c) Entre 23 e 25 horas
- d) Entre 18 e 30 horas
- e) Entre 21 e 27 horas
Resposta: Alternativa b: A regra empírica afirma que aproximadamente 95% dos dados estão dentro de 2 desvios padrão da média. Com média (μ) = 24 horas e desvio padrão (σ) = 2 horas, o intervalo é μ ± 2σ, ou seja, 24 ± (2 × 2) = 24 ± 4. Isso resulta no intervalo de 20 a 28 horas.
2. (VESTIBULAR-2021)
Em um teste de QI, as pontuações dos participantes seguem uma distribuição normal com média de 100 pontos e um desvio padrão de 15 pontos. Qual a porcentagem aproximada de indivíduos cuja pontuação no teste de QI está entre 85 e 115 pontos?
- a) 68%
- b) 95%
- c) 99,7%
- d) 50%
- e) 75%
Resposta: Alternativa a: A média é 100 pontos e o desvio padrão é 15 pontos. O intervalo de 85 a 115 pontos corresponde a μ ± 1σ, pois 100 − 15 = 85 e 100 + 15 = 115. Pela regra empírica, aproximadamente 68% dos dados estão dentro de 1 desvio padrão da média.