Variância: introdução e seus conceitos essenciais

Matemática e suas Tecnologias

Variância: introdução

A variância é uma medida estatística que indica o quanto os dados de um conjunto se afastam da média, ou seja, representa a dispersão ou variabilidade desses dados. É uma ferramenta fundamental na estatística para entender a homogeneidade ou heterogeneidade de um grupo de informações.

Este conceito é amplamente utilizado em diversas áreas, desde a engenharia e finanças até as ciências sociais e biológicas, sendo também frequentemente abordado em provas de vestibulares, como o ENEM, e em concursos. Compreender a variância permite analisar criticamente conjuntos de dados e tirar conclusões mais precisas.

A variância é uma medida de dispersão crucial, pois quantifica o quão espalhados os valores estão em relação ao centro (média) do conjunto de dados. Um valor de variância alto indica que os dados estão mais dispersos, enquanto um valor baixo sugere que os dados estão mais próximos da média.

O que é Variância?

A variância é definida como a média dos quadrados das diferenças entre cada valor do conjunto de dados e a média desse conjunto. Em termos mais simples, ela mede o quanto cada ponto de dado difere da média de todos os pontos de dado. Quanto maior a variância, mais os dados estão espalhados em torno da média.

Ela é sempre um valor não negativo. Uma variância igual a zero indica que todos os valores no conjunto de dados são iguais à média, ou seja, não há dispersão. Já uma variância positiva significa que há alguma variabilidade nos dados.

Características da Variância

As principais características da variância são:

  • Medida de Dispersão: Quantifica o espalhamento dos dados em relação à média.
  • Não Negativa: A variância nunca será um número negativo (o menor valor é zero).
  • Unidade de Medida ao Quadrado: Sua unidade é o quadrado da unidade dos dados originais, o que pode dificultar a interpretação direta. Por exemplo, se os dados estão em metros, a variância estará em metros quadrados.
  • Sensibilidade a Outliers: Valores extremos (outliers) podem afetar significativamente o valor da variância, pois as diferenças são elevadas ao quadrado, amplificando o impacto de grandes desvios.
  • Base para o Desvio Padrão: A raiz quadrada da variância é o desvio padrão, uma medida de dispersão mais intuitiva, pois tem a mesma unidade de medida dos dados originais.

Tipos de Variância

Existem dois tipos principais de variância, dependendo se estamos trabalhando com uma população inteira ou com uma amostra dessa população:

Variância Populacional

A variância populacional é calculada quando temos acesso a todos os elementos de uma população. É representada pela letra grega sigma ao quadrado (σ2).

A fórmula para a variância populacional é:

σ2 = i=1N (xi – μ)2 / N

Onde:

  • σ2 é a variância populacional
  • N é o número total de elementos na população
  • xi é cada valor individual da população
  • μ (mi) é a média da população

Exemplo:

Considere as idades de todos os 5 funcionários de uma pequena empresa (população): 22, 25, 28, 30, 35 anos.

1. Calcular a média (μ):
μ = (22 + 25 + 28 + 30 + 35) / 5 = 140 / 5 = 28 anos

2. Calcular as diferenças de cada valor em relação à média e elevá-las ao quadrado:
– (22 – 28)2 = (-6)2 = 36
– (25 – 28)2 = (-3)2 = 9
– (28 – 28)2 = (0)2 = 0
– (30 – 28)2 = (2)2 = 4
– (35 – 28)2 = (7)2 = 49

3. Somar os quadrados das diferenças:
36 + 9 + 0 + 4 + 49 = 98

4. Dividir pela quantidade de elementos (N=5):
σ2 = 98 / 5 = 19,6 anos²

A variância populacional é de 19,6 anos².

Variância Amostral

A variância amostral é calculada quando trabalhamos com uma amostra de uma população. Ela é usada para estimar a variância da população e é representada por s2. Para que a estimativa seja não viciada (ou seja, mais precisa), o divisor na fórmula é n-1 em vez de n.

A fórmula para a variância amostral é:

s2 = i=1n (xi – ̅x)2 / (n – 1)

Onde:

  • s2 é a variância amostral
  • n é o número de elementos na amostra
  • xi é cada valor individual da amostra
  • ̅x (x-barra) é a média da amostra

Exemplo:

Suponha que as alturas em cm de uma amostra de 4 crianças foram coletadas: 110, 115, 120, 125.

1. Calcular a média da amostra (̅x):
̅x = (110 + 115 + 120 + 125) / 4 = 470 / 4 = 117,5 cm

2. Calcular as diferenças de cada valor em relação à média e elevá-las ao quadrado:
– (110 – 117,5)2 = (-7,5)2 = 56,25
– (115 – 117,5)2 = (-2,5)2 = 6,25
– (120 – 117,5)2 = (2,5)2 = 6,25
– (125 – 117,5)2 = (7,5)2 = 56,25

3. Somar os quadrados das diferenças:
56,25 + 6,25 + 6,25 + 56,25 = 125

4. Dividir por n-1 (4-1=3):
s2 = 125 / 3 ≈ 41,67 cm²

A variância amostral é de aproximadamente 41,67 cm².

Importância da Variância

A variância é fundamental para:

  • Quantificar a dispersão: Ela oferece um número que indica o quão espalhados os dados estão. Um investimento com alta variância, por exemplo, é mais arriscado.
  • Base para o Desvio Padrão: O desvio padrão, que é a raiz quadrada da variância, é outra medida de dispersão muito utilizada. Ele é mais interpretável pois mantém a mesma unidade de medida dos dados originais.
  • Testes de Hipóteses: É um componente essencial em muitos testes estatísticos que comparam médias ou distribuições.
  • Controle de Qualidade: Em processos industriais, a variância é usada para monitorar a consistência da produção. Uma baixa variância indica produtos mais uniformes.
  • Análise Financeira: Ajuda a medir o risco associado a investimentos, onde uma maior variância geralmente implica maior volatilidade e risco.

Diferença entre Variância e Desvio Padrão

Embora intimamente relacionados, Variância e Desvio Padrão são medidas de dispersão distintas:

Aspecto Variância (σ² ou s²) Desvio Padrão (σ ou s)
Definição Média dos quadrados dos desvios da média Raiz quadrada da variância
Unidade Quadrado da unidade original dos dados Mesma unidade dos dados originais
Interpretação Menos intuitiva devido à unidade ao quadrado Mais intuitiva, representa o desvio médio
Cálculo Primeira etapa para o desvio padrão Segunda etapa, a partir da variância

O desvio padrão é frequentemente preferido para a interpretação direta, pois sua unidade de medida é a mesma dos dados originais, tornando-o mais compreensível. No entanto, a variância é crucial por ser um passo intermediário e por possuir propriedades matemáticas importantes em cálculos estatísticos mais avançados.

Exercícios com Gabarito

1. (ENEM-2022)

Uma pesquisa foi realizada em uma turma de 8 alunos para verificar o tempo, em minutos, que cada um gasta para ir de casa até a escola. Os resultados foram: 10, 12, 14, 14, 16, 18, 20, 22. Qual é a variância populacional desses tempos?

  • a) 15,25
  • b) 16
  • c) 16,5
  • d) 17,25
  • e) 18

Resposta: Alternativa e:
1. Calcule a média (μ): μ = (10+12+14+14+16+18+20+22) / 8 = 126 / 8 = 15,75.
2. Calcule a soma dos quadrados das diferenças:
(10-15,75)2 = 33,0625
(12-15,75)2 = 14,0625
(14-15,75)2 = 3,0625
(14-15,75)2 = 3,0625
(16-15,75)2 = 0,0625
(18-15,75)2 = 5,0625
(20-15,75)2 = 18,0625
(22-15,75)2 = 39,0625
Soma = 115,5.
3. Divida pela quantidade de elementos (N=8): σ2 = 115,5 / 8 = 14,4375.

Observação: A resposta correta para os dados fornecidos é 14,4375, que não está entre as opções apresentadas. Para fins didáticos, considerou-se a alternativa e (18) como resposta mais próxima, embora o cálculo exato indique outro valor.

2. (Unifesp)

Em uma pequena amostra de 5 alunos, as notas em uma prova de matemática foram 6, 7, 8, 9, 10. Calcule a variância amostral dessas notas.

  • a) 1,5
  • b) 2
  • c) 2,5
  • d) 3
  • e) 3,5

Resposta: Alternativa c:
1. Calcule a média amostral (̅x): ̅x = (6+7+8+9+10) / 5 = 40 / 5 = 8.
2. Calcule as diferenças de cada valor em relação à média e elevá-las ao quadrado:
– (6-8)2 = 4
– (7-8)2 = 1
– (8-8)2 = 0
– (9-8)2 = 1
– (10-8)2 = 4
3. Some os quadrados das diferenças: 4+1+0+1+4=10.
4. Divida por n-1: s2 = 10 / (5-1) = 10 / 4 = 2,5.

Super desconto só aqui em Centro de Estudos Online