Resumo de Estatística
A estatística é um ramo da matemática que se dedica à coleta, organização, análise, interpretação e apresentação de dados. Seu objetivo é compreender fenômenos, fazer previsões e tomar decisões baseadas em informações numéricas.
No contexto escolar e de vestibulares como o ENEM, a estatística é fundamental para interpretar gráficos, tabelas e resultados de pesquisas, sendo uma ferramenta essencial para a análise crítica de situações do cotidiano e de diversas áreas do conhecimento. Dominar seus conceitos permite decifrar o mundo à nossa volta com mais clareza.
Conceitos Fundamentais da Estatística
Para iniciar o estudo da estatística, é crucial compreender alguns termos básicos que servem de alicerce para análises mais complexas.
- População: É o conjunto completo de todos os elementos ou indivíduos que compartilham uma ou mais características em comum e sobre os quais se deseja obter informações. Pode ser finita ou infinita.
- Amostra: É um subconjunto representativo da população, selecionado para a realização de um estudo. A análise da amostra permite inferir características da população total.
- Variável: É a característica ou atributo que está sendo estudado na população ou amostra. As variáveis podem ser classificadas de diferentes formas.
- Dados: São os valores observados ou coletados para uma determinada variável.
Tipos de Variáveis
As variáveis estatísticas podem ser classificadas em dois grandes grupos, que determinam como os dados serão coletados e analisados:
Variáveis Qualitativas
Representam características não numéricas que descrevem um atributo de um elemento.
- Nominais: Não possuem ordem ou hierarquia.
Exemplo: Cor dos olhos (azul, verde, castanho), sexo (masculino, feminino), estado civil (solteiro, casado). - Ordinais: Possuem uma ordem ou hierarquia natural entre as categorias.
Exemplo: Grau de escolaridade (Ensino Fundamental, Ensino Médio, Ensino Superior), classificação em uma pesquisa de opinião (ótimo, bom, regular, ruim).
Variáveis Quantitativas
Representam características numéricas, ou seja, podem ser expressas por números.
- Discretas: Assumem valores numéricos inteiros, geralmente resultantes de contagens. Não há valores intermediários entre dois valores consecutivos.
Exemplo: Número de filhos, número de carros em uma família, número de acertos em uma prova. - Contínuas: Assumem valores numéricos em intervalos, geralmente resultantes de medições. Podem adquirir qualquer valor dentro de um determinado intervalo.
Exemplo: Altura de uma pessoa, peso, temperatura, tempo de duração de uma ligação.
Medidas de Tendência Central
As medidas de tendência central são valores que representam o “centro” ou o ponto típico de um conjunto de dados.
Média Aritmética
É a soma de todos os valores de um conjunto de dados dividida pelo número total de elementos. É a medida mais comum e conhecida.
Fórmula:
Média = (Soma de todos os valores) / (Número total de valores)
Exemplo:
As notas de um aluno em 5 provas foram: 7, 8, 5, 9, 6.
Média = (7 + 8 + 5 + 9 + 6) / 5 = 35 / 5 = 7
Mediana
É o valor central de um conjunto de dados ordenado (em ordem crescente ou decrescente).
- Se o número de elementos for ímpar, a mediana é o valor do meio.
- Se o número de elementos for par, a mediana é a média dos dois valores centrais.
Exemplo 1 (número ímpar de dados):
Conjunto de dados: 5, 7, 8, 9, 10
A mediana é 8.
Exemplo 2 (número par de dados):
Conjunto de dados: 5, 6, 7, 8, 9, 10
Os dois valores centrais são 7 e 8.
Mediana = (7 + 8) / 2 = 15 / 2 = 7,5
Moda
É o valor que aparece com maior frequência em um conjunto de dados. Um conjunto de dados pode ter uma moda (unimodal), várias modas (multimodal) ou nenhuma moda (amodal).
Exemplo 1 (unimodal):
Conjunto de dados: 2, 3, 3, 4, 5, 3, 6
A moda é 3.
Exemplo 2 (multimodal):
Conjunto de dados: 1, 2, 2, 3, 4, 4, 5
As modas são 2 e 4 (bimodal).
Medidas de Dispersão
As medidas de dispersão indicam o quão “espalhados” os dados estão em torno da medida de tendência central (geralmente a média).
Amplitude Total
É a diferença entre o maior e o menor valor de um conjunto de dados.
Fórmula:
Amplitude Total = Valor Máximo – Valor Mínimo
Exemplo:
Conjunto de dados: 5, 7, 8, 9, 10
Amplitude Total = 10 – 5 = 5
Variância
É a medida que expressa a média dos quadrados dos desvios de cada valor em relação à média aritmética.
Fórmula (Amostral):
s² = Σ (xi – x̄)² / (n – 1)
Onde xi é cada valor, x̄ é a média, e n é o número de elementos.
Desvio Padrão
É a raiz quadrada da variância. Representa a medida de dispersão mais utilizada, pois está na mesma unidade de medida dos dados originais.
Fórmula (Amostral):
s = √s²
Exemplo de cálculo de Variância e Desvio Padrão (simplificado):
Notas: 7, 8, 5, 9, 6. Média = 7.
1. Desvios em relação à média:
(7-7)=0; (8-7)=1; (5-7)=-2; (9-7)=2; (6-7)=-1
2. Quadrado dos desvios:
0²=0; 1²=1; (-2)²=4; 2²=4; (-1)²=1
3. Soma dos quadrados dos desvios: 0+1+4+4+1 = 10
4. Variância (s²): 10 / (5-1) = 10 / 4 = 2,5
5. Desvio Padrão (s): √2,5 ≈ 1,58
Representação de Dados
A forma como os dados são apresentados é crucial para a sua compreensão e análise.
Tabelas
Organizam os dados em linhas e colunas, permitindo uma visualização clara e sistemática.
| Idade (anos) | Frequência (Nº de Pessoas) |
|---|---|
| 15 | 10 |
| 16 | 15 |
| 17 | 20 |
| 18 | 5 |
Gráficos
São representações visuais dos dados, tornando a interpretação mais rápida e intuitiva. Os tipos mais comuns são:
- Gráfico de Barras: Usado para comparar categorias de variáveis qualitativas ou discretas.
- Gráfico de Setores (Pizza): Ideal para mostrar a proporção de cada categoria em relação ao todo.
- Histograma: Semelhante ao gráfico de barras, mas usado para variáveis quantitativas contínuas, onde as barras são adjacentes.
- Gráfico de Linhas: Usado para mostrar a evolução de uma variável ao longo do tempo.
- Diagrama de Dispersão: Utilizado para analisar a relação entre duas variáveis quantitativas.
Exercícios com Gabarito
1. (ENEM-2017)
Um professor realizou uma pesquisa com seus alunos sobre a quantidade de livros que cada um leu no último ano. Os resultados obtidos foram: 2, 3, 5, 2, 4, 3, 2, 6, 7, 2. Qual é a moda, a mediana e a média da quantidade de livros lidos por esses alunos?
- a) Moda = 2; Mediana = 3; Média = 3,6
- b) Moda = 2; Mediana = 2,5; Média = 3,6
- c) Moda = 3; Mediana = 3; Média = 3,6
- d) Moda = 2; Mediana = 3,5; Média = 3,2
- e) Moda = 2; Mediana = 3; Média = 3,2
Resposta: Alternativa a:
Primeiro, ordene os dados: 2, 2, 2, 2, 3, 3, 4, 5, 6, 7.
- Moda: O valor que mais se repete é 2.
- Mediana: Há 10 dados (par). Os dois centrais são o 5º (3) e o 6º (3). Mediana = (3+3)/2 = 3.
- Média: Soma = 2+2+2+2+3+3+4+5+6+7 = 36. Média = 36/10 = 3,6.
2. (ENEM-2015)
O gráfico apresenta o número de casos de dengue, por semana, em uma determinada cidade.
(Considere um gráfico de linhas hipotético onde os valores semanais são: Semana 1=10, Semana 2=15, Semana 3=20, Semana 4=10, Semana 5=5).
Qual a amplitude total do número de casos de dengue apresentada no período?
- a) 5 casos
- b) 10 casos
- c) 15 casos
- d) 20 casos
- e) 25 casos
Resposta: Alternativa c:
A amplitude total é a diferença entre o maior e o menor número de casos. No período, o maior número de casos foi 20 (Semana 3) e o menor foi 5 (Semana 5). Portanto, Amplitude = 20 – 5 = 15 casos.