CONCEITOS BÁSICOS
O termo estatística, da palavra estado,é utilizada para denominar levantamento de dados, com a finalidade de orientar o estado em suas decisões.
DEFINIÇÃO - É um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos.
- VARIÁVEIS ESTATÍSTICAS -
- QUALITATIVAS - Os dados podem ser distribuídos em categorias mutuamente exclusivos. Ex.: sexo, cor, causa da morte, grupo sanguíneo, etc.
Pode ser:
NOMINAL - Dados nominais, tais como cor, sexo.
ORDINAL - Dados também nominais, porém apresentam uma ordem. Ex.: colocação primeiramente da opção (Níveis de Escolaridade) Analfabeto, seguido respectivamente e nessa ordem por Ensino fundamental, Ensino médio, Ensino Superior (Possui uma hereditariedade).
Pode ser:
NOMINAL - Dados nominais, tais como cor, sexo.
ORDINAL - Dados também nominais, porém apresentam uma ordem. Ex.: colocação primeiramente da opção (Níveis de Escolaridade) Analfabeto, seguido respectivamente e nessa ordem por Ensino fundamental, Ensino médio, Ensino Superior (Possui uma hereditariedade).
- QUANTITATIVAS - Dados expressos em números. Ex.: Idade, peso corporal, altura, etc.
Pode ser:
Discreta - Apenas categorias de números inteiros. Ex.: Idade.
Continua - Categorias que contenham tanto números inteiros, quanto fracionados. Ex.: Altura, peso corporal.
Pode ser:
Discreta - Apenas categorias de números inteiros. Ex.: Idade.
Continua - Categorias que contenham tanto números inteiros, quanto fracionados. Ex.: Altura, peso corporal.
- Apuração de dados:
- QUANTITATIVA - Anotar cada valor observado;
- População e Amostra:
- Amostra = Subconjunto não vazio e com menor número de elementos;
- Parâmetro = Característica numerica de uma população;
- Estimulados = Característica numerica de uma amostra;
A população pode ser finita ou infinita;
- RECENSEAMENTO/CENSO
- Coleta de informações de toda população;
- Erro processual zero, confiabilidade 100%;
- Quase sempre desatualizada;
- Caro e lento;
- Nem sempre viável;
- População finita;
- AMOSTRAGEM
- Erro processual positivo, confiabilidade <100%;
- Barato e rápido;
- Atualizada e sempre viável;
- População infinitas/finitas;
O estudo cuidadoso e minucioso de uma amostra tem mais valor científico do que um estudo sumário e rápido de toda a população.
- TÉCNICAS DE AMOSTRAGEM
- PROBABILISTICOS
* Aleatório simples: Procede-se a coleta usando sorteio ou tabelo de números aleatórios para determinar os indivíduos que não pertencer a amostra;* Sistemático: Adota-se um critério de seleção ( um padrão);
* Extratificado: Todos os extratos com igual número; Depende do tamanho de cada extrato; Proporcional com aleatório;
* Por conviniência: O amostrador escolhe por interesse ou critério próprio;
- NÃO PROBABILISTICOS
* Inascessibilidade à toda população;* Por cotas;
* A esmo ( ou sem normas);
* Intecional;
- ETAPAS PARA FAZER UMA PESQUISA
- Definir um problema ( situação-problema);
- Definir quais são as variáveis;
- Definir a população a ser estudada usando uma das tecnicas de amostragem;
- Definir uma tecnica de amostragem;
- Escolher uma organização para fazer a pesquisa;
- Obter os dados e organiza-lós;
- Finalizar as partes teoricas da pesquisa;
ETAPAS
- Fazer o ROL ( ou seja, colocar os dados em uma ordem - crescente);
- Definir Amplitude de amostra ou Amostra Total (AT): Limiar superior[dado com maior valor numérico] menos Limiar inferior[dado com menos valor numérico] ( Lsup - linf = AT;
- Definir numéro de classes (i): i= √n [n = número de dados];
- Definir Amplitude da Classe (AC): AT ÷ i : AC
- Agrupamento dos dados na tabela:
i = número de clases;
Classes = aplicação do AC;
fi = Frequência simples ( Quantos dados eu vo ter naquela classe);
xi = Ponto médio ( Soma do limite inferior com o superior da classe dividido por 2, ou seja média da classe);
Fi = Frequência acumulada ( Quantos dados eu vou ter ATÉ aquela classe);
fri = Frequência relativa simples ( Quantos dados eu vo ter naquela classe em porcentagem) ;
Fri = Frequência relativa acumulada ( Quantos dados eu vou ter ATÉ aquela classe em porcentagem);
II Unidade
MÉDIA ARITIMÉTICA
Para achar a média aritimética você pode fazer de duas maneiras:
Somar todos os dados e dividir por n.
Multiplica fi (frequência simples) por xi (ponto médio) e dividir por n (número de dados) <= (média de dados em tabelas de distribuição de frequência);
MEDIANA
É o numero intermédiario dos dados, por exemplo, se eu tenho os seguintes dados 1,2,3,5,9, o 3 será a mediana, pois é o dado que está no meio. A duas formulas para achar a mediana, uma para a amostra constituida de números pares de dados e outra para impares. (obs.: a amostra 1,2,3,5,9 possui 5 dados então ela é impar, se ela tivesse 6 dados seria par);
Quando o numero de dados for impar:n+1 , ou seja, 5+1= 6 = 3 (o terceiro número é o 3)
2 2 2
Quando for par: Ex.: Amostra = 1,2,3,4,7 e 9. Os números 3 e 4 estão no meio da amostra. Para achar a mediana temos que somar os números que estão no meio da amostra ( 3+4 = 7) e dividir por 2 ( 7/2 = 3.5)
Quando não se tem todos os dados (ROL) e sim os dados organizados em classes podemos ultilizar uma formula para encontrar a mediana:
1º divida n por 2 e encontre a classe da mediana. Obs.: o número encontrado fazendo o cálculo n/2 será encontrado na frequência, pois não se refere aos valor e sim a ordem.
ex.: n = 10, 10/2=5 ( devmos procurar em que classe estará o quinto valor, e não o valor 5)
Encontrada a classe da mediana, vamos para a formula:
Mediana = Lmd + (n/2 - fi*). AC
Fmd
Lmd = Limite inferior da classe da mediana ( a --- b);
n = número de dados;
fi* = Todas as frequências das classes anteriores a da clase da mediana (Obs.: a frequência da classe da mediana não está inclusa, apenas as anteriores);
AC = Amplitude da classe ( Classe: a --- b, AC = b-a );
Fmd = Frequência simples da classe da mediana;
(obs.: ao fazer o cálculo, resolva as que estão no parenteses, as multiplicações e as divisões)
MODA
É o valor que ocorre com mais frequência. Por exemplo:
3,4,5,7,7,7,9,9 A moda é 7 e essa amostra é unimodal pois so tem uma moda ( o 9 não é considerado moda porque se repeti apenas 2 vezes , se ele se repetisse 3 vezes ou se o 7 se repetisse apenas 2 vezes, ai sim o 9 seria considerado moda e essa amostra séria bimodal)
1,2,3,4,5 AMODAL = Não tem moda, nenhum número se repete!
1,2,2,3,4,4,5 BIMODAL = a moda se repete 2 vezes (2,4)
Trimodal ( possue 3 modas) ; Polimodal ( mais de 4 modas);
Caso você não tenha acesso ao ROL com todos os dados, para achar a moda você de calcular o xi (ponto médio) da classe com a maior frequência. Lembrando que encontramos o xi quando somamos o limite inferior e o limite superior da classe e dividimos por 2 ( a + b / 2 ).
DESVIO PADRÃO
Para se encontrar o desvio padrão, ou seja, o quando a média se distância do real, usamos uma fórmula, onde precisamos do fi ( frequência simples), xi (ponto médio) e média aritimética ( ma) :
desvio (d) = √fi ( xi - ma)²
n
Primeiro faça todos os (xi - ma) o resultado eleve ao quadrado ( ou seja faça o número vezes ele mesmo), depois multiplique todos os resultados pelo fi de cada classe, fazendo isso some todos os resultados e divida por n ( número de dados) depois pegue esse resultado e acha a sua raiz quadrada, e você terá o desvio padrão.
EXEMPLO:
FÓRMULA (d) = √fi ( xi - ma)²
n
Idade das crianças de um grupo de teatro
Média aritimétida destes dados= 6,6 ( Fórmula e calculo para achar a média aritimética no final do tópico)
Classes / fi / xi / fi ( xi - ma)² FÓRMULA
2 l--- 4 2 3 = 2 ( 3 - 6,6)² = 2 (3,6)² = 2 x 12,96 = 25, 92
4 l---6 4 5 = 4 (5 - 6,6)² = 4 (1,6)² = 4 x 2,56 = 10,24
6 l---8 3 7 = 3 (7 - 6,6)² = 3 (o,4)² = 3 x 0,16 = 0,48
8l---10 5 9 = 5 (9 - 6,6)² = 5 (2,4)² = 5 x 5,76 = 28,8
1º PASSO: resolva os parenteses:
2º PASSO: Eleve o resultado do parentese ao quadrado ( Faça ele vezes ele mesmo)
3º PASSO: Multiplique os resultados
4º PASSO: Some os resultados ( 25,92 + 10,24+0,48+28,8 = 65,44)
5º PASSO: Divida o resultado por n ( número de dados) 65,44/14 = 4,67 ( se quiser aproxime para 4,7
6º PASSO: Encontre a raiz quadrada do resultado : √4,7 = 2,167948339 = ( aproximação)
2,16
O DESVIO PADRÃO FOI DE 2,16
Média Aritimética ( ma) = xi.fi/n
fi.xi
2x3= 6
4x5=20
3x7=21
5x9=45
(soma os resultados) = 92 / n
92 dividido pelo número de dados ( para encontrar o número de dados some as frequencias)
92/14 = 6, 57 ( se quizer aproxime para 6,6)
6,6 é a média aritimética destes dados
Espero que o exemplo tenha sido esclarecedor! Bons Estudos!
PROBABILIDADE
Em essência, existe um conjunto de regras matemáticas para manipular a probabilidade, listado no tópico "Formalização da probabilidade". Tendo o espaço amostral e a amostra que se deseja obter podemos calcular qual é a probabilidade de conseguinos a tal amostra. Por exemplo : Uma mulher deseja ter três filhos, ela quer duas mulheres e um homem, qual seria a probabilidade de isso acontecer:
Fri = Frequência relativa acumulada ( Quantos dados eu vou ter ATÉ aquela classe em porcentagem);
II Unidade
MÉDIA ARITIMÉTICA
Para achar a média aritimética você pode fazer de duas maneiras:
Somar todos os dados e dividir por n.
Multiplica fi (frequência simples) por xi (ponto médio) e dividir por n (número de dados) <= (média de dados em tabelas de distribuição de frequência);
MEDIANA
É o numero intermédiario dos dados, por exemplo, se eu tenho os seguintes dados 1,2,3,5,9, o 3 será a mediana, pois é o dado que está no meio. A duas formulas para achar a mediana, uma para a amostra constituida de números pares de dados e outra para impares. (obs.: a amostra 1,2,3,5,9 possui 5 dados então ela é impar, se ela tivesse 6 dados seria par);
Quando o numero de dados for impar:n+1 , ou seja, 5+1= 6 = 3 (o terceiro número é o 3)
2 2 2
Quando for par: Ex.: Amostra = 1,2,3,4,7 e 9. Os números 3 e 4 estão no meio da amostra. Para achar a mediana temos que somar os números que estão no meio da amostra ( 3+4 = 7) e dividir por 2 ( 7/2 = 3.5)
Quando não se tem todos os dados (ROL) e sim os dados organizados em classes podemos ultilizar uma formula para encontrar a mediana:
1º divida n por 2 e encontre a classe da mediana. Obs.: o número encontrado fazendo o cálculo n/2 será encontrado na frequência, pois não se refere aos valor e sim a ordem.
ex.: n = 10, 10/2=5 ( devmos procurar em que classe estará o quinto valor, e não o valor 5)
Encontrada a classe da mediana, vamos para a formula:
Mediana = Lmd + (n/2 - fi*). AC
Fmd
Lmd = Limite inferior da classe da mediana ( a --- b);
n = número de dados;
fi* = Todas as frequências das classes anteriores a da clase da mediana (Obs.: a frequência da classe da mediana não está inclusa, apenas as anteriores);
AC = Amplitude da classe ( Classe: a --- b, AC = b-a );
Fmd = Frequência simples da classe da mediana;
(obs.: ao fazer o cálculo, resolva as que estão no parenteses, as multiplicações e as divisões)
MODA
É o valor que ocorre com mais frequência. Por exemplo:
3,4,5,7,7,7,9,9 A moda é 7 e essa amostra é unimodal pois so tem uma moda ( o 9 não é considerado moda porque se repeti apenas 2 vezes , se ele se repetisse 3 vezes ou se o 7 se repetisse apenas 2 vezes, ai sim o 9 seria considerado moda e essa amostra séria bimodal)
1,2,3,4,5 AMODAL = Não tem moda, nenhum número se repete!
1,2,2,3,4,4,5 BIMODAL = a moda se repete 2 vezes (2,4)
Trimodal ( possue 3 modas) ; Polimodal ( mais de 4 modas);
Caso você não tenha acesso ao ROL com todos os dados, para achar a moda você de calcular o xi (ponto médio) da classe com a maior frequência. Lembrando que encontramos o xi quando somamos o limite inferior e o limite superior da classe e dividimos por 2 ( a + b / 2 ).
DESVIO PADRÃO
Para se encontrar o desvio padrão, ou seja, o quando a média se distância do real, usamos uma fórmula, onde precisamos do fi ( frequência simples), xi (ponto médio) e média aritimética ( ma) :
desvio (d) = √fi ( xi - ma)²
n
Primeiro faça todos os (xi - ma) o resultado eleve ao quadrado ( ou seja faça o número vezes ele mesmo), depois multiplique todos os resultados pelo fi de cada classe, fazendo isso some todos os resultados e divida por n ( número de dados) depois pegue esse resultado e acha a sua raiz quadrada, e você terá o desvio padrão.
EXEMPLO:
FÓRMULA (d) = √fi ( xi - ma)²
n
Idade das crianças de um grupo de teatro
Média aritimétida destes dados= 6,6 ( Fórmula e calculo para achar a média aritimética no final do tópico)
Classes / fi / xi / fi ( xi - ma)² FÓRMULA
2 l--- 4 2 3 = 2 ( 3 - 6,6)² = 2 (3,6)² = 2 x 12,96 = 25, 92
4 l---6 4 5 = 4 (5 - 6,6)² = 4 (1,6)² = 4 x 2,56 = 10,24
6 l---8 3 7 = 3 (7 - 6,6)² = 3 (o,4)² = 3 x 0,16 = 0,48
8l---10 5 9 = 5 (9 - 6,6)² = 5 (2,4)² = 5 x 5,76 = 28,8
1º PASSO: resolva os parenteses:
2º PASSO: Eleve o resultado do parentese ao quadrado ( Faça ele vezes ele mesmo)
3º PASSO: Multiplique os resultados
4º PASSO: Some os resultados ( 25,92 + 10,24+0,48+28,8 = 65,44)
5º PASSO: Divida o resultado por n ( número de dados) 65,44/14 = 4,67 ( se quiser aproxime para 4,7
6º PASSO: Encontre a raiz quadrada do resultado : √4,7 = 2,167948339 = ( aproximação)
2,16
O DESVIO PADRÃO FOI DE 2,16
Média Aritimética ( ma) = xi.fi/n
fi.xi
2x3= 6
4x5=20
3x7=21
5x9=45
(soma os resultados) = 92 / n
92 dividido pelo número de dados ( para encontrar o número de dados some as frequencias)
92/14 = 6, 57 ( se quizer aproxime para 6,6)
6,6 é a média aritimética destes dados
Espero que o exemplo tenha sido esclarecedor! Bons Estudos!
PROBABILIDADE
Em essência, existe um conjunto de regras matemáticas para manipular a probabilidade, listado no tópico "Formalização da probabilidade". Tendo o espaço amostral e a amostra que se deseja obter podemos calcular qual é a probabilidade de conseguinos a tal amostra. Por exemplo : Uma mulher deseja ter três filhos, ela quer duas mulheres e um homem, qual seria a probabilidade de isso acontecer:
O espaço amostral (E) séria : { ( 1º h, 2º h, 3ºh), (1ºh,2ºh,3ºm), (1ºh,2ºm,3ºm), (1º h,2ºm,3ºh), (1ºm,2ºm,3ºm), (1ºm,2ºm,3ºh), (1ºm, 2ºh,3ºm), (1ºm,2ºh,3ºh) }
O número do espaço amostral n (E) = 8
O número da amostra n(A) é = 3
A probabilidade de ocorrer a amostra desejada P(A) = 3 = 0,375 x 100 = 37,5 %
8
E se a mulher desejar que o seu primeiro filho seja h, o segundo seja mulher e o terceiro seja homem, qual é a probabilidade de isso ocorrer:
n (E) = 8
n (A) = 1
P (A) = 1/8 = 0,125 x 100 = 12,5 %
Fórmula para definir a probabilidade:
P(A) = n(A)
n(E)