Bioestatística

I Unidade

CONCEITOS BÁSICOS
O termo estatística, da palavra estado,é utilizada para denominar levantamento de dados, com a finalidade de orientar o estado em suas decisões.
DEFINIÇÃO - É um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos.




  • VARIÁVEIS ESTATÍSTICAS -
- QUALITATIVAS - Os dados podem ser distribuídos em categorias mutuamente exclusivos. Ex.: sexo, cor, causa da morte, grupo sanguíneo, etc.
Pode ser:
NOMINAL - Dados nominais, tais como cor, sexo.
ORDINAL - Dados também nominais, porém apresentam uma ordem. Ex.: colocação primeiramente da opção (Níveis de Escolaridade) Analfabeto, seguido respectivamente e nessa ordem por Ensino fundamental, Ensino médio, Ensino Superior (Possui uma hereditariedade).

- QUANTITATIVAS - Dados expressos em números. Ex.: Idade, peso corporal, altura, etc.
Pode ser:
Discreta - Apenas categorias de números inteiros. Ex.: Idade.
Continua - Categorias que contenham tanto números inteiros, quanto fracionados. Ex.: Altura, peso corporal.

  • Apuração de dados:
- QUALITATIVA - Simples contagem;
- QUANTITATIVA - Anotar cada valor observado;
  • População e Amostra:
- População = Conjunto de elementos que tem, em comun, determinada característica;
- Amostra = Subconjunto não vazio e com menor número de elementos;
- Parâmetro = Característica numerica de uma população;
- Estimulados = Característica numerica de uma amostra;
A população pode ser finita ou infinita;
  • RECENSEAMENTO/CENSO
- Coleta de informações de toda população;
- Erro processual zero, confiabilidade 100%;
- Quase sempre desatualizada;
- Caro e lento;
- Nem sempre viável;
- População finita;
  •  AMOSTRAGEM
- Coleta de informações de apenas parte da população;
- Erro processual positivo, confiabilidade <100%;
- Barato e rápido;
- Atualizada e sempre viável;
- População infinitas/finitas; 
O estudo cuidadoso e minucioso de uma amostra tem mais valor científico do que um estudo sumário e rápido de toda a população.


  • TÉCNICAS DE AMOSTRAGEM
- PROBABILISTICOS
 * Aleatório simples: Procede-se a coleta usando sorteio ou tabelo de números aleatórios para determinar os indivíduos que não pertencer a amostra;
 * Sistemático: Adota-se um critério de seleção ( um padrão);
 * Extratificado: Todos os extratos com igual número; Depende do tamanho de cada extrato; Proporcional com aleatório;
 * Por conviniência: O amostrador escolhe por interesse ou critério próprio;


- NÃO PROBABILISTICOS  
 * Inascessibilidade à toda população;
 * Por cotas;
 * A esmo ( ou sem normas);
 * Intecional; 




- ETAPAS PARA FAZER UMA PESQUISA
  1.  Definir um problema ( situação-problema);
  2. Definir quais são as variáveis;
  3. Definir a população a ser estudada usando uma das tecnicas de amostragem;
  4. Definir uma tecnica de amostragem;
  5. Escolher uma organização para fazer a pesquisa;
  6. Obter os dados e organiza-lós; 
  7. Finalizar as partes teoricas da pesquisa; 
- DISTRIBUIÇÃO DE FREQUÊNCIA - É a representação dos dados agrupados em clases em uma tabela.
 ETAPAS
  1. Fazer o ROL ( ou seja, colocar os dados em uma ordem - crescente);
  2. Definir Amplitude de amostra ou Amostra Total (AT): Limiar superior[dado com maior valor numérico] menos Limiar inferior[dado com menos valor numérico] ( Lsup - linf = AT;
  3. Definir numéro de classes (i): i= √n [n = número de dados];
  4. Definir Amplitude da Classe (AC):  AT ÷ i : AC
  5. Agrupamento dos dados na tabela:


 i = número de clases;
  Classes = aplicação do AC;
  fi = Frequência simples ( Quantos dados eu vo ter naquela classe);
  xi = Ponto médio ( Soma do limite inferior com o superior da classe dividido por 2, ou seja média da classe);
 Fi = Frequência acumulada ( Quantos dados eu vou ter ATÉ aquela classe);
 fri = Frequência relativa simples ( Quantos dados eu vo ter naquela classe em porcentagem) ; 
Fri = Frequência relativa acumulada ( Quantos dados eu vou ter ATÉ aquela classe em porcentagem);


II Unidade

MÉDIA ARITIMÉTICA
Para achar a média aritimética você pode fazer de duas maneiras:


Somar todos os dados e dividir por n.
Multiplica fi (frequência simples) por xi (ponto médio) e dividir por n (número de dados)  <= (média de dados em tabelas de distribuição de frequência);


MEDIANA
É o numero intermédiario dos dados, por exemplo, se eu tenho os seguintes dados 1,2,3,5,9, o 3 será a mediana, pois é o dado que está no meio. A duas formulas para achar a mediana, uma para a amostra constituida de números pares  de dados e outra para impares. (obs.: a amostra 1,2,3,5,9 possui 5 dados então ela é impar, se ela tivesse 6 dados seria par);


Quando o numero de dados for impar:n+1 , ou seja, 5+1= 6 = 3 (o terceiro número é o 3)
                                                                         2                     2      2


Quando for par: Ex.:  Amostra = 1,2,3,4,7 e 9.    Os números 3 e 4 estão no meio da amostra. Para achar a mediana temos que somar os números que estão no meio da amostra ( 3+4 = 7) e dividir por 2 ( 7/2 = 3.5)

Quando não se tem todos os dados (ROL) e sim os dados organizados em classes podemos ultilizar uma formula para encontrar a mediana:

1º divida n por 2 e encontre a classe da mediana. Obs.: o número encontrado fazendo o cálculo n/2 será encontrado na frequência, pois não se refere aos valor e sim a ordem.
ex.: n = 10, 10/2=5 ( devmos procurar em que classe estará o quinto valor, e não o valor 5)
Encontrada a classe da mediana, vamos para a formula:

Mediana = Lmd + (n/2 - fi*). AC
                                 Fmd

Lmd = Limite inferior da classe da mediana ( a --- b);
n = número de dados;
fi* = Todas as frequências das classes anteriores a da clase da mediana (Obs.: a frequência da classe da mediana não está inclusa, apenas as anteriores);
AC = Amplitude da classe ( Classe:  a --- b,  AC = b-a );
Fmd = Frequência simples da classe da mediana;

(obs.: ao fazer o cálculo, resolva as que estão no parenteses, as multiplicações e  as divisões)


MODA
É o valor que ocorre com mais frequência. Por exemplo:
3,4,5,7,7,7,9,9   A moda é 7 e essa amostra é unimodal pois so tem uma moda ( o 9 não é considerado moda porque se repeti apenas 2 vezes , se ele se repetisse 3 vezes ou se o 7 se repetisse apenas 2 vezes, ai sim o 9 seria considerado moda e essa amostra séria bimodal)


1,2,3,4,5  AMODAL = Não tem moda, nenhum número se repete!


1,2,2,3,4,4,5  BIMODAL = a moda se repete 2 vezes (2,4)

Trimodal ( possue 3 modas) ; Polimodal ( mais de 4 modas);

Caso você não tenha acesso ao ROL com todos os dados, para achar a moda você de calcular o xi (ponto médio) da classe com a maior frequência. Lembrando que encontramos o xi quando somamos o limite inferior e o limite superior da classe e dividimos por 2 ( a + b / 2 ).



DESVIO PADRÃO
 Para se encontrar o desvio padrão, ou seja, o quando a média se distância do real, usamos uma fórmula, onde precisamos do fi ( frequência simples), xi (ponto médio) e média aritimética ( ma) :

desvio (d) = √fi ( xi - ma)²
                                  n

Primeiro faça todos os (xi - ma) o resultado eleve ao quadrado ( ou seja faça o número vezes ele mesmo), depois multiplique todos os resultados pelo fi de cada classe, fazendo isso some todos os resultados e divida por n ( número de dados) depois pegue esse resultado e acha a sua raiz quadrada, e você terá o desvio padrão.

EXEMPLO:

FÓRMULA (d) = √fi ( xi - ma)²
                                  n

Idade das crianças de um grupo de teatro
Média aritimétida destes dados= 6,6 ( Fórmula e calculo para achar a média aritimética no final do tópico)

Classes     /  fi     /  xi  / fi ( xi - ma)² FÓRMULA
2 l--- 4         2        3    =  2 ( 3 - 6,6)² = 2 (3,6)² =  2 x 12,96 = 25, 92
4 l---6          4        5    = 4 (5 - 6,6)²  = 4 (1,6)² =   4 x  2,56 = 10,24
6 l---8          3        7    = 3 (7 - 6,6)²  = 3 (o,4)² =   3 x 0,16 = 0,48
8l---10         5       9    = 5 (9 - 6,6)² = 5 (2,4)² =    5 x 5,76 = 28,8

1º PASSO: resolva os parenteses:
2º PASSO: Eleve o resultado do parentese ao quadrado ( Faça ele vezes ele mesmo)
3º PASSO: Multiplique os resultados
4º PASSO: Some os resultados ( 25,92 + 10,24+0,48+28,8 = 65,44)
5º PASSO: Divida o resultado por n ( número de dados) 65,44/14 = 4,67 ( se quiser aproxime para 4,7
6º PASSO: Encontre a raiz quadrada do resultado :  √4,7 = 2,167948339 = ( aproximação)
2,16

O DESVIO PADRÃO FOI DE 2,16

Média Aritimética ( ma) = xi.fi/n
fi.xi
2x3= 6
4x5=20
3x7=21
5x9=45
(soma os resultados) = 92 / n
92 dividido pelo número de dados ( para encontrar o número de dados some as frequencias)
92/14 = 6, 57 ( se quizer aproxime para 6,6)  
6,6 é a média aritimética destes dados


Espero que o exemplo tenha sido esclarecedor! Bons Estudos!


PROBABILIDADE
Em essência, existe um conjunto de regras matemáticas para manipular a probabilidade, listado no tópico "Formalização da probabilidade".  Tendo o espaço amostral e a amostra que se deseja obter podemos calcular qual é a probabilidade de conseguinos  a tal amostra. Por exemplo : Uma mulher deseja ter três filhos, ela quer duas mulheres e um homem, qual seria a probabilidade de isso acontecer:

O espaço amostral (E) séria : { ( 1º h, 2º h, 3ºh), (1ºh,2ºh,3ºm), (1ºh,2ºm,3ºm), (1º h,2ºm,3ºh), (1ºm,2ºm,3ºm), (1ºm,2ºm,3ºh), (1ºm, 2ºh,3ºm), (1ºm,2ºh,3ºh) }

O número do espaço amostral n (E) = 8
O número da amostra n(A) é =  3
A probabilidade de ocorrer a amostra desejada P(A) = 3    = 0,375 x 100 = 37,5 %
                                                                                                8

E se a mulher desejar que o seu primeiro filho seja h, o segundo seja mulher e o terceiro seja homem, qual é a probabilidade de isso ocorrer:

n (E) = 8
n (A) = 1
P (A) = 1/8 = 0,125 x 100 = 12,5 %

Fórmula para definir a probabilidade:

P(A) = n(A)
              n(E)