terça-feira, 11 de setembro de 2007

Estatística I

Estatística

A estatística é só uma extensão da capacidade do ser humano de perceber padrões, regularidades, em informação complexa. Para manejar essa informação a estatística precisa que os dados se apresentem em forma numérica.
Calcular a média de um conjunto de quantidades é o que faz nosso cérebro quando escuta música.
A maioria dos parâmetros (a média é um parâmetro), têm uma representação visual singela, simples.
Tem que entender que ao utilizar estatística perdemos detalhe e ganhamos capacidade de entendimento e comparação.



Medidas de Localização ou tendência central
São indicadores que permitem que se tenha uma primeira ideia ou um resumo, do modo como se distribuem os dados.

-Média:
Suma dos valores dividido por nº dos valores.
Se utiliza só com variaveis quantitaivas.

-Mediana:
Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana
Divide e dois. Si som mais, som quartis.
Se utiliza com variaveis ordinais.

-Moda:
O valor que surge com mais frequência. Se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Se utiliza com variaveis nominais

Medidas de Dispersão

Desvio padrão, o mais utilizado.

Raiz quadrada de: soma dos quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um:

Utilizamos o quadrado e a raiz quadrada por uma causa matemática que permite que os dados resultantes sejam de melhor uso. E pela mesma razão dividimos não por N, senão por n-1.
Sempre é um número positivo: quanto maior, mais dispersão.

Cuando se utilizam duas variaveis

Coeficiente de Correlação:
O mais utilizado:

Mide o poder explicativo duma relação linear. Relação linear é do tipo: aumenta uma variável, aumenta em a mesma proporção a outra.


Inferencia estatística

Inferência estatística é o processo pelo qual é possível tirar conclusões acerca da população (universo) usando informação de uma amostra (subconjunto).
Se recolhemos dados de toda a poplaçao fazemos um recenseamento.
Sondagem é cuando utilizamos uma amostra.

A amostra de uma pesquisa pode ser selecionada de forma probabilística ou não probabilística.

Amostras probabilísticas:
-Aleatória simples: As unidades são seleccionadas, uma a uma, ao acaso, a partir de um conjunto.
-Aleatória sistemática: Selecciona-se uma única unidade ao acaso, as outras são extraídas com intervalos fixos.
-Aleatória estratificada ou por estratos: As unidades são seleccionadas ao acaso, no seio de subgrupos homogéneos, atendendo a variáveis. Geralmente, uma amostra estratificada é constituída a partir das várias amostras simples, sendo cada unidade obtida num dos subgrupos que constituem a amostra.
-Grupos, agregados ou cachos: É constituída por subgrupos homogéneos seleccionados ao acaso (modo aleatório) em cujo interior serão escolhidos as unidades de modo aleatório, o bem som seleccionadas todas as unidades.

Nestas amostras se pode aplicar inferencia estatística.

Na algumas ocasiões não podemos eleger uma mostra probabilística, então se fazem amostras não probabilísticas:
-Voluntárias (ou por conveniência: Constituídas por unidades que se disponibilizam voluntariamente para integrar a amostra. Neste método selecciona-se a amostra em função da disponibilidade e acessibilidade dos elementos da população.
-Intencionais (por acerto): Constituídas a partir das intenções ou necessidades do investigador para estudar uma situação particular, baseiam-se em opiniões de uma ou mais pessoas que conhecem características específicas que se pretendem analisar da população em estudo.
-Acidentais (ao acaso): As unidades são seleccionadas respeitando a ordem com que aparecem. O método consiste em seleccionar inicialmente os inquiridos de modo aleatório e, em seguida, escolher unidades adicionais a partir da informação obtida dos primeiros.
-Quotas: A característica principal de uma amostra por quotas é a necessidade de se qualificar o respondente "a priori"; têm as vantagens da economia de tempo e de dinheiro; são estratificadas com a locação proporcional ao número de sujeitos de cada estrato.

Nestos casos não podemos fazer inferência estatística, não podemos concluir nada da população.

¿Como fazer amostras?

É fácil. Aplicando uma formula:

A fórmula não importa. Excel ou OpenOffice calcula.




n é o tamanho da amostra
δ é o Nível de Confianza
Nível de confianza:
Si fizeramos a pesquisa 100 vezes, sería como esperamos este porcentagem das vezes...
δ = 1 ; 68,3% de vezes
δ = 2 ; 95,4% de vezes
δ = 3 ; 99,7% de vezes
Nos decidimos que nível de confianza queremos para nossa pesquisa. O normal, δ = 2, ou 2δ

p é o porporção do universo que possui a propiedade pesquisada. Se não sabemos, o mais normal, e 50%.
q é o porporção do universo que não possui a propiedades pesquisada: é 100-p
N é tamanho do população ou Universo.
e é erro
Significa quanto flutua o valor na amostra. É um porcentagem. O normal é <6%. 3% é bom.


Fontes em português:

Noções de estatistica

Escalas de Medida, Estatística Descritiva e Inferência Estatística Interessante também porque fala de variáveis.