terça-feira, 11 de setembro de 2007

Estatística I

Estatística

A estatística é só uma extensão da capacidade do ser humano de perceber padrões, regularidades, em informação complexa. Para manejar essa informação a estatística precisa que os dados se apresentem em forma numérica.
Calcular a média de um conjunto de quantidades é o que faz nosso cérebro quando escuta música.
A maioria dos parâmetros (a média é um parâmetro), têm uma representação visual singela, simples.
Tem que entender que ao utilizar estatística perdemos detalhe e ganhamos capacidade de entendimento e comparação.



Medidas de Localização ou tendência central
São indicadores que permitem que se tenha uma primeira ideia ou um resumo, do modo como se distribuem os dados.

-Média:
Suma dos valores dividido por nº dos valores.
Se utiliza só com variaveis quantitaivas.

-Mediana:
Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana
Divide e dois. Si som mais, som quartis.
Se utiliza com variaveis ordinais.

-Moda:
O valor que surge com mais frequência. Se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Se utiliza com variaveis nominais

Medidas de Dispersão

Desvio padrão, o mais utilizado.

Raiz quadrada de: soma dos quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um:

Utilizamos o quadrado e a raiz quadrada por uma causa matemática que permite que os dados resultantes sejam de melhor uso. E pela mesma razão dividimos não por N, senão por n-1.
Sempre é um número positivo: quanto maior, mais dispersão.

Cuando se utilizam duas variaveis

Coeficiente de Correlação:
O mais utilizado:

Mide o poder explicativo duma relação linear. Relação linear é do tipo: aumenta uma variável, aumenta em a mesma proporção a outra.


Inferencia estatística

Inferência estatística é o processo pelo qual é possível tirar conclusões acerca da população (universo) usando informação de uma amostra (subconjunto).
Se recolhemos dados de toda a poplaçao fazemos um recenseamento.
Sondagem é cuando utilizamos uma amostra.

A amostra de uma pesquisa pode ser selecionada de forma probabilística ou não probabilística.

Amostras probabilísticas:
-Aleatória simples: As unidades são seleccionadas, uma a uma, ao acaso, a partir de um conjunto.
-Aleatória sistemática: Selecciona-se uma única unidade ao acaso, as outras são extraídas com intervalos fixos.
-Aleatória estratificada ou por estratos: As unidades são seleccionadas ao acaso, no seio de subgrupos homogéneos, atendendo a variáveis. Geralmente, uma amostra estratificada é constituída a partir das várias amostras simples, sendo cada unidade obtida num dos subgrupos que constituem a amostra.
-Grupos, agregados ou cachos: É constituída por subgrupos homogéneos seleccionados ao acaso (modo aleatório) em cujo interior serão escolhidos as unidades de modo aleatório, o bem som seleccionadas todas as unidades.

Nestas amostras se pode aplicar inferencia estatística.

Na algumas ocasiões não podemos eleger uma mostra probabilística, então se fazem amostras não probabilísticas:
-Voluntárias (ou por conveniência: Constituídas por unidades que se disponibilizam voluntariamente para integrar a amostra. Neste método selecciona-se a amostra em função da disponibilidade e acessibilidade dos elementos da população.
-Intencionais (por acerto): Constituídas a partir das intenções ou necessidades do investigador para estudar uma situação particular, baseiam-se em opiniões de uma ou mais pessoas que conhecem características específicas que se pretendem analisar da população em estudo.
-Acidentais (ao acaso): As unidades são seleccionadas respeitando a ordem com que aparecem. O método consiste em seleccionar inicialmente os inquiridos de modo aleatório e, em seguida, escolher unidades adicionais a partir da informação obtida dos primeiros.
-Quotas: A característica principal de uma amostra por quotas é a necessidade de se qualificar o respondente "a priori"; têm as vantagens da economia de tempo e de dinheiro; são estratificadas com a locação proporcional ao número de sujeitos de cada estrato.

Nestos casos não podemos fazer inferência estatística, não podemos concluir nada da população.

¿Como fazer amostras?

É fácil. Aplicando uma formula:

A fórmula não importa. Excel ou OpenOffice calcula.




n é o tamanho da amostra
δ é o Nível de Confianza
Nível de confianza:
Si fizeramos a pesquisa 100 vezes, sería como esperamos este porcentagem das vezes...
δ = 1 ; 68,3% de vezes
δ = 2 ; 95,4% de vezes
δ = 3 ; 99,7% de vezes
Nos decidimos que nível de confianza queremos para nossa pesquisa. O normal, δ = 2, ou 2δ

p é o porporção do universo que possui a propiedade pesquisada. Se não sabemos, o mais normal, e 50%.
q é o porporção do universo que não possui a propiedades pesquisada: é 100-p
N é tamanho do população ou Universo.
e é erro
Significa quanto flutua o valor na amostra. É um porcentagem. O normal é <6%. 3% é bom.


Fontes em português:

Noções de estatistica

Escalas de Medida, Estatística Descritiva e Inferência Estatística Interessante também porque fala de variáveis.

14 comentários:

cynthia rosa disse...

Prezados professor e colegas,

Afinal, a estatística. Acho que se fossem fazer uma pesquisa no Brasil entre os pesquisadores que pouco ou nunca usam estatísticas, talvez se dissesse que assim agem por força da matemática. Para o meu espírito, é desolador encontrar uma aula como essa... Mas, afinal, o que há de errado com a matemática?
Penso que o rigor de uma pesquisa quantitativa é muito mais do que pensar números e fórmulas. O grande dilema é tentar compreender, tentar enxergar na realidade o que representam aqueles símbolos das fórmulas e equações matemáticas. Essa é uma lacuna, acredito, que o modelo de ensino da matemática nos últimos séculos, focado em formulações, tem imposto ao nosso pensamento. Pensar estatisticamente é pensar fatias, partes, porções, proporções, sim. Mas é, antes, poder vislumbrar um certo todo no qual se pressupõe ou se antevê pequenas partes. Quando isso vira uma fórmula matemática, para um pensamento pouco acostumado a tal exercício, fica difícil entender de pronto o que os n, p, q, N ou e vêm a ser no mundo concreto.
Quando você diz, Alberto, que aquilo que o nosso cérebro faz enquanto escuta música é “calcular a média de um conjunto de quantidades”, isso me faz lembrar de que já houve tempo em que a matemática e a música eram uma mesma disciplina. Por que será, então, que é tão difícil, ao menos para alguns pesquisadores, desenvolver esse pensamento de calcular médias de conjuntos de quantidades?
Outra pista que sua aula nos dá: a representação visual singela de um certo parâmetro. Quando eu construo uma imagem acerca de algo, mais profundamente o conhecimento acerca daquele algo se instala em minha mente; e, ao resgatar tal imagem, tenho uma apreensão quase instantânea daquele algo como eu o conheço (ou conhecia) no momento em que fixei a imagem.
Portanto, penso que aprender a usar estatística é mais que poder corresponder apropriadamente a um certo rigor cientificista, embora essa habilidade – de um pensamento quantitativo em pesquisa, que consiga pensar conjuntos de quantidades – seja uma meta pessoal em minha jornada de aprendiz de pesquisadora. Aprender a usar estatística é acionar competências mentais, como a representação visual singela de algum parâmetro ou, antes, a seleção de conjuntos de elementos de uma dada realidade, e – aí, sim – usando formulações matemáticas, poder chegar à demonstração de resultados por meio de um símbolo que muitos compreendem fácil e imediatamente: o número.
Quando comparo os elementos de sua explanação ao tema que quero abordar, não consigo distinguir conjuntos, ainda. Nem mesmo sei se precisarei aplicar estatística em meu trabalho (aliás, podemos discutir mais isso, quando usar ou não esse recurso num mestrado, num doutorado). O que sei agora é que poderei lançar esse outro olhar sobre o meu objeto de pesquisa, forjando, quem sabe?, uma outra mentalidade de pesquisadora.


Cynthia Rosa

Unknown disse...

Gosto de números e de estatística. E acho importante - se não aprender a fazer cálculos - ao menos entender o quê se está calculando. Até porque as ferramentas fazem o trabalho árduo, mas é o pesquisador que escolhe os modelos que se encaixam em sua pesquisa.

Neste ponto, estou ansioso para que comecemos a tratar das pesquisas qualitativas. Os alunos regulares do mestrado estão correndo contra o tempo, e acho que poucos vão trabalhar com dados estatísticos (até porque a premência de tempo limita estudos de campo mais ousados).

Por isso, achei muito produtiva a conversa ao final da aula. Sei que o professor De Francisco quer preencher as lacunas em que avalia estarmos mais fracos, mas muitos dos alunos regulares só pensam em suas pesquisas, em subsídios, em algo que possa ajudar a construir um material melhor.

Juliano Basile disse...

Uma das coisas que me chamou a atenção na aula foi a descrição dos mitos que envolvem a estatística, em particular o de que a estatística pode ser usada para provar qualquer coisa. Percebi que, no jornalismo, este uso errado da estatística ocorre com muita freqüência. Os jornalistas partem de uma pauta com um final pronto e buscam dados para comprovar a sua tese. É um erro terrível porque, nos jornais, se tira como real uma tese produzida por estatísticas dirigidas - eu diria, falsas. É como o professor disse: há empresas que usam estatísticas para defender as suas posições e escondem os dados que não favorecem. Infelizmente, o mesmo acontece nos jornais. E, neste ponto, refleti sobre outra provocação: a de que se você quiser, pode mentir com base nas estatísticas, mas estará trapaceando, pois a estatística é uma só. Os dados são o que são.

Anônimo disse...

Boa noite a todos
Corroborando com o comentário acima, também acho que um das grandes contribuições da aula foi minimizar o pavor em relação à estatística e mais ainda nos abrir a mente para os seus múltiplos usos, para o fato de ela poder ser usada nos mais diferentes projetos e propostas de estudos. De fato, durante a aula os projetos de cada um, imagino, vão tomando novas direções e clareamentos, como no meu caso, indicadores, variáveis, possibilidades de análises estatísticas dos dados, vão ganhando uma direção, quer em função da utilização da estatística, quer pela opção do seu não uso, a qual só foi possível ao se perceber em que momentos é mais vantajoso ou adequado o uso de tais ferramentas. Uma dúvida esclarecida e que pelo menos em parte me foi esclarecido com os diálogos ao final da aula foi perceber que a seleção do material empírico que em princípio se pensava como amostra não-probabilística pode ser uma pesquisa qualitativa, e nem por isso vai desqualificar o trabalho científico. Até a próxima aula.
Verônica Dantas

Unknown disse...

Se eu estivesse no Doutorado, juro que mudaria meu trabalho para trabalhar com Estatística.
Os números bem encaminhados podem facilitar uma pesquisa, encaminhar uma boa análise e iniciar um acompanhamento em série de um problema. Na área de televisão, que é meu interesse específico, é uma ferramenta mais útil ainda.
Corroboro o que os meus colegas disseram anteriormente, todas estas questões me fizeram pensar hoje, depois da aula. Mesmo
"animado" com a estatística, alguns pontos me chamaram a atenção negativamente:
1 - Pode ser que, estatisticamente, seja correto que, tanto para analisar uma população de 1 milhão de pessoas e outra de 180 milhões, bastem uma amostra de 2.500 pessoas e margem de erro de 3%. Mas não consigo concordar que a representatividade desta amostra seja a mesma, principalmente se estivermos trabalhando com variáveis não-nominais e não-dicotômicas. Me incomoda que 2.500 pessoas possam compor uma amostra que diga, por exemplo, o que o brasileiro pensa da novela das 8. Mas isso reafirma a importância da escolha do método para se chegar à amostra e reafirma também que é essencial relativizar os dados estatísticos, fazer ressalvas, apontar exceções às regras, etc...
2 - Estatísticas, muitas vezes, seguem critérios mercadológicos. No Brasil, por exemplo, ouve-se a população das regiões metropolitanas do Rio e São Paulo, os habitantes do estado de São Paulo e eventualmente Minas Gerais. São as regiões que concentram boa parte da renda do país, é onde o mercado publicitário faz maiores investimentos, etc... Depois de uma pesquisa com esta amostra, percentualmente ouviu-se boa parte da população brasileira e, a partir daí, faz-se inferências como se fosse a opinião do brasileiro.

Sugiro a leitura do segundo texto que está disponível aqui no blog, depois das explicações do professor. Acabei de ler boa parte dele e é muito simples, linguagem direta, exemplos, uma aproximação eficiente da estatística com a realidade.

Anônimo disse...

Eu me identifiquei muito com o comentário da Cynthia Rosa. Quando o professor começou sua aula dizendo que ao escutarmos música ou ao entrarmos numa festa fazemos estatísticas sem perceber, fiquei surpresa. Nunca havia pensado no tema sob esse ponto de vista, tão simples. Talvez pela minha hístórica rejeição aos números, advinda de dificuldades em minha mais tenra infância, na escola, e que continuaram pela adolescência e depois vida afora.Memorizar a tabuada e aprender a fazer continhas de dividir foram acontecimentos muito sofridos para mim. Anos mais tarde, vem a tal da raiz quadrada, da análise combinatória e outras tantas "esquisitices" que, para mim, não faziam sentido. Dei graças quando entrei na graduação e não precisei mais ver nada da área de exatas. :))))
Porém, na aula passada, fui me dando conta que é muito importante ter algum conhecimento básico de estatística e o "monstro" não é tão feio assim como parece. Aliás, me veio a sensação de que eu deveria ter aprendido essas coisas ainda na graduação...dei-me conta que eu poderia ter enriquecido vários trabalhos se soubesse um pouquinho de estatística. Porém, antes tarde do que nunca, não é mesmo? :)))
Mesmo que a gente use pouco ou nada de estatística em nossas respectivas pesquisas, acho útil aprender sobre isso e também a utilizar pelo menos algumas de suas ferramentas já que, acredito, a maioria de nós deva seguir carreira acadêmica e, quem sabe, no futuro, não utilizaremos esses conhecimentos em outras pesquisas ou até mesmo para auxiliar nossos futuros orientandos?
Lembrando o que Juliano e Cláudio comentaram, também me preocupo com o viés mercadológico ou ideológico da veiculação de várias estatísticas nos meios de comunicação. Os números não mentem, mas muitos donos de empresa sim...

Bárbara de Velasco disse...

Que bom matar saudades! Por um bom tempo já não trabalhava mais com estatística. Minha experiência na faculdade foi tão interessante quanto nossa aula do dia 12.
Com certeza existe mais preconceitos que dificuldades em trabalhar com números e algumas fórmulas.

Anônimo disse...

Professor e colegas,

Volto a falar da distância entre a estatística - os números - e a realidade. Aliás uma distância parecida aparece para mim quando vejo teorias abstratas de um lado e as questões práticas do cotidiano de outro - que pulam na minha frente exigindo soluções. Concordo com o Claudinho quanto à representatividade dos números, embora possam estar perfeitamente dentro dos critérios científicos. Mais uma vez, a reflexão sobre eles é o diferencial, é o que dará qualidade ou não a um trabalho. Os números, como as palavras, servem a tudo. Costuma-se dizer que a pergunta de um bom redator ao chefe que lhe pede um texto é: você quer a favor ou contra? Acho que com os números é a mesma coisa: a maneira com que os usamos é que determina a análise do assunto estudado. E isso se vê todos os dias nos jornais.

Gostaria de esclarecer, professor, as funções inerentes da pesquisa quantitativa e da qualitativa. Até hoje, sempre achei que são complementares e que medem coisas diferentes. A quantitativa resulta em números que são referência e recortam uma parte da realidade de um assunto ou situação junto a um determinado público, e a qualitativa estima percepções, sendo percepção a relação que uma pessoa tem com uma dada realidade, situação ou produto. Vejo uma grande diferença entre uma e outra. Mas não entendo em que circunstâncias uma pode substituir a outra, já que resultam em informações diferentes.

Alberto de Francisco disse...

Ana Lúcia disse...
"a maneira com que os usamos é que determina a análise do assunto estudado. E isso se vê todos os dias nos jornais."

Tem uma manera correta.
Issa é a maneira em que os cientistas utilizam a estaistica. Se erraa, um outro cientista descobertara isso: é olegal de a ciencia, es perfectible.

Se voce é cientista, voce debe utilizar a estatistica de manera certa.

"Gostaria de esclarecer, professor, as funções inerentes da pesquisa quantitativa e da qualitativa."

Se fala que onde fica a pesquisa cuantitativa iniciase a pesquisa cualitativa. Más não é isso. Voce pode comenzar una pesquisa cuantitativa onde fica (termina) uma cualitativa.

A cuestão é que cada problema requiere uma tecnica, ou varias.

"a qualitativa estima percepções, sendo percepção a relação que uma pessoa tem com uma dada realidade, situação ou produto."

A verdade... a distincão entre ambas pesquisas como caminhos separados é ruim. Som caminos complementarios e necessarios. Os dois.

Katrine disse...

Oi para todos!
O que vem me incomodando é como fazer uma pesquisa quantitativa, que seja parte da minha pesquisa, se eu preciso de 2.500 pessoas? É um número tão alto! Este seria o caso de uma pesquisa para ser desenvolvida em grupo ou só daria mesmo para ser levada por um instituto de pesquisa, tipo Ibope? Se eu entendi bem, na última aula o Alberto falou que podemos fazer análises quantitativas usando uma população e não amostra. Fiquei pensando como eu poderia fazer isso para tirar conclusões interessantes sobre o que quero saber. Não consegui ainda pensar em nada que fosse interessante. Aceito sugestões! Estou fazendo cálculos com a fórmula para ver se é possível, caso não encontre uma população pequena o suficiente, pelo menos uma que não seja tão grande a ponto de ter que fazer as 2.500 entrevistas. Enfim...
Até amanhã!

Joyce disse...

Olá caro professor e colegas,

Somente hoje tive tempo de entrar no blog e ler os comentários da aula passada. Pelo que observei a maioria está como eu descobrindo agora o mundo da estatística ou pelo menos a possibilidade de sua utilização como ferramenta para enriquecer seu trabalho. Tenho pensado muito e também me chamou a atenção os comentários dos colegas como a Silvana, Ana Lúcia, Cláudio e outros em relação a questão da manipulação dos dados estatísticos. Acho que todos sabemos empiricamente que isso costuma acontecer até com uma frequência. Mas concordo com o professor Alberto quando ele, em resposta ao comentário da Ana Lúcia, disse que "Se voce é cientista, voce debe utilizar a estatistica de manera certa". Acho que esse deve ser o esforço diário não só dos cientistas mas também dos jornalistas. Embora os números, como disse a Ana, se prestem a tudo eles devem ser usados de forma ética. Se há empresas que ousam manipular o resultado de pesquisas só temos a lamentar que isso ainda ocorra.

Anônimo disse...

Pelo que notei nos comentários dos colegas prevalece o receio ao uso da estatística. Acredito que o "medo" de lidar com números e, principalmente, saber interpretá-los corretamente é uma das grandes "barreiras epistemológicas” que encontramos dentro das pesquisas em Comunicação. No último encontro recordei das aulas de jornalismo econômico, quando meu professor entregou uma ata da reunião do Comitê de Política Monetária do Banco Central (COPOM) e disse: “interpretem os dados e escrevam uma matéria de duas páginas”. Recordo que fiquei totalmente perdida em meio a tantos gráficos, tabelas, dados. Não sabia por onde iniciar o texto. Era velho medo dos números.
Confesso estar bastante interessada no emprego da estatística, principalmente na construção de amostragens, embora pense que não a utilizarei na minha pesquisa, ao menos por enquanto.
Ao se trabalhar com Comunicação parece que o caminho mais fácil é fugir de qualquer cálculo, qualquer relação com números ou contas. Basta simplesmente trabalhar com análises qualitativas. Não seria o mais adequado aliar pesquisas quantitativas e qualitativas?

Anônimo disse...

Professor Alberto e colegas,
gostaria de pegar carona no comentário do Lauro. Já entendi que minha investigação não comporta uma pesquisa quantitativa, portanto estou ansiosa para entender as modalidades de pesquisas qualitativas que, me parece, podem oferecer respostas mais adequadas ao meu problema de pesquisa. O interessante, neste processo, é conhecer as possibilidades que a estatística oferece para as investigações científicas no campo da comunicação.

Unknown disse...

Prezados professores e alunos...como faço para chegar neste resultado de amostra estratificada?

Se você mesma for entrevistar, considerendo que vc tem uma população de 400 clientes fiéis(1º grupo) e 166 não fiéis (2º grupo), você deve entrevistar 195 no 1º grupo e 115 no 2º ( quanto menor o tamanho da população, maior o tamanho da amostra). Fiz esses cálculos considerando erro de 5% e nível de confiança de 95%.