quarta-feira, 19 de setembro de 2007

Mas, tem utilidade tanto dado?

Aula de hoje teve a intenção de convencer-vos da utilidade de usar técnicas a partir de dados numéricos para realizar qualquer tipo de pesquisa.

No primeiro caso, suponhamos que queremos fazer uma pesquisa sobre o efeito que sobre as vendas de um diário têm as portadas. Temos os dados de venda e pareceria trivial: escolhemos os dados mais altos.

Mas uma série de dados temporários pode ter uma tendência a longo prazo que não se explicaria pelo interesse das portadas: melhor distribuição do diário, aumento do nível cultural, desaparecimento da concorrência…O primeiro passo seria desagregar esse efeito, isto é filtrar o aumento ou descenso das vendas produzido por essa tendência. Em meu caso utilizei a forma mais simple: uma média móvel utilizando 12 meses. Cada dado é a média dos 12 meses mais próximos (tem métodos mais sofisticados).

Free Image Hosting at www.ImageShack.us

O seguinte passo sera restar à série original a tendência. Deste modo obteríamos uma série sem tendência de crescimento que oscilaria sobre o valor zero.

Free Image Hosting at www.ImageShack.us

Mas temos outro efeito, o da tendência sazonal. Cada mês pode ter uma tendência a mais ou menos vendas por causas climáticas ou sociais. Para calcular esta tendência sazonal utilizo também um método muito simple: faço a média de todos os meses janeiro, de todos os meses fevereiro… Obtemos uma gráfica sazonal.

Free Image Hosting at www.ImageShack.us

Nossa série é mensal. Se tivéssemos dados diários teria que considerar por separado o efeito dos dias da semana, dos dias do mês, e dos meses do ano. E se quiséssemos ser muito precisos contaríamos a Semana Santa por separado.Agora estamos à série de dados sem tendência os dados estacionais e obtemos uma série de dados cujos “altibajos” não podem ser observados nem pela tendência nem por a sazonal. São os dados que queremos explicar mediante as portadas.

Free Image Hosting at www.ImageShack.us


Em outras ocasiões ter uma sensibilidade para os dados pode permitir propor pesquisas de qualquer tipo.
Faz uns dias escutei uns dados de PNUD Brasil sobre o desenvolvimento humano no Brasil. Tinha diminuído a desigualdade social (índice de Gini) e o índice de pobreza absoluta, além de aumenta o Índice de Desenvolvimento Humano (IDH).
Procurando em Internet encontrei série de dados de IDH desde 1975. Preparei esta gráfica na que se mostra na vertical o IDH em 2004, e na horizontal o incremento de IDH desde 1975.

Free Image Hosting at www.ImageShack.us

Comprovei de uma olhada que Brasil se tinha desenvolvido muito, e que África (em vermelho) se tinha estancado, ou inclusive retrocedido. Vendo mais em detalhe comprovei do que, dentro de seu meio (latinoamerica, amarelo), Brasil tinha aumentado muito seu IDH. Em resumo: Brasil é um país que se desenvolveu muito.

Free Image Hosting at www.ImageShack.us


Então tente de comprovar o grande problema de Brasil, o problema que é tema recorrente das portadas de diários e dos jornais de TV: a corrupção. Existe uma ONG Transparency Internacional, que mediante pesquisas a empresários oferece um índice de transparência (o contrário de corrupção). Como é uma pesquisa com uma amostragem tem suas margens de erro, mas para esta exposição vou ignorá-los. Vertical, IDH; horizontal, transparencia.

Free Image Hosting at www.ImageShack.us

Descobrimos que Brasil não tem uma corrupção extraordinária. Há muitos outros países com IDH similar que têm menores índices de transparência (mais corrupção). Ao que parece é necessário que um país atinja altos índices de desenvolvimento humano para que a transparência se imponha.

Se a corrupção não é o grande problema de Brasil… Qual é?
A desigualdade. Para qualquer europeu que passa umas semanas em Brasil (fazendo algo mais do que turismo), este país é um exemplo de desigualdade social. Nesta gráfica temos no eixo vertical a renda per capita em dólares internacionais, que é a riqueza repartida entre todos os habitantes de um país e expressada na quantidade de dólares que fariam falta em EEUU para poder ter esse mesmo poder aquisitivo (porque não compramos o mesmo com um dólar em Brasil que em EEUU). È por isso que Noruega, Irlanda e EEUU tem os mesmos níveis. Eixo horizontal o indice Gini de desigualdade.

Free Image Hosting at www.ImageShack.us

Só há uns poucos países em pior situação que Brasil: países do apartheid, africanos muito pobres, e Guatemala… A notícia que dava início a esta investigação indicava que o índice de Gini agora era ligeiramente inferior, mas tão ligeiramente que faria falta um século para chegar aos níveis de igualdade de Noruega…

Pode-se comprovar nesta gráfica que não existem países de desigualdade extrema com uma alta renda per capita: o desenvolvimento econômico precisa igualdade social.


A representação gráfica é uma ferramenta muito importante para pesquisar. A partir destes dados se poderia propor porquê os meios de comunicação de Brasil ignoram este problema, e falam de continuo de corrupção, violência ou aeroportos… isto é, a partir de uns dados quantitativos podemos propor uma investigação qualitativa, e o que é mais importante, podemos argumentar nosso objeto de pesquisa.


Tendes um software para fazer gráficos que permite jogar com quatro variáveis, a população, o tempo, e alguns pares de variáveis. è de Fundação Gapminder:

Este trabalha com dados diferentes e uma interface similar. Há que o descarregar ao computador.

Aqui tendes uma representação gráfica da desigualdade por países. Está em escala logarítmica.

Arquivo Excel com dados de jornal espanhol.