Visone. Analise visual de redes. Primeiro instalar Java. So deposis Visone. Serve para qualquer SO.
AnSWR. Software de analise qualitativo de textos. Primeiro instalar este ARQUIVO mdac_typ_27.exe. Só depois AnSWER. Tem algum problema con este endereço? Tente aquim ou aquim. So serve para Windows.
Parece que tem um problema com a senha. Quarta comprovamos.
CDC EZ-Text Um outro software de graça e legal. Serve melhor para analise qualitativo de dados semi-estruturados, um exemplo, entrevistas de respostas abertas
ATLAS.ti. Software de analise qualitativo de textos, imagens e videos. É uma versão limitada no mumero de documentos a pesquisar. Precisam registrarse na web. A versão comercial para estudantes som 175$.
Sites onde trabalhar com dados e visualizções:
Gapminder. Para visualizar dados na Internet, pronto os seus proprios dados poderam ser utilizados.
Nas últimas duas semanas vimos ferramentas de análises de textos. A primeira era CMaps. Trata-se de um software de trabalho colaborativo que permite realizar mapas conceituais. Uma de suas utilidades é poder visualizar uma rede de argumentação desde suas causas a suas conseqüências. É útil para organizar nosso próprio discurso e para fazer uma análise logico de um texto. Mais do que uma técnica de pesquisa é uma ferramenta para pesquisar. Uma outra ferramenta é Fremind. Freemind serve para criar esquemas conceituais, e para elaborar e ordenar tipologias. Por exemplo este esquemas de algumas possibilidades do software Visone.
O software Visone é uma ferramenta para representar redes (nome matematico: grafos. A novidade deste software com respeito a outros, como por exemplo Ucinet, é que a rede se elabora desenhando-a, não a partir de matrizes, e que os resultados da análise também se podem visualizar modificando as características da rede (a forma de seus links, nodos ou a colocação destes). Visone foi criado para pesquisar redes sociais, mas uns anos atras se começou a utilizar para uma técnica específica da Análise Reticular de Dados Textuais (ou do Discurso). Esta técnica aplica a Teoria Argumentativa da linguagem. A Análise Reticular do Discurso ainda não é conhecido em Brasil (ou utiliza um outro nome...) e a nível mundial sua aplicação a textos jornalísticos é muito recente. A análise com Teoria Argumentativa ainda não se utilizou na comunicação (pelo menos eu não conheço).
Os linkes são em espanhol. Se encontram material em português, por favor, indicai-o nos comentários.
Um resumo da Teoria Argumentativa: A Teoria da Argumentação na Língua surge em França a partir das investigações de Oswald Ducrot, quem, influenciado por John Austin, crítica a delimitação da semântica como o estudo das condições para valer dos enunciados, em base ao fato de que ditos enunciados só comunicariam proposições como representações de estados do mundo. A Teoria da Argumentação se aparta do princípio segundo o qual a realidade constitui a base do significado e procura atribuir-lhe ao significado uma base exclusivamente lingüística. Em primeiro lugar, cabe assinalar que não se trata aqui de uma argumentação no sentido tradicional, segundo a qual há argumentação quando um discurso apresenta um segmento A como justificativa de outro segmento C ou conclusão. Neste sentido, o segmento A apresenta um feito H, susceptível de ser verdadeiro ou falso que se relaciona com C. Essa relação é de ordem lógico, psicológico, sociológico ou de outro ordem, mas não lingüístico. Na Teoria da Argumentação na Língua de Anscombre e Ducrot (1994), pelo contrário, a argumentação está muito unida à forma lingüística. Existem expressões que têm, por si mesmas, um valor argumentativo que se impõe aos enunciados nos que aparecem. Esse valor argumentativo é o que permite distinguir entre dois enunciados que apresentam quiçá o mesmo fato (têm o mesmo valor factual), mas que, no entanto, dão lugar a conclusões diferentes. Para estes autores não se argumenta com a língua senão nela, já que são os próprios elementos lingüísticos os que imprimem sua significação ao discurso. Nesta teoria, propõe-se que a significação das frases de uma língua contém uma série de instruções que orientam ao destinatário do discurso em sua busca das conclusões implicadas pelo locutor. Assim mesmo, Ducrot introduz a noção de 'topos', princípio argumentativo tomado de Aristóteles, com algumas modificações. Aristóteles considerava ao 'topos' como uma espécie de fonte onde o orador podia obter toda classe de argumentos para defender suas teses. Em seu livro Os Tópicos, o filósofo faz uma lista de argumentos possíveis, úteis para qualquer orador. Para Ducrot um 'topos' é um princípio argumentativo, não um conjunto qualquer de argumentos, que atua como fiador para assegurar o passo do argumento à conclusão. Basicamente, os 'topoi' são conhecimentos compartilhados por uma comunidade, num momento dado, que contribuem a estabelecer conexões entre determinados fatos e que compartilham as seguintes características: 1) são comuns ou compartilhados por uma comunidade ou, mais bem, apresentam-se como aceitados por uma coletividade da que faz parte a pessoa assimilada com o enunciador, como uma crença compartilhada por uma multidão de pessoas; 2) são princípios gerais, apresentados como válidos não só na situação da que se fala, senão numa infinidade de situações similares; e 3) os 'topoi' são graduais, pois põem em relação duas escalas (por suposto tambem graduais), a de um antecedente P com um conseqüente Q. Essa relação é gradual, já que a argumentação pode fincar pé no aspecto mais ou menos forte do argumento ou mais ou menos fraco da conclusão. Ditas relações graduais são as escalas argumentativas que organizam hierarquicamente os argumentos segundo a força que tenham. Por exemplo, ser muito trabalhador está na mesma escala argumentativa de ser algo trabalhador; o que os diferença é que ser muito trabalhador tem maior força argumentativa do que ser algo trabalhador. Outro elemento importante da Teoria em referência é o da 'orientação argumentativa', que se relaciona com a direção que tomam os argumentos de um enunciado. Assim, dois argumentos estão co-orientados argumentativamente se ambos levam à mesma conclusão, por exemplo: Faz bom tempo. Vamos à praia. Resulta natural associar a idéia de "bom tempo" com a de "ir de passeio ou à praia". Em mudança, os argumentos antiorientados nos levam a conclusões contrárias.
Traducido dum texto de Claudia Herczeg (Universidad de Chile, Facultad de Filosofia y Humanidades, 2004)
Texto para análise (Folha de São Paulo):
Dilemas do PSDB
BRASÍLIA - Na oposição, o PT do Lula metia a lenha em tudo do governo tucano. No governo, o Lula do PT faz tudo igual e ainda aprofunda o que antecessor tucano fazia. O dilema tucano é: como combater suas próprias criaturas? Se o PSDB articula a votação contra a prorrogação da CPMF, está negando o passado. Foi o governo FHC quem transformou o imposto provisório em contribuição permanente "da saúde". Se vota contra a entrada da Venezuela no Mercosul, como fez ontem na Câmara junto com o DEM e o PPS, também está negando o passado. Foi o governo FHC quem selou a forte aliança dos dois países. A reviravolta só começou em 2002, quando o então candidato José Serra bateu em Chávez na tentativa -de resto, inútil- de marcar posição no cenário internacional. Nos dois casos, da CPMF e da Venezuela, o PSDB ficou num beco sem saída, pois o contrário seria um desastre político. Continuar sentando à mesa com ministros de Lula e afinal dar de bandeja a bolada de R$ 40 bi da CPMF aos cofres do governo em 2008, ano eleitoral, seria dar os ovos na boca da raposa. E votar a favor da Venezuela no Mercosul seria badalar a política externa de Lula, que enaltece Chávez como companheiro democrático, útil para as exportações brasileiras de manufaturados e fundamental ao Mercosul. Nos dois casos, o PSDB está sem alternativa e debate-se febrilmente entre ser coerente ou votar politicamente e como oposição. Os tucanos deixaram seu programa e suas bandeiras escorrerem pelos dedos para Lula, e, agora, bater no governo é bater no que eles próprios criaram. Não é o caso de "toma que o filho é teu". É deles -do PSDB, embalado e engordado por Lula. Como dizia Pedro Malan, tudo é "um processo". Lula se beneficia do processo. O PSDB vagueia sem rumo, tentando ser oposição sem poder ser.
“Análise de Conteúdo” é um conceito errado, na realidade som os análises de conteúdo.
Não existe UM análise, mas vários análises. Se pode falar de análise de conteúdo como se fala de análise estruturalista (na realidade existem muitos tipos de analises estruturalistas).
O livro mais conceituado no Brasil tem na capa “Análise de Conteúdo”. Este livro na Espanha se lhama de “Análisis de Contenido” (plural ou singular). Na realidade o livro em francês é singular, mais fala de muitas técnicas.
Segunda coisa: Análise de Conteúdo NÃO é uma teoria da comunicação; não é, si quer, uma teoria.
O Análise de conteúdo não foi desenvolvido por teóricos da comunicação, por comunicólogos, sinão por diversas pessoas: teólogos, politólogos, psicólogos, sociólogos, historiadores... (Foi Berelson quem fiz primeiro livro, sim.)
Todos eles partem do seus próprios fundamentos teóricos, mas partem dum paradigma comun.
Qual é esse?
-A comunicaçao é importante. -As comunicações que utilizam linguagem verbal (falado ou escrito) som importantes para conhecer alem do próprio texto. [Um “texto” pode ser também o lixo dum prédio. Que será que ele fala dos donos do condomínio?]
O problema é utilizar análise de conteúdo com uma teoria errada. A culpa não é da técnica. Mas Veron fala da técnica como errada quando fala do seu “Analise do contrato de leitura” (isso é marketing acadêmico).
“el método más corrientemente aplicado al estudio de los soportes, el análisis de contenido , es inadecuado para estudiar el contrato de lectura. Los problemas de posicionamiento, que se ubican habitualmente en el soporte, se definen en función de su concurrencia (competencia), es decir, en función de otros soportes que le son cercanos, en el interior, consecuentemente, de un universo temático determinado. En esta situación, el análisis de contenido corre el riesgo de hacer aparecer lo que los soportes en competencia tienen en común , lo que los acerca más. Y, en el mejor de los casos, el analista de contenido le dará una importancia muy grande a los matices del contenido, sin que esto permita definir una estrategia redaccional.” (1)
Na realidade Veron não esta falando de uma nova técnica, só... (só) de uma nova teoria. O mesmo aconteceu com “analise do discurso". Mudar o nome foi decisivo para sucesso da nova técnica, ainda que ela seja um analise de conteúdo, como o “analise do contrato de leitura”. Mas publicitariamente não, é melhor fazer uma coisa nova. É curioso que estas novas técnicas sejam coisa de pesquisadores da comunicação. Os outros pesquisadores sociais só se preocupam dos resultados, não do nome da técnica.
(As críticas ao análise de conteúdo vem do campo da comunicação, área muita fraca de teorias fortes.)
Segunda coisa: Análise de Conteúdo não considera que todo esta no texto, mais que o texto existe, e que existe ademais como indicio do que está alem de ele.
Evidentemente que as pessoas que desenvolvierom as técnicas sabem que não todo esta no texto, mas o texto é real, o texto é objetivo, o texto PODE SER ANALIZADO. As ideias das pessoas não.
Textos e discursos podem ser analisados como signos e como indícios.
-Como signos eles som o que som, fazem sua função -comunicar- e voçe não precisa avaliar isso com um analise, não é? A maioria dos textos som elaborados para ser comprendidos facilmente, os actos de fala som asi. Eu leio uma noticia e comprendo o conteúdo porque ela foi feita para ser comprendida. Ela foi feita segundo uma tecnicas que aseguram sua comprensão.
Se um texto está feito para ser comprendido facilmente, o análise de conteudo examina como é que ele transmite esse conteúdo.
Exemplo: Agora a CIA utiliza tecnicas de análise de conteúdo para filtrar millones de mensagems, tarefa que poderiam fazer milhoes de pessoas som feitas por un software. O que se fala é que eles procuran palavras como bomba, atentado... não e bem asím... e muito mas complexo.
Mas quando um texto esta producido com muito esforzo e tempo ele poder ser analizado com o mesmo esforzo como signo. Os textos diplomáticos som analizados asim.
Exemplo: Tudos os discursos feitos por lideres mundiais som analizados por politólogos estadounidenses do Departamento do Estado.
-Ademais tudo discurso e um indicio do seu productor, do seu processo da produção. Como signo depende da vontade do seu produtor. Mas como indicio não. Por isso voçê conhecerá mais do que o emisor quería, o melhor do que o emisor poderia transmitir.
Exemplo: cartas de suicídio. Será que este cara realmente queria morrer? Foi por chocar que ele fez isso?
Que senso tem fazer “analise do discurso” de cartas de suicídio? Nenhum. O psiquiatra sabe tudo o que pode saber do enfermo, sabe que ele queria ou não queria morrer, mais ele só quer saber se a carta é indício fiável de suicídio real o simulado. Só isso. E isso é muito.
Quando se critica as técnicas, lembrem-se, técnicas de análise de conteúdo, se esquece o fundamento de ela: o texto é um indicio, não só um signo. Você não só pode analisa-lo como signo, mas também como indicio.
Técnicas de Análise de Conteúdo fazem uma descrição dum texto mediante medições do indicadores do texto. Isto é, um método objetivo que pode ser repetido por outros pesquisadores. A virtude dos AC é que ele procura resultados e, sobre todo, que ele pode ser repetido. Lembrem-se da reprodutibilidade da Ciência.
A terça virtude do AC é que é rápido, então você pode aplica-lo a muitos textos.
A quarta virtude e que pode ser realizado com auxilio da computadora ou ate realizado só por uma computadora e um software. Então a falta de acurácia e profundida fica compensada por a extensão do analise.
Mas que é o que podemos medir?
-Ocorrência de palavras ou de conceitos. O numero de vezes que você fala de uma pessoa é indicio do seu inteires por ela. O numero de vezes que se fala dum tema no jornal é indicio de... isso dependerá da teoria. -Ocorrência de palavras ou conceitos referidos a alguma realidade. Quais som as palavras ou conceitos que você utiliza para falar da sua mãe? Que palavras ou conceitos aparecem acompanhando as noticias sobre Lula? Que qualificativos utilizam-se acompanhando as noticias sobre um tópico especifico? -Co-ocorrência de palavras ou conceitos. Quando se fala de uma palavra o conceito quais outras aparecem o mesmo tempo? -Estrutura logica do texto: pode ser gramatica, semiótica, estruturalista, dialéctica, etc. Exemplo: os estudiosos podem saber se um texto foi feito por uma mulher o um homem (85% efetividade), e se dois textos forem feitos por o mesmo autor (aplica-se a analise de obras literárias) a partir da sua estructura.
A codificação requer trés fases:
-Numa primeira se escolhe o universo do estudo, as unidades a ser pesquisadas, as unidades cujo conteúdo vamos a pesquisar. Temos que distinguir:
-Unidades de registro: A que tipo de unidades aplica-se o analise. Podem ser palavras (com a mesma categoria lexical -sinônimos- o semântica -qualquer termino por seu senso, assim que ele seja verbo ou nome ou qualquer categoria), ou frases, temas, personagens, acontecimentos (conteúdo)... mas também podem ser unidades formais como itens (capítulos, noticias, um programa de radio..) o unidade espaço temporal tal que um minuto, uma coluna... Som coisas dotadas do senso o que podem ter um senso. -Unidades de contexto: As unidades de registro tornam-se significativas num contexto. Muto importante sempre, mas mais importante ainda nos analises do co-ocorrências. As unidades de contexto dependem sobre todo da teoria.
A maioria das criticas ao analise de conteúdo som porque supostamente ele inora o contexto. Mas um bom análise de conteúdo considera sempre o contexto. Você analisa um texto porque conhece o contexto. Se você não conhece o contexto de uma comunicação, não tem jeito fazer um AC.
O problema é que para os pesquisadores que desenvolveram as técnicas o contexto era o seu fundamento de pesquisa: um politólogo não pode esquecer o contexto dum texto porque é a sua tarefa. Por isso não falavam muito do contexto. Mas para um comunicólogo a sua tarefa de pesquisa som os textos... então e preciso que ele não esqueça o contexto. O problema do contexto só é um problema para nos... Um psiquiatra, um sociólogo não pode esquecer o contexto de um texto porque o contexto é sua área de pesquisa.
-A escolha das categorias. Não sempre você necessita categorizar as unidades de registro, mas quase todas as teorias categorizam os textos. A categorização depende da teoria. Se você categoriza sem teoria, essa categorização já é uma teoria. As categorias agrupam as unidades de registro. As categorias não só som semânticas o lexicais, senão que também podem ser sintáticas, expressivas (se você analisa textos orais), ou de outra ordem. Se podem compartilhar várias dimensões de análise, e por tanto a mesma unidade de registro situar-se em mais de uma categoria.
Dimensões possíveis: -Do tópico ou tema. -De avaliação. -De receptores ¿a quem atinge o mensagem? -Para posicionar no tempo ou espaço. ...
Uma categorização é uma classificação, mas antes você precisa ter o inventario das unidades de registro ou pelo menos, conhece las. Você só pode classificar o que conhece.
Como classificação, uma categorização debe ser: -No aspecto formal:
-Excludente: não debe ter duvida sobre qual é que será a o valor numa categoria de uma unidade de registro concreta. -Homogêneo: “a mulheres som loiras, fracas ou inteligentes”; não se pode funcionar com dimensões distintas.
-No aspecto do seu conteúdo:
-Pertinente: É coisa de uma boa teoria. Uma categorização tem que ser adequada aos fines. -Objectiva: Duas pessoas distintas que usem mesmas categorias, categorizaram o mesmo material do mesmo jeito. Muito importante. -Produtiva: É coisa de uma boa teoria. Se depois de todo as categorias no oferecem resultados, não som boas.
Como se trabalha quando você não categoriza? Quando se faz um analise exploratório. Más também tem análise que não categorizam: analise de cumprimento de palavras (Lei de Zipz), análise de co-ócorrencia de palavras (Lei de distribuição da freqüências lexicais).
-As regras de contagem: As unidades de registro som consideradas ou contadas segundo categorias, mas para isso você precisa um modo, umas regras. -Podem ser sua mera presença ou sua ausência. Isto é habitual nos análises qualitativos. -O numero de isas presenças, a freqüência. Segundo isso, a importância é correlacionada com a freqüência da aparição. -O peso de aparição de cada unidade de registro, a ponderação. -O modo de aparição das unidades de registro. Na capa mais importante que no título, no título mais importante que no texto.
“O refinamento técnico, a importância dada nos relatórios americanos às questões de método em detrimento dos resultados e da sua interpretação deixam perplexo o leitor francês, pouco habituado a incomodar-se com ais subtilezas de procedimento”. Laurence Bardin. “Análise de Conteúdo”
Isso reflete um prejuízo ao respeito das técnicas de análise de conteúdo: não importam tanto os métodos como os resultados. Quando som os métodos os que avaliam os resultados! Um resultado não é bom porque é bom, porque o que fala é gostoso com uma teoria. É bom porque você pode avaliar lo, e só pode avaliar lo se pode avaliar a técnica.
Exemplos:
-EAA (evaluative asertion analysis, Osgood, Saporta, Holsti e outros, circa 1956): objetivo é inferir atitudes dos locutores a partir de suas mensagens; parte da teoria “representacional” do linguagem: o linguagem reflete diretamente atitudes do que o utiliza. So trabalha com o manifesto. É utilizado por politólogos para examinar as atitudes de políticos, estados, jornais... Esta muito desenvolvido. Tem software que utilizam dicionários de conceptos que estám categorizados segundo trés dimensões: Avaliação, Potência, Atividade, com 7 graus (3 +, 3 –, e 0) Assim temos os valores: Abandono: -2,-3-3; Cumplicidade: 2+,0,+3;
O que ele faz é medir segundo trés eixos o manifestado num discurso por um sujeito respeito dum outro sujeito. Os pesquisadores sabem que só mede o manifesto, não serve para o latente. Serve para comparar o manifestado por diplomáticos dum estado ao respeito dum outro antes e depois dum momento concreto, ou para comparar atitudes dum pais ao respeito dum estado e dum outro. Lembrem se, ele se utiliza faz muito tempo, então os politólogos tem series históricas. Serve nos casos em que o discurso é muito trabalhado porque os emissores conhecem que ele será examinado.
-Page Rank: Google mede a importância de uma página web por suas relações. É um análise de conteúdo de tipo relacional. Está explicado, em perfeito castellano :-( aqui
Descarregar e instalar estes dois programas. O primeiro é Visone. Antes descarregar-vos desde aqui Java. Como Java corre em cualquer sistema operativo, Visone serve para qualquer sistema operativo. Descarregar aqui Visone.
O segundo é AnSWR. Primeiro descarregar-vos e instalar este arquivo:mdac_typ_27.exe, e depois o programa AnSWR ou tentem aquim, ou aquim. Só serve para Windows XP.
Só abro esta entrada para que conteis os avanços em vossas pequenas pesquisas: avanços, problemas, etc.
(Ontem o jornal da noite do Globo dedicou uma notícia de 80 segundos a falar dos progressos em reduzir a desigualdade no Brasil produzidos "nos últimos 10 anos", mas não deram mais dados.)
A exposição de hoje tinha por objetivo convencer-lhes de que não há dois mundos, o da pesquisa quantitativa e o da pesquisa qualitativa. A tese doutoral da que falei hoje utiliza todas as ferramentas necessárias para chegar a seu objetivo: analisar as representações sociais sobre a Amazonia existentes em dois momentos da história de Brasil. Tudo isso inserido em uma teoria (teoria da mediação social da comunicação), que permite partir de técnicas reconhecidas (“análises das representações do relato” e dentro dessa técnica se há utilizado o “modelo canónico para a análise da mediação cognitiva”) e de conceitos aceitados. A partir desses conceitos, e inseridos em a teoria, podem-se desenvolver novos conceitos (como o do mitologema). E graças a que se APLICA a teoria esta pode ser corrigida ou refinada (as teorias se não podem ser aplicadas não deveriam ter esse nome). E a partir do uso de técnicas já utilizadas se podem propor novas técnicas.
As técnicas utilizadas em essa tese foram: a mostra estatística, a análise de conteúdo (de tipo estrutural e de participação), a utilização de estatística inferencial, a interpretação das inferências estatísticas mediante a pesquisa bibliográfica relativa ao período estudado, a pesquisa bibliográfica sobre mitos, a hermenêutica dos textos, a teoria de juízes, técnicas estructuralistas de análises de mitos, técnicas de análise lógica, técnicas de estatística multivariable (escalamento multidimensional e análise de componentes principais) e representações gráficas.
Anexo a Datashow da tese da Doutora Grace Stefanello: Análisis de los relatos de la prensa brasileña sobre la amazonía en dictadura y democracia.
Antes de existir a medida a humanidade avançou, acredito. Quando se acabavam os dedos da mão para contar ovelhas podias levar uma bolsa cheia de tantas pedras como ovelhas tivesses. Para medir distâncias se utilizavam os passos: era uma medida muito pessoal, mas mais ou menos homogênea. Mas pôr de acordo a duas pessoas sobre quantos passos tinha entre uma cidade e outra era impossível.
O tempo se media em dias, em luas e em anos. Graças a que se aperfeiçoou a medida do tempo avançou a agricultura e mais tarde a navegação pela mar.
E graças a que se aperfeiçoou a medida dos fenômenos físicos avançou a ciência.
Renunciar a priori à medida em ciências sociais ou humanas é um erro. Reconhecer sua dificuldade, não. Critiquemos uma medida concreta de um fenômeno social, não o conceito de medida. Qualquer medida pode ser aperfeiçoada, mas nenhuma medida não é a solução.
Confiar exclusivamente em a medida também é um erro. Para isso são necessárias a teorias. As teorias explicam, as medidas não. Mas as teorias explicam a realidade. E a única maneira de que a realidade não seja uma construção subjetiva para cada uma das pessoas é medí-la.
Aula de hoje teve a intenção de convencer-vos da utilidade de usar técnicas a partir de dados numéricos para realizar qualquer tipo de pesquisa.
No primeiro caso, suponhamos que queremos fazer uma pesquisa sobre o efeito que sobre as vendas de um diário têm as portadas. Temos os dados de venda e pareceria trivial: escolhemos os dados mais altos.
Mas uma série de dados temporários pode ter uma tendência a longo prazo que não se explicaria pelo interesse das portadas: melhor distribuição do diário, aumento do nível cultural, desaparecimento da concorrência…O primeiro passo seria desagregar esse efeito, isto é filtrar o aumento ou descenso das vendas produzido por essa tendência. Em meu caso utilizei a forma mais simple: uma média móvel utilizando 12 meses. Cada dado é a média dos 12 meses mais próximos (tem métodos mais sofisticados).
O seguinte passo sera restar à série original a tendência. Deste modo obteríamos uma série sem tendência de crescimento que oscilaria sobre o valor zero.
Mas temos outro efeito, o da tendência sazonal. Cada mês pode ter uma tendência a mais ou menos vendas por causas climáticas ou sociais. Para calcular esta tendência sazonal utilizo também um método muito simple: faço a média de todos os meses janeiro, de todos os meses fevereiro… Obtemos uma gráfica sazonal.
Nossa série é mensal. Se tivéssemos dados diários teria que considerar por separado o efeito dos dias da semana, dos dias do mês, e dos meses do ano. E se quiséssemos ser muito precisos contaríamos a Semana Santa por separado.Agora estamos à série de dados sem tendência os dados estacionais e obtemos uma série de dados cujos “altibajos” não podem ser observados nem pela tendência nem por a sazonal. São os dados que queremos explicar mediante as portadas.
Em outras ocasiões ter uma sensibilidade para os dados pode permitir propor pesquisas de qualquer tipo. Faz uns dias escutei uns dados de PNUD Brasil sobre o desenvolvimento humano no Brasil. Tinha diminuído a desigualdade social (índice de Gini) e o índice de pobreza absoluta, além de aumenta o Índice de Desenvolvimento Humano (IDH). Procurando em Internet encontrei série de dados de IDH desde 1975. Preparei esta gráfica na que se mostra na vertical o IDH em 2004, e na horizontal o incremento de IDH desde 1975.
Comprovei de uma olhada que Brasil se tinha desenvolvido muito, e que África (em vermelho) se tinha estancado, ou inclusive retrocedido. Vendo mais em detalhe comprovei do que, dentro de seu meio (latinoamerica, amarelo), Brasil tinha aumentado muito seu IDH. Em resumo: Brasil é um país que se desenvolveu muito.
Então tente de comprovar o grande problema de Brasil, o problema que é tema recorrente das portadas de diários e dos jornais de TV: a corrupção. Existe uma ONG Transparency Internacional, que mediante pesquisas a empresários oferece um índice de transparência (o contrário de corrupção). Como é uma pesquisa com uma amostragem tem suas margens de erro, mas para esta exposição vou ignorá-los. Vertical, IDH; horizontal, transparencia.
Descobrimos que Brasil não tem uma corrupção extraordinária. Há muitos outros países com IDH similar que têm menores índices de transparência (mais corrupção). Ao que parece é necessário que um país atinja altos índices de desenvolvimento humano para que a transparência se imponha.
Se a corrupção não é o grande problema de Brasil… Qual é? A desigualdade. Para qualquer europeu que passa umas semanas em Brasil (fazendo algo mais do que turismo), este país é um exemplo de desigualdade social. Nesta gráfica temos no eixo vertical a renda per capita em dólares internacionais, que é a riqueza repartida entre todos os habitantes de um país e expressada na quantidade de dólares que fariam falta em EEUU para poder ter esse mesmo poder aquisitivo (porque não compramos o mesmo com um dólar em Brasil que em EEUU). È por isso que Noruega, Irlanda e EEUU tem os mesmos níveis. Eixo horizontal o indice Gini de desigualdade.
Só há uns poucos países em pior situação que Brasil: países do apartheid, africanos muito pobres, e Guatemala… A notícia que dava início a esta investigação indicava que o índice de Gini agora era ligeiramente inferior, mas tão ligeiramente que faria falta um século para chegar aos níveis de igualdade de Noruega…
Pode-se comprovar nesta gráfica que não existem países de desigualdade extrema com uma alta renda per capita: o desenvolvimento econômico precisa igualdade social.
A representação gráfica é uma ferramenta muito importante para pesquisar. A partir destes dados se poderia propor porquê os meios de comunicação de Brasil ignoram este problema, e falam de continuo de corrupção, violência ou aeroportos… isto é, a partir de uns dados quantitativos podemos propor uma investigação qualitativa, e o que é mais importante, podemos argumentar nosso objeto de pesquisa.
A estatística é só uma extensão da capacidade do ser humano de perceber padrões, regularidades, em informação complexa. Para manejar essa informação a estatística precisa que os dados se apresentem em forma numérica. Calcular a média de um conjunto de quantidades é o que faz nosso cérebro quando escuta música. A maioria dos parâmetros (a média é um parâmetro), têm uma representação visual singela, simples. Tem que entender que ao utilizar estatística perdemos detalhe e ganhamos capacidade de entendimento e comparação.
Medidas de Localização ou tendência central São indicadores que permitem que se tenha uma primeira ideia ou um resumo, do modo como se distribuem os dados.
-Média: Suma dos valores dividido por nº dos valores. Se utiliza só com variaveis quantitaivas.
-Mediana: Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana Divide e dois. Si som mais, som quartis. Se utiliza com variaveis ordinais.
-Moda: O valor que surge com mais frequência. Se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Se utiliza com variaveis nominais
Medidas de Dispersão
Desvio padrão, o mais utilizado.
Raiz quadrada de: soma dos quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um:
Utilizamos o quadrado e a raiz quadrada por uma causa matemática que permite que os dados resultantes sejam de melhor uso. E pela mesma razão dividimos não por N, senão por n-1. Sempre é um número positivo: quanto maior, mais dispersão.
Cuando se utilizam duas variaveis
Coeficiente de Correlação: O mais utilizado:
Mide o poder explicativo duma relação linear. Relação linear é do tipo: aumenta uma variável, aumenta em a mesma proporção a outra.
Inferencia estatística
Inferência estatística é o processo pelo qual é possível tirar conclusões acerca da população (universo) usando informação de uma amostra (subconjunto). Se recolhemos dados de toda a poplaçao fazemos um recenseamento. Sondagem é cuando utilizamos uma amostra.
A amostra de uma pesquisa pode ser selecionada de forma probabilística ou não probabilística.
Amostras probabilísticas: -Aleatória simples: As unidades são seleccionadas, uma a uma, ao acaso, a partir de um conjunto. -Aleatória sistemática: Selecciona-se uma única unidade ao acaso, as outras são extraídas com intervalos fixos. -Aleatória estratificada ou por estratos: As unidades são seleccionadas ao acaso, no seio de subgrupos homogéneos, atendendo a variáveis. Geralmente, uma amostra estratificada é constituída a partir das várias amostras simples, sendo cada unidade obtida num dos subgrupos que constituem a amostra. -Grupos, agregados ou cachos: É constituída por subgrupos homogéneos seleccionados ao acaso (modo aleatório) em cujo interior serão escolhidos as unidades de modo aleatório, o bem som seleccionadas todas as unidades.
Nestas amostras se pode aplicar inferencia estatística.
Na algumas ocasiões não podemos eleger uma mostra probabilística, então se fazem amostras não probabilísticas: -Voluntárias (ou por conveniência: Constituídas por unidades que se disponibilizam voluntariamente para integrar a amostra. Neste método selecciona-se a amostra em função da disponibilidade e acessibilidade dos elementos da população. -Intencionais (por acerto): Constituídas a partir das intenções ou necessidades do investigador para estudar uma situação particular, baseiam-se em opiniões de uma ou mais pessoas que conhecem características específicas que se pretendem analisar da população em estudo. -Acidentais (ao acaso): As unidades são seleccionadas respeitando a ordem com que aparecem. O método consiste em seleccionar inicialmente os inquiridos de modo aleatório e, em seguida, escolher unidades adicionais a partir da informação obtida dos primeiros. -Quotas: A característica principal de uma amostra por quotas é a necessidade de se qualificar o respondente "a priori"; têm as vantagens da economia de tempo e de dinheiro; são estratificadas com a locação proporcional ao número de sujeitos de cada estrato.
Nestos casos não podemos fazer inferência estatística, não podemos concluir nada da população.
¿Como fazer amostras?
É fácil. Aplicando uma formula:
A fórmula não importa. Excel ou OpenOffice calcula.
n é o tamanho da amostra δ é o Nível de Confianza Nível de confianza: Si fizeramos a pesquisa 100 vezes, sería como esperamos este porcentagem das vezes... δ = 1 ; 68,3% de vezes δ = 2 ; 95,4% de vezes δ = 3 ; 99,7% de vezes Nos decidimos que nível de confianza queremos para nossa pesquisa. O normal, δ = 2, ou 2δ
p é o porporção do universo que possui a propiedade pesquisada. Se não sabemos, o mais normal, e 50%. q é o porporção do universo que não possui a propiedades pesquisada: é 100-p N é tamanho do população ou Universo. e é erro Significa quanto flutua o valor na amostra. É um porcentagem. O normal é <6%. 3% é bom.
Gerbner, G., Gross, L., Jackson-Beeck, M., Jefrfries-Fox, S. & Signorelli, N. (1978). “Cultural Indicators: Violence Profile nº 9.” Journal of comunication, v. 28, n. 3, pp. 176-207.
Acho que vocês tem este artigo acessível desde a biblioteca da UnB.
ÍNDICE DE VIOLÊNCIA
IV = %P + 2(R/P) + 2(R/H) + %V + %K
IV é o Índice de Violência; %P = Porcentagem de programas que tem algum conteudo violento R/P = Número de episodios violentos por programa R/H = Número de episodios violentos por hora %V = Porcentagem de personagens principais implicados na violencia, como perpetradores ou como vítimas; %K = Percentagem de personagens principais relacionados com mortes, como perpetradores ou como vítimas.
Índice de violencia elaborado em Argentina:
IVTV ficcão = ( a + b + c + 1,4 d + e + 1,5 f )
Alcance a. % de Programas con Actos de Violencia. b. Número de Actos de Violencia por Programa. Intensidad c. Número de Actos de Violencia por Hora. Gravedad d. % de Roles Protagónicos en Actos de Violencia. e. % de Roles Protagónicos en Homicidios f. Índice de Violencia Explícita (Promedio Horario de Actos de Violencia con Armas, Heridas y Muertes)
IVTV jornais = (a + b + c + 1,4d + 1,4e)
Alcance a. % de Noticieros con Unidades Informativas (Noticias) con Violencia. b. Número de Noticias con Violencia por Programa. Intensidad c. % de Unidades Informativas con Violencia. Gravedad d. % de Móviles en Directo en Noticias con Violencia. e. % de Delitos contra las Personas en Noticias con Actos de Violencia
Variável é tudo aquilo que pode assumir diferentes valores, desde o ponto de vista quantitativo ou qualitativo.
Algumas explicações sobre o exposto no mapa conceitual.
Dicotómica: aquela variável que só pode tomar dois possíveis valores.
A forma mais pura de dicotomia é a presença, ausência de um rasgo: -Vêem a television – Não vêem a televisão. Outra forma são as oposições: -Natural -Artificial. As oposições pressupõem que só se pode dar um dos dois valores: algo será natural ou será artificial.
E também temos as oposições com grau zero: Neste caso também existe a ausência de valor para essa variável dicotómica.
Nominal: aquela variável que pode tomar vários valores. Consideram-se nominais aquelas que não podem estar hierarquizados. Por exemplo uma classificação de gêneros televisivos. São variáveis qualitativas sempre.
Sempre se pode transformar uma variável nominal em várias dicotómicas: uma variável com 5 valores em 5 variáveis dicotómicas.
Ordinal: aquela variável que pode tomar vários valores e nos que se pode estabelecer um ordem entre as categorias. Neste caso se trata de gradações de um fenômenos que tem uma interpretação quantitativa. Por exemplo os tipos de distribuição geográfica que tem um jornal: local, regional, estadual, federal. Neste caso estão ordenados de mais a menos.
Quantitativa: aquela variável que pode tomar uma casta numérica de valores.Estas a sua vez podem ser discretas ou contínuas:Número de exemplares vendidos por um salário, audiência de um programa, são discretas: não se pode vender meio exemplar. São o resultado de contar.Percentagem de aumento de audiência de um ano para outro: é contínua, pode tomar qualquer valor. São o resultado de medir ou calcular.
As contínuas podem ser intervalares ou proporcionais. No primeiro caso não se conhece o valor zero, e se escolhe um convencional, criando uma escala negativa. É o caso da temperatura em graus centígrados. Isto significa que 30 graus não são o dobro de tenperatura que 20 graus. Pior em graus Kelvin não é assim. 270 graus kelvin são a metade de 540 graus Kelvin. Isto é asi, porque 0º Kelvin coincide com a temperatura mínima possível.As proporcionais são variáveis nas que o valor zero coincide com o valor mínimo possível da escala. A altura das pessoas é uma variável deste tipo.
Se utilzamos variáveis nominais só podemos fazer uma tipologia, por exemplo a que se utiliza em zoologia. Ordena-se por níveis e cada nível tem variáveis diferentes. Por exemplo, uma tipologia de variáveis:
Aquim os tipo posiveis de clasificaçoes:
Indicadores: Não podemos medir variáveis abstratas, senão fatos que previamente puderam ser conceptuados como indicadores dessas idéias. Para medir essas variáveis nos podemos basear nos indicadores. Os indicadores são algo específico e concreto que representam algo mais abstrato ou difícil de precisar.O processo de encontrar os indicadores que permitem conhecer o comportamento das variáveis é o que chamamos operacionalização.
Hoje aclarei o que entendo por Método Científico. A Ciência tem unidade de método, e não devemos confundir isto com os métodos, metodologias ou técnicas de investigação científica. Podemos falar, também, de Método Geral da Ciência e de métodos específicos; ou de uma estratégia da ciência e diversas táticas. O método da ciência é um modo de tratar problemas intelectuais. A natureza do objeto de estudo concreto ditará possíveis métodos de análises, possíveis ferramentas. Quantas mais ferramentas conheçamos melhor poderemos tratar determinado problema, e mais tipos de problemas poderemos tratar.
O método atual da ciência é o Método Hipotético Dedutivo: insiro nele estão os métodos Dedutivo e Indutivo. Neste mapa conceitual se explica como se desenvolve uma pesquisa na realidade.
Na prática o pesquisador não avança de maneira contínua, com freqüência deve voltar sobre seus passos para fazer correções. Quanta mais experiência tenhamos como pesquisadores mais verdadeiro será nosso desempenho, menos decisões erradas tomaremos e menos teremos do que retroceder. Por outra parte a ciência transita por estes passos que são consecutivos. Para passar de nível antes se teve que acumular muito conhecimento no nível anterior. Isto não significa que não se siga fazendo trabalho em todos os níveis em todas as ciências.
A ciência é um saber acumulativo que pode ser falsado, por qualquer e em qualquer momento, utilizando seu método. A ciência deve ser humilde a curto prazo. Devemos enfrentar problemas que estejam a nosso alcance. Mas podemos fazer ciência em qualquer desses níveis: desde a descrição até a predição da realidade social mediante teorias. Mas por agora parece que as Ciências Sociais devem fazer sobretudo o trabalho de descrever seu mutante objeto de estudo. Em outro post a 2ª parte da aula (Clasificação)
Neste é o blog da disciplina Tópicos Especiais em Comunicação. Metodologia de Pesquisa 2, no Programa de Pós-graduação em Ciências da Comunicação, da Universidade de Brasília-UnB.
Acompanha o processo da disciplina o professor Pedro Russi.
Ainda que o nome que figura na informação oficial é Alberto Rodríguez, o meu nome completo é José Alberto de Francisco Rodríguez. Alberto de Francisco, para abreviar. Rodríguez não é um sobrenome português, e sim um sobrenome anterior à existência de ambas as naçoes: Espanha e Portugal; e por issso é um dos sobrenomes mais extenso da península.
Nas aulas falarei num portuñol que desejo aprimore durante a minha estadia. Espero que todos vocês colaborem comigo, e por tanto, interrompam-me quando não entendam alguma coisa: não gostaria de não ser entendido.
Este blog terá a função de receber seus comentários após de cada aula. Os comentários vão ser de utilidade para a avaliação. Quero comentários breves e reflechidos, e serão bem-vindas as objeçoes aos comentários dos colegas.
Ao finalizar cada aula, farei um resumo neste blog, mas isto não sustitui as aulas.