Conceitos e análises estatísticas com R e JASP
Cap. 1 Prefácio
1.1 Atenção
Atenção: Os capítulos estão apenas parcialmente disponíveis.
Você pode adquirir o livro no site da Amazon, clicando aqui.
Ao fazer isso, você estará apoiando este projeto e auxiliando no desenvolvimento de outros.
Última modificação: 23 September, 2021 às 16:18
Disciplinas do conjunto das ciências humanas e da saúde costumam fazer pesquisas extremamente complexas, em que a diferenciação dos fenômenos de interesse (sinal) daqueles que o distorcem ou o atrapalham (ruído) é, por vezes, bastante sutil e complicada. Uma vez que incerteza é sempre presente, é justamente nestas áreas que a estatística assume um importante papel. Métodos estatísticos permitem que os pesquisadores possam implementar maior robustez metodológica em seus estudos e com isso, terem maior segurança tanto nos resultados alcançados, como nas discussões e conclusões sugeridas.
No entanto, apesar da inegável contribuição que a estatística traz para estas áreas, a ansiedade e o receio que ela gera em estudantes é um fato bem consolidado e conhecido pelos docentes não apenas de estatística, mas de métodos quantitativos no geral. Esse fenômeno traz um paradoxo bastante peculiar, podendo até mesmo fazer com que os estudantes de ciências humanas e da saúde – que são os que mais precisam dos recursos estatísticos em suas pesquisas – também sejam aqueles que têm menor interesse ou até mesmo a maior resistência em aprender esta matéria.
A saída para este impasse não é fácil, mas um dos objetivos deste livro é providenciar uma possível solução. Durante todos os capítulos, o estudante será apresentado à uma pesquisa previamente publicada, em que as perguntas científicas se tornam o centro das atenções e as análises estatísticas aparecem como um enorme auxílio e suporte para que as respostas possam ser elaboradas. Dessa maneira, o estudante será estimulado a pensar e agir como um pesquisador, encontrando suas próprias soluções ou, ainda, aperfeiçoando aquelas que o livro propõe.
O livro é integralmente feito no R e no JASP. Todos os seus códigos estão disponíveis para uso caso o estudante queira reproduzir as análises no R. Todas as telas do JASP também estão disponíveis visando guiar o estudante em cada etapa analítica. Acredito que essa abordagem mais pragmática possa despertar no estudante o interesse na utilização da estatística como uma importante ferramenta da ciência, mas também plantar uma primeira semente para que alguns também queiram entender como a ciência da estatística é formada.
Este livro não seria possível sem a participação dos alunos da PUC-Rio, UFRJ e IBNeuro. Cada um, à sua maneira, contribuiu compartilhando suas dúvidas, questionamentos e reflexões, recursos valiosos para qualquer professor. O suporte e apoio dado por minha esposa também foram fundamentais em cada passo, seja os para frente ou também uns poucos para trás. Finalmente, se eu pude ver mais longe, foi por estar sobre ombros de um gigante, que tem nome e história. O Professor J. Landeira-Fernandez foi (e é) uma pessoa importante em cada etapa do processo, me oferecendo sempre um incentivo para continuar a seguir em frente e me apresentando às vias mais seguras. Finalmente, apesar de grande ênfase em estudantes de graduação e pós-graduação, espero que este livro possa se tornar um importante recurso metodológico para os colegas que trabalham nesta batalha tão difícil, mas tão recompensante, que é ensinar Estatística.
Luis Anunciação, Rio de Janeiro, 20 de abril de 2021
1.2 A proposta
Este livro nasceu como um dos principais e mais frutíferos resultados das aulas de graduação e pós-graduação ministradas por mim em alguns locais, mas com maior intensidade na PUC-Rio, UFRJ e IBNeuro. Por muito tempo, durante as aulas de Estatística aplicada à Psicologia e Bioestatística recorri a diferentes livros que, cada qual de forma particular, apresentavam conceitos de pesquisa, técnicas estatísticas e análise de dados.
No entanto, acabei percebendo (ou tendo a impressão) de que eles apresentavam a estatística por diferentes atalhos pedagógicos, (1) sugerindo que pesquisa e estatística eram áreas distantes, (2) que toda estatística podia ser resumida por testes de hipóteses independentes entre si e que (3) situações envolvendo dados reais não tinham tanto interesse. No geral, pareceu-me que para eles apresentarem a estatística na ciência, era necessário distorcer pesadamente a ciência da estatística. Em função disso, nos últimos anos, eu fui sentindo necessidade de apresentar os conceitos de pesquisa e técnicas estatísticas de forma integrada, coesa e contando com dados reais.
Conciliar estas condições em um único livro de maneira adequada é bastante improvável e esse livro opta por uma abordagem majoritariamente pragmática, mas que evita se distanciar de conceitos teóricos. O pragmatismo é fundamental para que o estudante consiga, rapidamente, entender os procedimentos relacionados à análise de dados e implementar técnicas estatísticas para tomar decisões. Quão antes o estudante entender a utilidade da estatística para resolver problemas, maior é a probabilidade de ele vir a gostar da área. Por sua vez, os aspectos teóricos são os alicerces para que o estudante possa perceber também que a estatística é uma ciência que, ao longo do tempo, conforme a tecnologia avançou, mais sólida e robusta foi se tornando.
Isso posto, este livro tem a proposta de ser um manual ou guia técnico, em que são apresentados conceitos de pesquisa e análises estatísticas utilizando os ambientes de programação R e o JASP e com especial aplicação em Psicologia e Bioestatística. Em cada capítulo, o estudante terá a oportunidade de acessar:
- Uma pesquisa científica, explicitando o problema e as hipóteses que a guiaram;
- O artigo publicado com os resultados;
- A base de dados em formato R ou CSV sem identificação para recriar os cenários dos artigos e poder ilustrar os novos conceitos discutidos;
- Os métodos e as técnicas estatísticas pautadas na teoria discutida que possa responder às perguntas apresentadas nos cenários dos artigos e leve à uma tomada de decisão;
- Recursos extras para aprofundamento em tópicos específicos;
- Resolução de problemas par fixação do conteúdo discutido, ilustrados por provas externas da Área da Psicologia.
Com isso, o livro oferece ao estudante um convite para uma trilha de aprendizado dentro do ecossistema da Psicologia, que o faça resolver problemas para uma tomada de decisão real, pautadas pelo referencial teórico discutido e pelos métodos e técnicas já oferecidos. Em função desses elementos, o foco do livro estará na resolução de problemas da área da Psicologia, a fim de tomar uma decisão mais acurada. Espero que este livro possa ser útil a estudantes de graduação e pós-graduação, agradável a leitores de Estatística como de Psicologia e um recurso importante para outros docentes que, eventualmente, precisem de um material de apoio.
1.3 Objetivo
O livro tem como objetivos (1) apresentar, (2) discutir e (3) operacionalizar conceitos de pesquisa e análises estatística de estudos publicados e de dados reais. Espera-se que qualquer o estudante consiga realizar todas as ações descritas no decorrer dos capítulos de maneira guiada e intuitiva. As sintaxes utilizadas no ambiente R e as telas de execução do JASP são integralmente disponíveis.
1.4 Público-alvo
Estudantes de Psicologia e Bioestatística. As pesquisas e exemplos utilizados são mais aderentes a estas duas áreas. No entanto, os conceitos, métodos e técnicas estatísticas são interdisciplinares e, com isso, espera-se que estudantes de áreas como Educação, Administração e Economia também possam aprender com o livro.
1.5 Formato do livro
O livro foi pensado para ter uma estrutura (1) organizada, (2) linear e (3) formada por capítulos autossuficientes escritos para responder questões pontuais. Acredito que, assim, ele possa atender tanto estudantes interessados em ler a obra inteira, como aqueles que buscam informações mais específicas sobre um tópico particular.
Este formato adotado tende a gerar uma percepção diferente entre aqueles que consultarem apenas um capítulo ou outro e aqueles que lerem o conteúdo por completo. Há uma maior chance de isto ocorrer em capítulos sobre testes estatísticos, uma vez que diversos testes estatísticos são casos particulares de outros. Alguns assuntos que parecem destoantes em uma leitura inicial, tornam-se articulados em outros capítulos.
Muitos capítulos recebem o nome de testes de hipóteses (ex: Teste T ou Regressão). Isso foi intencional e visa auxiliar estudantes que precisem apenas de informações pontuais, bem como tende a enfraquecer a ideia de uma relação ponto a ponto tipicamente feita entre testes estatísticos e delineamentos específicos.
1.6 Como usar este livro
O livro é formado por dois componentes: capítulos teóricos e capítulos voltados à análise de dados. Os capítulos teóricos reúnem alguns conceitos fundamentais de pesquisa e estatística, tais como tipos de variáveis, delineamento de pesquisa e técnicas de amostragem. Estes capítulos foram escritos pensando em alunos de graduação do curso de Psicologia.
Os capítulos analíticos são focados em testes de hipóteses e contam com uma metodologia direta ao ponto, em que atividades similares às realizadas nos artigos são demonstradas. Estes capítulos foram desenvolvidos para estudantes de pós-graduação.
A figura abaixo diagrama os dois componentes de forma aproximada.
1.7 Pesquisas e dados
Neste livro, as seguintes pesquisas e seus materiais são utilizados:
Psychometric properties of a short-term visual memory test (MEMORE)"
“Aspects Related to Body Image and Eating Behaviors in Healthy Brazilian Undergraduate Students”
“Parent-reported diagnosis of Attention Deficit Hyperactivity Disorder and psychostimulant use among children and adolescents: a population-based nationwide study”
As bases são Open Science. Isso significa que elas são gratuitas e universalmente acessíveis para finalidades acadêmicas. Em cada capítulo, as bases irão aparecer na seção “Pesquisa,” da seguinte maneira:
A base desta pesquisa está disponível em formato R (Rdata) e em CSV, que é lido pelo JASP. Clique na opção desejada.
As bases em R tem formato .RData e as bases para o JASP tem formato .CSV.
1.8 O R e os pacotes
O livro é integralmente desenvolvido pelo recurso de “programação letrada” no R Markdown, ou seja, ele entrelaça aspectos textuais e linhas de código. Em todos os capítulos, as funções nativas do R e do Tidyverse serão utilizadas. Caso alguém queira reproduzir as análises, será necessário apenas executar as linhas de código disponíveis no decorrer do livro.
O tidyverse
costuma ter atualizações frequentes. Caso um alerta de deprecated
seja apresentado, isso significa que a função utilizada foi parcialmente desativada, o que não costuma impactar nas análises.
1.9 JASP
O JASP é um programa gratuito que tem sido cada vez mais utilizado em Psicologia. Ele é feito integralmente por código aberto e sua interface é bastante amigável e intuitiva. Ao instalar o JASP, o R também será instalado em seu computador e ficará no pano de fundo. Dessa maneira, todas as ações feitas por Point and Click no JASP, serão convertidas em linhas de código no R e apresentadas de maneira dinâmica no JASP.
Em todos os capítulos, telas do JASP serão apresentadas para que seja possível a reprodução integral de algumas análises. Da mesma forma que qualquer pacote estatístico, o JASP é atualizado frequentemente. Esse livro contou com a versão 0.14.1 e espero que futuras atualizações não comprometam a proposta do livro.
Atualizações pontuais de capítulos serão feitas visando parear o conteúdo do livro com as mudanças nos programas.
1.10 Outros recursos
Em cada um dos capítulos, aplicações da estatística e referências bibliográficas serão apresentadas. Tenha em mente que há um debate intenso em diferentes conceitos de estatística, da mesma forma que muitas condições computacionais podem aparecer durante a execução das análises propostas. Eu recomendo fortemente a comunidade stackoverflow como um recurso pedagógico para auxiliar em ambos os cenários.
Questões relacionadas aos capítulos são listadas de forma a conectar o conteúdo do livro com exigências balizadas por critérios externos, tal como o ENADE e bancas de concurso.
1.11 Capa
Por tradição, livros de Ciência de Dados e Estatística utilizam a imagem de algum animal na capa. Há livros com cachorros, papagaios, peixes, carangueijos, lagartos, etc. Esse livro não foge dessa regra e tem como capa a Jolie, a minha cachorrinha com a Anna. Ela foi indispensável para o atraso ao término deste livro.
1.12 Versão do livro
Como todos os livros, este também tem uma história de desenvolvimento. A tabela abaixo apresenta a versão, a data de lançamento e algumas características importantes.
Versão | Data | Características |
---|---|---|
Beta 2 | Março, 2021 | Revisão textual parcialmente concluída. Fechado parceria com a Nila Press para comercialização da versão final do livro. |
Beta 1 | Fevereiro, 2021 | Primeira versão. Baixa revisão textual e dos conceitos estatísticos. Erros são esperados. A utilização deve ser feita apenas de maneira incipiente |
1.13 Autor
Luis Anunciação é doutor em Psicometria pela Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), com intercâmbio na University of Oregon, mestre em saúde pública pela Universidade do Estado do Rio de Janeiro e especialista em Neuropsicologia (IBNeuro) e Bioestatística (Johns Hopkins University). Atualmente, é professor do Departamento de Psicologia da PUC-Rio, coordenador da ANOVA e psicometrista da Nila Press, uma editora especialzada no desenvolvimento de instrumentos psicológicos. Desde 2016, trabalha intensamente com metodos estatísticos e análise de dados, sendo autor de mais de 30 artigos científicos sobre o tema, publicados majoritariamente em periódicos internacionais.
1.14 Revisão técnica
Este livro contou com a revisão técnica do Dr. J. Landeira-Fernandez (Doutor em Neurociências pela University of California - UCLA, Pesquisador 1A do CNPq) e Ms. Regina Albanense (Graduada em Matemática e Estatística e Mestre em Ciências). Dr. Landeira foi fundamental em tópicos envolvendo aspectos de pesquisa e análises estatísticas e Ms. Regina foi fundamental para revisão da modelagem matemática e revisão conceitual.
1.15 Agradecimentos
Nenhum homem é uma ilha. Este livro só foi possível graças a um conjunto de pessoas que auxiliaram e fizeram uma profunda revisão do texto. Meus sinceros agradecimentos a (ao):
J. Landeira-Fernandez, PUC-Rio
Regina Albanense, CONRE
Cristiano Fernandes, PUC-Rio
Danilo Assis Pereira, IBNeuro
Anna Carolina de Almeida Portugal, UFRJ
Emanuel Cordeiro, UFPE
Jeovani Schmitt, Catarinense Federal Institute of Education, Science and Technology (IFC)
Pedro Fernandez Tonso, aluno de graduação em Psicologia
Alunos da PUC-Rio, UFRJ, IBNeuro e ANOVA