Conceitos básicos da pesquisa em saúde – parte 2: correlações, confundimento e significância estatística

chart

No primeiro texto da série, falamos sobre o desenho de ensaios clínicos. Vimos a importância de se ter um grupo experimental e um controle, por um lado, e de se incluir participantes com perfis variados nos estudos, por outro. Também vimos que os participantes devem ser alocados aos grupos experimental e controle de forma aleatória. Isso porque questões de saúde são complexas e resultam da interação de diferentes variáveis, como histórico familiar, sexo, idade, e hábitos de vida, por exemplo. Neste texto, vamos nos aprofundar nesse último ponto para explicar o conceito de confundimento.

Confundimento
Como exemplo, pensemos num estudo cujo objetivo é testar uma forma de prevenção de uma determinada doença. Nesse exemplo, a probabilidade de uma pessoa contrair essa doença está associada a seu nível de escolaridade, isto é, pessoas com maior escolaridade têm menor probabilidade de contrair a doença. Se os grupos desse estudo não forem escolhidos de forma aleatória, é possível que o grupo experimental tenha maior escolaridade do que o controle. Como resultado, menos pessoas do grupo experimental contrairão a doença, mesmo que a forma de prevenção testada não tenha esse efeito de fato. Assim, o estudo concluirá, erroneamente, que a forma de prevenção funciona. Esse é um exemplo de confundimento [1]: aparentemente, há uma relação causal entre duas variáveis – no caso, a prevenção e o número de pessoas que contraem a doença – que, no entanto, se explica por uma terceira variável – a escolaridade – que não havia sido incluída na análise.

A solução, portanto, é dada pela aleatoriedade na alocação de participantes nos dois grupos. Mas e se esse recurso não for possível? Isso acontece em estudos observacionais, ou seja, aqueles que procuram identificar as variáveis que levam as pessoas a terem certas doenças. Para algumas variáveis, a alocação aleatória é simplesmente impossível. O histórico familiar é o melhor exemplo: não é possível alterar o fato de uma pessoa ter, ou não, casos de câncer de mama na família, por exemplo. Para outras variáveis, a distribuição aleatória seria antiética. É o caso de comportamentos sabidamente nocivos, como o fumo. Não seria ético encorajar um grupo de pessoas a fumar apenas para que os grupos experimental e controle fossem aleatoriamente definidos.

Como não é possível (ou seria antiético) distribuir essas variáveis de forma aleatória, é possível que os participantes de um estudo compartilhem outras características além daquilo que os pesquisadores querem investigar. Por exemplo, pessoas com maior escolaridade também têm menor probabilidade de fumar. Assim, se um estudo quiser avaliar o impacto do fumo em um desfecho de saúde, a escolaridade pode gerar confundimento, da mesma forma que no exemplo que discutimos acima. Para lidar com essa questão, pesquisadores usam diferentes técnicas estatísticas para avaliar os resultados de seus estudos. Explicar essas técnicas foge do propósito deste texto. O que importa é saber que elas procuram responder à seguinte pergunta: se todos os participantes do estudo tivessem o mesmo sexo, a mesma idade, a mesma renda, o mesmo histórico familiar, os mesmos hábitos, etc., qual seria o efeito isolado do que estamos medindo?

Ainda assim, o confundimento pode ser um problema nesses casos. Aqui, a dificuldade está em determinar quais são as variáveis relevantes a serem incluídas na análise. Vejamos um exemplo conhecido, que diz respeito à relação entre ordem de nascimento e ocorrência de síndrome de Down. Nos dados apresentados por Rothman [2], entre os bebês que foram os primeiros filhos de seus pais, a prevalência de síndrome de Down era de 0,6 a cada 1000 nascidos vivos. Entre os que foram o quinto filho (ou mais), essa prevalência era de 1,7 a cada 1000 nascidos vivos. Olhando apenas esses dados, é possível concluirmos que há uma relação entre essas duas coisas, que a ordem de nascimento afeta a probabilidade de um bebê ter síndrome de Down. Contudo, existe uma variável importante que não está sendo levada em consideração: a idade da mãe. A idade das mulheres quando têm o quinto filho (ou mais) é, em geral, maior do que a idade das mulheres quando têm o primeiro. A idade materna também é fortemente associada com a probabilidade de o bebê ter síndrome de Down: no mesmo conjunto de dados, no grupo de bebês cujas mães tinham menos de 20 anos, a prevalência de síndrome de Down era de 0,2 a cada 1000 nascidos vivos. Entre os bebês cujas mães tinham 40 anos ou mais, essa prevalência era de 8,5 a cada 1000 nascidos vivos, isto é, um aumento de mais de 40 vezes, como o autor aponta.

Correlação
O exemplo acima é uma ilustração de uma máxima frequente da estatística: a correlação não significa causalidade. Correlação significa que duas variáveis caminham juntas, ou na mesma direção – quanto maior a idade materna, maior a probabilidade de o bebê ter síndrome de Down –, ou em direções opostas – quanto maior a escolaridade, menor a proporção de pessoas que fumam. No exemplo da ocorrência de síndrome de Down, há duas correlações: com a ordem de nascimento e com a idade materna. Contudo, só na segunda há uma relação de causalidade.

Mas então, como garantir que a correlação encontrada por um estudo de fato reflete uma relação causal? Como vimos, nos ensaios clínicos, a alocação aleatória dos participantes nos grupos experimental e controle assegura que não haja variáveis não identificadas que possam interferir nos resultados. Em todos os tipos de estudos, contudo, o mais importante é o modelo causal usado para explicar o fenômeno estudado. É esse modelo que informa as variáveis a serem incluídas na análise. Retornando ao exemplo acima, a síndrome de Down é causada pela presença de uma cópia extra do cromossomo 21 e é mais comum que os óvulos de mulheres mais velhas carreguem uma cópia extra de um cromossomo (qualquer um, não só o 21). Portanto, é mais provável que uma mulher mais velha tenha um filho com síndrome de Down. Com base nisso, os pesquisadores sabem que a idade materna é uma variável relevante quando se estuda essa síndrome.

Significância estatística
Por outro lado, um estudo também pode encontrar correlações que são resultados de mero acaso, as chamadas correlações espúrias*. Essas correlações estão envolvidas num problema comum de estudos, o chamado “p-hacking”. Hacking aqui significa manipulação, enquanto o p do nome refere-se ao p-valor, que é uma medida estatística de significância.

O conceito de significância estatística está relacionado à probabilidade. O que os pesquisadores buscam saber é: qual é a probabilidade de que um dado resultado se deva apenas ao acaso? Se essa probabilidade for muito baixa, o resultado é considerado estatisticamente significativo. Em outras palavras, é muito mais provável que esse resultado reflita uma associação real entre duas variáveis do que uma associação espúria.

Contudo, se um pesquisador usar os resultados de um único estudo para testar um número suficientemente grande de hipóteses, é provável que ele chegue a pelo menos um resultado “estatisticamente significativo”, mas que não quer dizer nada porque é resultado de mero acaso [3]. A isso dá-se o nome de “p-hacking”. O “p-hacking” não necessariamente é resultado de uma manipulação intencional, mas pode acontecer se os pesquisadores não tomarem as devidas precauções na hora de analisar seus resultados. Como há a possibilidade de que resultados estatisticamente significativos ocorram apenas devido ao acaso (ou a erros do estudo) é importante que estudos científicos sejam reproduzidos, de forma a corroborar os resultados.

Com este texto, vimos um pouco sobre correlações, o que significa dizer que o resultado de um estudo é estatisticamente significativo, o que é confundimento e como pesquisadores usam técnicas estatísticas para isolar o efeito do que estão medindo das outras variáveis nos resultados. No próximo texto, vamos falar de um último elemento importante para entender ensaios clínicos: o efeito placebo.

*Para quem tiver curiosidade para ver na prática o tipo de conclusão absurda que resulta de correlações espúrias, este site tem vários exemplos, como a correlação entre o número de pessoas que se afogaram caindo em uma piscina e o número de filmes estrelando o ator Nicolas Cage que ilustra este texto.

Referências:
[1] Kamangar, Farin. Confounding Variables in Epidemiologic Studies: Basics and Beyond. Arch Iran Med. 2012; 15(8): 508 – 516
[2] Rothman, Kenneth J. Epidemiology: An introduction. Oxford: Oxford University Press, 2010.
[3] Sterne, Jonathan A. C.; Smith, George Davey. Sifting the evidence—what’s wrong with significance tests? BMJ. 2001 Jan 27; 322(7280): 226–231. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1119478/ (livre acesso)

Anúncios

3 comentários sobre “Conceitos básicos da pesquisa em saúde – parte 2: correlações, confundimento e significância estatística

  1. Pingback: Conceitos básicos da pesquisa em saúde – parte 3: o efeito placebo | cientistasfeministas

  2. Pingback: Precisamos de mais antibióticos: a busca por novos fármacos | cientistasfeministas

  3. Pingback: Conceitos básicos da pesquisa em saúde – parte 4: risco | cientistasfeministas

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s