2

Conceitos básicos da pesquisa em saúde – parte 3: o efeito placebo

Nesta série sobre conceitos básicos de pesquisa em saúde, já discutimos o desenho de experimentos e os conceitos de correlação, confundimento e significância estatística. Vamos agora discutir um fenômeno curioso com que ensaios clínicos – aqueles que buscam testar novos tratamentos ou intervenções – precisam lidar: o efeito placebo.

Brody [1] define o efeito placebo como “uma mudança na doença do paciente atribuível à importância simbólica de um tratamento ao invés de uma propriedade farmacológica ou fisiológica específica”. Em outras palavras, o efeito placebo ocorre quando há uma alteração no quadro de um paciente mesmo quando o tratamento não inclui uma substância ou intervenção eficaz. Pílulas de açúcar, injeções de soro fisiológico, cirurgias falsas (nas quais o paciente é anestesiado e apenas um corte é feito na pele) são exemplos de placebos. Nenhum deles trata de fato a doença ou condição, mas mesmo assim são capazes de provocar melhoras nos pacientes. As explicações para o efeito placebo são complicadas, envolvem uma multiplicidade de fatores e ainda estão em debate. O mais importante, contudo, é que o efeito placebo é fortemente relacionado com as expectativas dos pacientes [2]. Isso significa, por exemplo, que tratamentos têm mais eficácia quando pacientes estão cientes de que estão sendo tratados [3], mas o efeito placebo também age de maneira mais inusitada: as cores de pílulas têm efeito sobre o tratamento, com base nas associações sobre o efeito estimulante e calmante de cores quentes e frias, respectivamente [4], e até é possível induzir efeitos colaterais com tratamentos inertes (isto é, que não têm princípios ativos reais), desde que os pacientes tenham a expectativa de que sofrerão esses efeitos* [2]!

O efeito placebo pode ser usado para tornar tratamentos mais eficazes: médicos podem incorporar elementos que induzem esse efeito nos tratamentos que indicam a seus pacientes, aumentando as chances de que funcionem. Contudo, ele também representa um desafio à pesquisa em saúde. Se a expectativa de um paciente por si só já pode levá-lo a melhorar, como saber se uma intervenção de fato tem efeito sobre a doença, ou se é um mero placebo? É essa indagação que leva a que o objetivo de ensaios clínicos seja determinar se uma intervenção é mais eficaz do que um placebo**. Para dar conta desse desafio, ensaios clínicos costumam incorporar placebos em seus desenhos de estudo. Assim, o grupo experimental recebe a intervenção que está sendo testada e o grupo controle recebe o placebo. Para evitar que a percepção dos pacientes afete os resultados dos estudos, os participantes não são informados sobre o grupo em que estão. Para garantir que os pesquisadores não interfiram nos resultados dos dois grupos, nem revelem em que grupo cada participante está, eles também não sabem quem é quem durante o estudo. Esse tipo de estudo é chamado de duplo cego e, quando a alocação dos indivíduos nos grupos de tratamento é feita aleatoriamente, é o que fornece as evidências mais confiáveis sobre intervenções em saúde [5].

Contudo, nem sempre é possível fazer estudos desse tipo. Há casos em que não é possível esconder dos pacientes em que grupo estão, especialmente quando se trata de uma intervenção comportamental (é impossível alguém não saber se está fazendo exercício regularmente, por exemplo). Há também casos em que considerações éticas impedem que um grupo receba um placebo, ao invés de um medicamento de verdade. Nesses casos, as evidências produzidas pelos estudos são mais fracas, mas, ainda assim, esses estudos podem dar contribuições importantes à avaliação de intervenções em saúde.

Por que é importante entendermos o efeito placebo? Além de ser extremamente interessante por si só, o efeito placebo também nos ajuda a avaliar intervenções em saúde. Mesmo que você não faça pesquisa em saúde, entender o efeito placebo ajuda a questionar tratamentos vendidos por aí. Afinal, o simples fato de que alguém (ou mesmo várias pessoas) diz ter melhorado com um tratamento não significa muita coisa. Uma boa pergunta para se ter em mente é: “existe alguma evidência de que essa intervenção é melhor do que um placebo?”. Essa pergunta já ajuda a evitar tratamentos pseudocientíficos e é uma arma importante contra charlatães.

No próximo – e último – texto da série, vamos deixar de lado ensaios clínicos para discutir os conceitos de risco relativo e risco absoluto. Até lá!

*Nesse caso, temos o efeito nocebo, essencialmente a mesma coisa que o placebo, mas para efeitos negativos.
**Quando não há um tratamento já em uso. Quando já existe um tratamento, a nova intervenção precisa também ser testada contra o tratamento já existente.

[1] Brody, H. Placebos and the Philosophy of Medicine. Clinical, Conceptual, and Ethical Issues. Chicago: University of Chicago Press, 1980
[2] De Craen, AJ; Kaptchuk, TJ; Tijssen, JG; Kleijnen, J. Placebos and placebo effects in medicine: historical overview. Journal of the Royal Society of Medicine, v. 92, n. 10, 1999: 511-515. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1297390/
[3] Lanotte, M.; Lopiano, L; Torre, E; Bergamasco, B; Colloca, L; Benedetti, F. Expectation enhances autonomic responses to stimulation of the human subthalamic limbic region. Brain, Behavior, and Immunity, v. 19, n. 6, 2005: 500-509.
[4] De Craen, AJ; Roos, PJ; Leonard de Vries, A; Kleijnen J. Effect of colour of drugs: systematic review of perceived effect of drugs and of their effectiveness. BMJ : British Medical Journal. v. 313, n. 7072, 1996:1624-1626. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2359128/
[5] Schulz, KF; Grimes, DA. Blinding in randomised trials: hiding who got what. Lancet. v. 359, n. 9307, 2002: 696-700.

3

Conceitos básicos da pesquisa em saúde – parte 2: correlações, confundimento e significância estatística

chart

No primeiro texto da série, falamos sobre o desenho de ensaios clínicos. Vimos a importância de se ter um grupo experimental e um controle, por um lado, e de se incluir participantes com perfis variados nos estudos, por outro. Também vimos que os participantes devem ser alocados aos grupos experimental e controle de forma aleatória. Isso porque questões de saúde são complexas e resultam da interação de diferentes variáveis, como histórico familiar, sexo, idade, e hábitos de vida, por exemplo. Neste texto, vamos nos aprofundar nesse último ponto para explicar o conceito de confundimento.

Confundimento
Como exemplo, pensemos num estudo cujo objetivo é testar uma forma de prevenção de uma determinada doença. Nesse exemplo, a probabilidade de uma pessoa contrair essa doença está associada a seu nível de escolaridade, isto é, pessoas com maior escolaridade têm menor probabilidade de contrair a doença. Se os grupos desse estudo não forem escolhidos de forma aleatória, é possível que o grupo experimental tenha maior escolaridade do que o controle. Como resultado, menos pessoas do grupo experimental contrairão a doença, mesmo que a forma de prevenção testada não tenha esse efeito de fato. Assim, o estudo concluirá, erroneamente, que a forma de prevenção funciona. Esse é um exemplo de confundimento [1]: aparentemente, há uma relação causal entre duas variáveis – no caso, a prevenção e o número de pessoas que contraem a doença – que, no entanto, se explica por uma terceira variável – a escolaridade – que não havia sido incluída na análise.

A solução, portanto, é dada pela aleatoriedade na alocação de participantes nos dois grupos. Mas e se esse recurso não for possível? Isso acontece em estudos observacionais, ou seja, aqueles que procuram identificar as variáveis que levam as pessoas a terem certas doenças. Para algumas variáveis, a alocação aleatória é simplesmente impossível. O histórico familiar é o melhor exemplo: não é possível alterar o fato de uma pessoa ter, ou não, casos de câncer de mama na família, por exemplo. Para outras variáveis, a distribuição aleatória seria antiética. É o caso de comportamentos sabidamente nocivos, como o fumo. Não seria ético encorajar um grupo de pessoas a fumar apenas para que os grupos experimental e controle fossem aleatoriamente definidos.

Como não é possível (ou seria antiético) distribuir essas variáveis de forma aleatória, é possível que os participantes de um estudo compartilhem outras características além daquilo que os pesquisadores querem investigar. Por exemplo, pessoas com maior escolaridade também têm menor probabilidade de fumar. Assim, se um estudo quiser avaliar o impacto do fumo em um desfecho de saúde, a escolaridade pode gerar confundimento, da mesma forma que no exemplo que discutimos acima. Para lidar com essa questão, pesquisadores usam diferentes técnicas estatísticas para avaliar os resultados de seus estudos. Explicar essas técnicas foge do propósito deste texto. O que importa é saber que elas procuram responder à seguinte pergunta: se todos os participantes do estudo tivessem o mesmo sexo, a mesma idade, a mesma renda, o mesmo histórico familiar, os mesmos hábitos, etc., qual seria o efeito isolado do que estamos medindo?

Ainda assim, o confundimento pode ser um problema nesses casos. Aqui, a dificuldade está em determinar quais são as variáveis relevantes a serem incluídas na análise. Vejamos um exemplo conhecido, que diz respeito à relação entre ordem de nascimento e ocorrência de síndrome de Down. Nos dados apresentados por Rothman [2], entre os bebês que foram os primeiros filhos de seus pais, a prevalência de síndrome de Down era de 0,6 a cada 1000 nascidos vivos. Entre os que foram o quinto filho (ou mais), essa prevalência era de 1,7 a cada 1000 nascidos vivos. Olhando apenas esses dados, é possível concluirmos que há uma relação entre essas duas coisas, que a ordem de nascimento afeta a probabilidade de um bebê ter síndrome de Down. Contudo, existe uma variável importante que não está sendo levada em consideração: a idade da mãe. A idade das mulheres quando têm o quinto filho (ou mais) é, em geral, maior do que a idade das mulheres quando têm o primeiro. A idade materna também é fortemente associada com a probabilidade de o bebê ter síndrome de Down: no mesmo conjunto de dados, no grupo de bebês cujas mães tinham menos de 20 anos, a prevalência de síndrome de Down era de 0,2 a cada 1000 nascidos vivos. Entre os bebês cujas mães tinham 40 anos ou mais, essa prevalência era de 8,5 a cada 1000 nascidos vivos, isto é, um aumento de mais de 40 vezes, como o autor aponta.

Correlação
O exemplo acima é uma ilustração de uma máxima frequente da estatística: a correlação não significa causalidade. Correlação significa que duas variáveis caminham juntas, ou na mesma direção – quanto maior a idade materna, maior a probabilidade de o bebê ter síndrome de Down –, ou em direções opostas – quanto maior a escolaridade, menor a proporção de pessoas que fumam. No exemplo da ocorrência de síndrome de Down, há duas correlações: com a ordem de nascimento e com a idade materna. Contudo, só na segunda há uma relação de causalidade.

Mas então, como garantir que a correlação encontrada por um estudo de fato reflete uma relação causal? Como vimos, nos ensaios clínicos, a alocação aleatória dos participantes nos grupos experimental e controle assegura que não haja variáveis não identificadas que possam interferir nos resultados. Em todos os tipos de estudos, contudo, o mais importante é o modelo causal usado para explicar o fenômeno estudado. É esse modelo que informa as variáveis a serem incluídas na análise. Retornando ao exemplo acima, a síndrome de Down é causada pela presença de uma cópia extra do cromossomo 21 e é mais comum que os óvulos de mulheres mais velhas carreguem uma cópia extra de um cromossomo (qualquer um, não só o 21). Portanto, é mais provável que uma mulher mais velha tenha um filho com síndrome de Down. Com base nisso, os pesquisadores sabem que a idade materna é uma variável relevante quando se estuda essa síndrome.

Significância estatística
Por outro lado, um estudo também pode encontrar correlações que são resultados de mero acaso, as chamadas correlações espúrias*. Essas correlações estão envolvidas num problema comum de estudos, o chamado “p-hacking”. Hacking aqui significa manipulação, enquanto o p do nome refere-se ao p-valor, que é uma medida estatística de significância.

O conceito de significância estatística está relacionado à probabilidade. O que os pesquisadores buscam saber é: qual é a probabilidade de que um dado resultado se deva apenas ao acaso? Se essa probabilidade for muito baixa, o resultado é considerado estatisticamente significativo. Em outras palavras, é muito mais provável que esse resultado reflita uma associação real entre duas variáveis do que uma associação espúria.

Contudo, se um pesquisador usar os resultados de um único estudo para testar um número suficientemente grande de hipóteses, é provável que ele chegue a pelo menos um resultado “estatisticamente significativo”, mas que não quer dizer nada porque é resultado de mero acaso [3]. A isso dá-se o nome de “p-hacking”. O “p-hacking” não necessariamente é resultado de uma manipulação intencional, mas pode acontecer se os pesquisadores não tomarem as devidas precauções na hora de analisar seus resultados. Como há a possibilidade de que resultados estatisticamente significativos ocorram apenas devido ao acaso (ou a erros do estudo) é importante que estudos científicos sejam reproduzidos, de forma a corroborar os resultados.

Com este texto, vimos um pouco sobre correlações, o que significa dizer que o resultado de um estudo é estatisticamente significativo, o que é confundimento e como pesquisadores usam técnicas estatísticas para isolar o efeito do que estão medindo das outras variáveis nos resultados. No próximo texto, vamos falar de um último elemento importante para entender ensaios clínicos: o efeito placebo.

*Para quem tiver curiosidade para ver na prática o tipo de conclusão absurda que resulta de correlações espúrias, este site tem vários exemplos, como a correlação entre o número de pessoas que se afogaram caindo em uma piscina e o número de filmes estrelando o ator Nicolas Cage que ilustra este texto.

Referências:
[1] Kamangar, Farin. Confounding Variables in Epidemiologic Studies: Basics and Beyond. Arch Iran Med. 2012; 15(8): 508 – 516
[2] Rothman, Kenneth J. Epidemiology: An introduction. Oxford: Oxford University Press, 2010.
[3] Sterne, Jonathan A. C.; Smith, George Davey. Sifting the evidence—what’s wrong with significance tests? BMJ. 2001 Jan 27; 322(7280): 226–231. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1119478/ (livre acesso)

6

Conceitos básicos da pesquisa em saúde – parte 1: o desenho do estudo

As pesquisas em saúde costumam receber bastante atenção da mídia, mas isso não significa que os veículos de mídia façam um bom trabalho em explicar os seus resultados. A impressão de que os cientistas estão constantemente mudando de ideia, por exemplo, quanto ao que “faz bem” ou “faz mal” para a saúde, já virou piada velha. Nesta série de textos, vamos discutir os principais conceitos para entender estudos em saúde. Para interpretar os resultados de qualquer estudo, precisamos entender como cientistas descobrem relações de causa e efeito, quais fatores podem interferir nos resultados e que medidas são usadas para contornar essas interferências. Este texto apresenta o desenho de ensaios clínicos, que são os estudos usados para testar novos tratamentos. O próximo discutirá as técnicas estatísticas usadas para analisar os resultados de estudos. O terceiro falará do efeito placebo e o último apresentará os conceitos de risco relativo e risco absoluto, que são fundamentais para entender os resultados de estudos observacionais, ou seja, aqueles que procuram identificar quais fatores levam as pessoas a ter determinadas doenças.

Para entender os ensaios clínicos, vamos primeiro pensar num modelo de experimento mais simples. Digamos que você quer testar se uma substância Y funciona como antibiótico. Você pega uma cultura de bactérias, introduz essa substância e espera para ver se as bactérias morrem. Depois de um tempo, você observa que as bactérias realmente morreram, mas como ter certeza de que foi mesmo a substância Y? Afinal, alguma outra coisa pode ter interferido em seu experimento sem você saber. Para evitar essa interferência e garantir que os resultados são, de fato, efeito da substância que você está medindo, é necessário ter duas culturas de bactérias, totalmente idênticas e mantidas nas mesmas condições, mas só introduzir a substância Y em uma delas. Qualquer diferença necessariamente tem que ser resultado dessa substância, pois todos os outros fatores – ou variáveis – foram controlados. Nesse experimento, a cultura que não recebeu a substância Y é o controle, pois é o que nos diz o que aconteceria sem a intervenção da variável que queremos testar.

A lógica de ensaios clínicos é a mesma desse tipo de experimento. O objetivo é tentar isolar ao máximo o efeito do que os pesquisadores estão medindo – seja ele um remédio, um procedimento, um aparelho, ou qualquer outro tipo de intervenção. Nesses estudos, como no nosso experimento anterior, as pessoas que recebem a intervenção são o grupo experimental e as que não recebem nada formam o grupo controle[1]. No entanto, ao contrário do nosso experimento imaginário, conseguir isolar o efeito de uma única variável é bem mais difícil em seres humanos. Tanto doenças quanto resultados de tratamentos costumam envolver um número grande de fatores, como histórico familiar, sexo, idade e hábitos de vida. Com isso, desenhar estudos para que os dois* grupos sejam idênticos e, ainda por cima, representem bem o conjunto da população é uma tarefa complexa. Uma forma de gerar grupos o mais parecido possível é definir aleatoriamente quais participantes estarão em que grupos. A aleatoriedade evita que pessoas que compartilham outras características – por exemplo, pessoas que têm um mesmo hábito, como fumar, ou que têm o mesmo histórico familiar de uma doença – sejam incluídas num mesmo grupo, algo que poderia interferir com os resultados do estudo (mais sobre isso no segundo texto).

Por outro lado, há o desafio de recrutar participantes com perfis diferentes. Isso é importante porque não há garantias de que os resultados de uma intervenção serão os mesmos para todas as pessoas. Assim, é necessário testar os resultados em pessoas com perfis diferentes para confirmar se a intervenção funciona para todos. Um exemplo disso diz respeito a mulheres grávidas, que geralmente são excluídas de ensaios clínicos devido a preocupações sobre os efeitos possíveis da intervenção na gravidez. Ainda que a preocupação seja justificada, essa exclusão também gera problemas, porque torna impossível obter informações sobre a segurança e eficácia de diferentes tratamentos em mulheres grávidas[2].

Conseguir um conjunto de participantes diverso e dividi-los em grupos semelhantes é com frequência um ponto fraco de ensaios clínicos. Assim, duas das principais críticas de cientistas a ensaios clínicos se focam no fato de terem um número pequeno de participantes, ou apenas participantes de um tipo (pessoas de países desenvolvidos, pessoas brancas, nenhuma pessoa acima do peso, e por aí vai). Em ambos os casos, o que essas críticas estão dizendo é que os resultados desses estudos não necessariamente se aplicam a todas as pessoas e precisam ser comprovados em estudos com um conjunto maior e mais diverso de participantes.

Até aqui, já temos alguns critérios que precisamos ter em mente quando lemos uma notícia sobre um estudo em saúde: qual era o número de participantes? O estudo buscou incluir um conjunto variado de participantes, ou todos tinham um perfil similar? O estudo tinha um grupo controle e um grupo experimental? Eles foram selecionados aleatoriamente? Mesmo que um estudo atenda a todos esses critérios, há outras questões a se considerar. No próximo texto, vamos discutir as técnicas estatísticas usadas para analisar os resultados dos estudos em saúde e algumas dificuldades que essas técnicas precisam superar.

* É possível ter mais de dois grupos em um só estudo, por exemplo, se os pesquisadores quiserem testar combinações de intervenções, mas a lógica do grupo controle/grupo experimental é sempre a mesma.

Fontes:
[1] Hinkelman, Klaus e Kempthrone, Oscar. Desing and Analysis of Experiments – Volume 1: Introduction to Experimental Designs. Hoboken: Wiley, 2008. Disponível em: https://books.google.de/books?id=T3wWj2kVYZgC&printsec=frontcover&redir_esc=y&hl=de#v=onepage&q&f=false
http://care.diabetesjournals.org/content/39/6/1004
[2] Phelan, Alannah L., Kunselman, Allen R., Chuang, Cynthia H., Raja-Khan, Nazia T. e Legro, Richard S. Exclusion of Women of Childbearing Potential in Clinical Trials of Type 2 Diabetes Medications: A Review of Protocol-Based Barriers to Enrollment. Diabetes Care, vol. 40, n. 5, 2017. Disponível em: http://care.diabetesjournals.org/content/39/6/1004