Medicina bayesiana: o raciocínio médico é probabilístico?

 

https://www.puc-rio.br/vestibular/repositorio/provas/2006/imagens/img_espanhol_mafalda_quadro.gif
https://www.puc-rio.br/vestibular/repositorio/provas/2006/imagens/img_espanhol_mafalda_quadro.gif

(Nota: este texto foi escrito partindo das reflexões de Mario Bunge, físico e filósofo da ciência argentino tirado de nós aos 100 anos de idade pelo trágico 2020. Pela sua qualidade duvidosa, não o descreverei como homenagem, mas sim como uma intenção: de, como discípulo, compreender o mundo com somente uma fração da argúcia demonstrada pelo mestre)

    O ano passado transcorreu cheio de polêmicas, fake news, debates acalorados e muitos, mas muitos artigos compartilhados nas redes sociais. Apesar de tudo isso ter envolvido muita perda de tempo, tenho a impressão (sem nenhum embasamento sério) de que tantos embates geraram um pouco mais de curiosidade científica naquelas e naqueles que dependem da literatura médica para tomar suas decisões. 
    Se pudesse dar um palpite, eu diria que os perfis nas redes daqueles diretamente envolvidos com divulgação e análise científica (Choosing Wisely Brasil e seus coordenadores, prof Luis Correia e Guilherme Barcellos, Átila Iamarino, Natalia Pasternak, Otávio Ranzani...) estão com mais seguidores e com mais interações, o que, sem dúvida, representará importante avanço. Espero que, ao longo da prorrogação do inominável ano conhecida como 2021, esse interesse se mantenha e se aprofunde.
  Justamente por isso, foi bastante frequente ver explicações sobre o "raciocínio bayesiano" na medicina. Tomando-o como referência de boa análise da ciência médica, o prof. Luis - que não conheço pessoalmente - chegou a dedicar um episódio de seu podcast (e o menciona diversos textos em seu blog, acompanhados por mim religiosamente) ao tema. Citando o prof
"No século XVIII, o reverendo Bayes descreveu o conceito de probabilidade condicional. A interpretação contemporânea do resultado de um estudo deve se embasar neste pensamento bayesiano. (...) No pensamento bayesiano (probabilidade condicional), um estudo é um teste que serve para moldar uma probabilidade antes existente (pré-teste). Se positivo, o estudo aumenta a probabilidade pré-teste, resultando na probabilidade pós-teste maior do que a pré-teste. "

    A razão central de ser do nosso texto se encontra aí. Faz sentido atribuir probabilidades a um estudo (ou seja, a uma hipótese a ser testada)? 


Duas palavras, uma confusão

    Há, na língua inglesa, duas palavras às quais nós, lusófonos, costumamos atribuir somente uma: traduziríamos como "probabilidade" tanto likelihood quanto probability. Mas existe um problema teórico nisso. Partindo de uma abordagem filosófica realista, vejamos dois exemplos: 

1-  Um hospital aderiu à onda anticiência e decidiu mandar embora parte de sua equipe de análise de evidências. São, no total, 6 médicos, dos quais 2 serão mandados embora. Se você é um deles, qual a sua "probabilidade" de ser despedido? Inequivocamente, são 2 demitidos em 6 médicos, portanto 2/6.

2- Ao lançarmos um dado não-viciado para cima, qual a "probabilidade" de obtermos o resultado 1 OU o resultado 2? Inequivocamente, são 2 possibilidades em 6, portanto 2/6.

  Os dois exemplos são numericamente idênticos e receberam o mesmo nome: probabilidade. Entretanto, existe uma diferença fundamental entre os dois. Geralmente, chefes têm um critério para demitir os trabalhadores: vai embora quem trabalha menos, quem dá mais despesa, quem chega mais atrasado, quem é tecnicamente pior, quem não é amigo de quem manda... Essa decisão pode levar em consideração muitos fatores, mas jamais será aleatória. Já os dados, caso não estejam viciados, são um clássico objeto para gerar resultados aleatórios, ao acaso.

    Ou seja, 2/6 foi o número que mediu a frequência de resultados que nos interessavam, porém cada um deles representa um processo diferente em si (diferença ontológica): um mede a frequência de um acontecimento regido pela causalidade e o outro, de um acontecimento aleatório, em que todas as alternativas são equiprováveis (por definição). 

    O adoecimento, por mais complexo e multifatorial (por enquanto, diremos multifatorial...), é algo possuidor de um evidente nexo causal. Consequentemente, as hipóteses e práticas diagnósticas e terapêuticas não são determinadas ao sabor da sorte, mas sim condicionadas ao mecanismo subjacente ao processo saúde-doença. Logo, não é adequado estabelecer a "probabilidade" (probability) de pegar a doença X, ou de diagnosticar Z, mas sim a frequência de aparecimento da doença X na população ou a frequência de nosso acerto diagnóstico dadas algumas condições -em outras palavras, a propensão de acertar o diagnóstico (likelihood).

    É importante notar que a aleatoriedade é fenômeno objetivo (está nas coisas) e não subjetivo (está na nossa percepção). No primeiro exemplo acima, até que fossem anunciados os nomes demitidos, todos os médicos têm a percepção de que "tudo pode acontecer". Contudo, a decisão sobre quem vai embora pode já ter sido tomada, apesar de não repassada aos trabalhadores. Enquanto o fato estava definido, a ignorância persistia nos indivíduos

    O exemplo do dado, por outro lado, envolve o fato de que nosso lançamento envolve micromovimentos involuntários que impossibilitam a predição do resultado. Portanto, mesmo que tentemos com vontade fazer sair um 6 (ou achemos que tiramos um 6 após jogar), não há como prever. Nesse caso, a nossa ignorância é somente reflexo da aleatoriedade que há no fato

    Em suma, desconhecemos muitas partes dos nexos causais que motivam o adoecimento (seu diagnóstico e seu tratamento), mas isso não o torna objetivamente aleatório. É, por conseguinte, inadequado atribuir a ele probabilidades; somente frequências podem ocorrer.  

    Importante notar que, as coisas não precisam ser só aleatórias ou só causais. Exemplo: os movimentos de objetos macroscópicos (mecância clássica) não são aleatórios; porém todo objeto macroscópico é um agregado de átomos e partículas subatômicas que são regrados por leis probabilísticas (em que a aleatoriedade objetiva existe). 

    Chegamos ao cerne da questão: a aleatoriedade (logo a possibilidade de atribuir probabilidades) está nas coisas (chama-se ontológica), é objetiva. Já a ignorância (incerteza) é um dado - frequentemente - subjetivo (chama-se gnosiológico ou epistemológico), está em nós. 


Ok, e Bayes com isso?

    Na realidade, Bayes tem pouco a ver com isso. Ele simplesmente estabeleceu um teorema matemático. O problema é a interpretação dele. Vejamos o que os bayesianos dizem sobre probabilidades: 

 "A estatística bayesiana compreende a probabilidade como uma medida do grau de confiança da ocorrência de um evento ou da veracidade de uma certa hipótese; ela representa o conhecimento e a experiência" (tradução livre).

  Bom, enquanto, na nossa concepção (realista), probabilidade é um conceito objetivo, está nas coisas, para os bayesianos, ela está nas pessoas - na confiança/opinião das pessoas sobre um fato. Em outras palavras, a interpretação bayesiana é uma visão subjetivista da teoria das probabilidades. Isso abre espaço para algumas coisas. Primeiramente, para estabelecermos "probabilidades" para hipóteses (as quais não são, por óbvio, objetivas. Pertencem ao mundo das ideias...). A pergunta "qual a probabilidade do tratamento X funcionar para a doença Y?" passa a ter sentido. 

    Se a probabilidade está nas pessoas/na confiança - logo no mundo das ideias -, elas podem servir tanto para: 1- para que saibamos a frequência das coisas (qual a probabilidade de alguém de 50 anos infartar no brasil?) quanto para 2- para que consigamos aferir quão verdadeiras proposições são (qual a probabilidade de X ser verdade?). 

   

   Qual é o problema? Primeiramente, consideremos variáveis independentes. Visto que as regras da teoria da probabilidade são aplicáveis para aferir a veracidade de uma hipótese, qual a probabilidade da proposição seguinte ser verdadeira?

"O flamengo é um time de camisa rubro-negro (A) com sede no bairro de Copacabana (B)" 

        Apresentamos o teorema de Bayes: 

       Em linguagem escrita: a probabilidade de A ocorrer dado que B ocorreu é igual à probabilidade da intersecção entre os dois conjuntos dividida pela probabilidade de B ocorrer. Outra forma de dizer "a probabilidade da intersecção entre os dois conjuntos" é "a probabilidade de A e B ocorrerem". 

        Passando o denominador para o outro lado, temos que P(A|B).P(B) = P(A ∩ B). A probabilidade de A e B ocorrerem = a probabilidade de A ocorrer dado que B ocorreu vezes a probabilidade de B ocorrer. 

        São duas variáveis, no caso de nossa proposição, mas, como A e B são independentes, isto é, a cor da camisa não se relaciona com a localização geográfica do clube (temos rubro-negros em todos os países, estados, cidades...), a probabilidade de A ocorrer dado que B ocorreu é 100%. 

        Portanto, a probabilidade do flamengo ser um time de camisa rubro negra com sede em Copacabana = a probabilidade do flamengo ser um time de camisa rubro negra vezes a probabilidade de ele ter sede em Copacabana, ou seja, 100% vezes 0% = 0%. Entretanto, essa é uma péssima estimativa da veracidade de nossa proposição, visto que ela é 50% verdadeira (o Flamengo, de fato, é rubro-negro, mas sua sede é na Gávea...). 

        Seria possível utilizar outros exemplos para demonstrar como o teorema de Bayes não se aplica a proposições, a opiniões, ao grau de certeza que temos das coisas. Atualmente, visto que fatos são, muitas vezes contáveis (têm frequências), incertos (não se sabe quando/por que ocorrerão) e apreciáveis estatisticamente (qualidade oriunda das duas outras), eles recebem o adjetivo "probabilístico". 

  Todavia, como vimos, probabilidade é uma característica daquilo (coisas!) que é aleatório. Decorre disso que a utilização do formalismo probabilístico para situações não-objetivas e não-aleatórias (processos causais) é geradora de, no melhor dos casos, estimativas (a probabilidade pré-teste = alta, ou moderada, ou baixa...), no pior, equívocos grosseiros como o demonstrado acima. 

      Debatamos mais um caso, exemplificado por Bunge em seu "A la caza de realidad". Introduzimos, aqui, outra forma equivalente de escrever o teorema de Bayes.

    Queremos saber qual a probabilidade de um paciente soropositivo para o HIV desenvolver AIDS. Como resolvemos esse problema? 

    Em forma matemática, P(AIDS|HIV+). Pelo teorema, P(AIDS|HIV+) = P(HIV+|AIDS). (P(AIDS)/P(HIV+). Já sabemos, pelo enunciado, que o paciente é soropositivo, logo P(HIV+) = 100%. Sabemos também que a P(HIV+|AIDS) = 100%, porque, por definição, todo paciente com AIDS é soropositivo. Portanto, nossa continha fica: P(AIDS|HIV+) = P(AIDS) (lembre-se que os outros termos são iguais a 1!). Mas essa colocação é um absurdo, porque existem diversos pacientes que são soropositivos e não têm AIDS. 

    Existem situações em que a utilização do teorema de Bayes não resulta em um absurdo lógico, mas sim em uma estimativa plausível (ex: probabilidade de ter câncer caso se tenha um resultado de mamografia BIRADS 5). Entretanto, como David Eddy et al nos mostram, nossas estimativas de "probabilidades" (já sabemos, agora: na realidade, de frequências ou propensões) podem ser dificílimas (ou impossíveis) de calcular partindo da lógica bayesiana sem que se estabeleça um ponto de partida arbitrário (logo, subjetivo). 

    Resumindo, existem três pré-requisitos para uma utilização racional (com utilidade científica real e não uma mera especulação numérica) da fórmula de Bayes: 1- eventos A e B são possíveis (ou seja, não descumprem leis da realidade como a conservação de energia e do momento); 2- tanto A quanto B devem ser eventos aleatórios, ou seja, somente possíveis de ser descritos com probabilidades, não via nexos causais. 

            

Mas, se o bayesianismo não se aplica à medicina, por que acertam os bayesianos?

    Apesar da inadequação de se aplicar o bayesianismo à medicina, as cientistas e os cientistas biomédicos como o prof. Luis, ao utilizarem o tal “método” estão muito frequentemente (likelihood, não probability...) corretos. Por que bons cientistas têm alta chance de acerto utilizando um princípio teoricamente equivocado e, por isso, pouco confiável? 

    Isso se dá porque compreendem, conscientemente ou não, corretamente que diagnosticar (e tratar, portanto) doenças é um desafio causal estabelecido ao inverso: recebemos múltiplas consequências (biomarcadores, sinais, sintomas) e precisamos, frente a elas, buscar causas (mecânicas, infecciosas...). No caso das doenças, a relação entre causa e consequência é unívoca (a causa C só se relaciona com as consequências R), a relação entre as consequências e causas não é. 

    Em outras palavras, o infarto do miocárdio só pode ter um conjunto específico (apesar de não-aleatório, não quer dizer que o conhecemos por inteiro ou que sabemos a frequência de cada um de seus elementos) de consequências (sinais, sintomas, elevação de biomarcadores). Entretanto, cada uma dessas consequências pode ter inúmeras causas. Repare: se partirmos da consequência (dor torácica retroesternal), podemos ter diversas causas (refluxo, tromboembolismo, infarto). 

    Ao necessitarmos fazer o caminho inverso, partindo de consequências com inúmeras causas para chegar a uma relação unívoca causa -> consequência, teríamos um problema se as consequências se ligassem às causas de forma aleatória. Não teríamos como saber a qual causa a consequência R se relaciona, saberíamos no máximo probabilidades (probabilities, por causa da aleatoriedade). 

    Todavia, caso consigamos atrelar tanto as causas de uma doença quanto suas consequências a um mecanismo de forma biunívoca, nosso problema se resolve. Ou seja, se a causa C só se relaciona com um mecanismo M e o mesmo mecanismo M só se relaciona com um conjunto de consequências R e a recíproca for verdadeira para as duas afirmações, podemos deduzir que o conjunto R de consequências está relacionado somente com aquela causa C. Em linguagem matemática: 

Causa (C) se e somente se Mecanismo (M) = C ⇔ M

Mecanismo (M) se e somente se consequências (R) = M ⇔ R

Logo, C ⇔ R. 

    No caso supracitado, a doença (causa) é um infarto do tipo 1 com obstrução coronária por trombo originado da ruptura de uma placa de ateroma instável causando isquemia distal. Nessa situação, a cada novo dado obtido - como o aparecimento de supra de ST no eletrocardiograma, a dor retroesternal em aperto que dura mais de 30 minutos irradiando bilateralmente para membros superiores/mandíbula, a observação de um trombo no cateterismo (...) -, conseguimos delinear melhor o nosso conjunto de consequências (R), que, sabemos, têm somente um mecanismo e, como comentamos acima, somente uma causa. Ao chegarmos no mecanismo, conhecendo o conjunto consequência, nosso raciocínio deixa de ser indutivo e passa à dedução - acertamos o diagnóstico. 

   Deve-se ressaltar que, quando nos referimos ao mecanismo da doença, não nos restringimos à fisiopatologia, mas também consideramos as características epidemiológicas (faixa etária mais comum de acontecimento, frequência maior de sinais e sintomas...). A compreensão do mecanismo é, portanto, objeto de estudo de todas as áreas da pesquisa biomédica (farmacologia, epidemiologia, bioquímica, biofisica, etc).

  Prof. Luis, assim como outros bons “bayesianos”, ao rejeitar a interpretação frequentista (filosoficamente empirista, mas essas questões ficam para outro dia) e levar em consideração as “probabilidades pré-teste” em vez de analisar o desempenho isolado de um teste diagnóstico, na realidade, aplica um procedimento alheio ao subjetivismo bayesiano. Em vez de, arbitrariamente, atribuir probabilidades a vagas proposições, bons médicos utilizam o seu conhecimento sobre  mecanismos para estimar, qualitativamente (se possível, também quantitativamente), a propensão de seu paciente ter determinada doença. 

    Insistindo no exemplo do infarto agudo do tipo 1 com obstrução coronária, por saber que a aterosclerose é uma alteração vascular relacionada com comorbidades como diabetes e dislipidemia, que demora anos para se manifestar clinicamente, e que a frequência de infartos é maior em idades superiores a 50 anos de idade, o bom médico entende que a propensão a infartar de um paciente de 20 anos, sem comorbidades, com dor torácica é baixa, antes mesmo que iniciemos nossa investigação diagnóstica. Esse raciocínio nada tem de subjetivo, menos ainda de probabilístico, aleatório. 

     Concluímos, então, que médicos como o prof. Luis não incorrem no erro frequentista, porém não aplicam os pressupostos teóricos do bayesianismo até as últimas consequências. São, em verdade, realistas, que têm profundo conhecimento de mecanismos e, por isso, são capazes de reconstruir com maestria o caminho inverso do problema diagnóstico: das consequências para as causas.      


“Muito longo. Não li nada”. Leia aqui, para resumir!

    Como demonstrado acima, usar a teoria de probabilidades para estimar veracidades de hipóteses ou a frequência de fatos não aleatórios é um equívoco teórico capaz de gerar resultados absurdos, como explicitamos anteriormente.

   Se a fórmula de Bayes pode ser utilizada com bom valor preditivo (taxa de acerto, não probabilidade) em alguns casos, como no de calcular a propensão (frequência, likelihood...) de ter câncer caso obtenha uma mamografia com resultado BIRADS 5, em outros o cálculo simplesmente é impossível ou resulta em irracionalidades. 

    O raciocínio clínico não envolve probabilidades ou interpretações subjetivas, mas sim a resolução de um complexo problema inverso, análogo a tentar descobrir o modo de preparo e os ingredientes usados em um bolo já pronto. O clínico recebe consequências (sinais, sintomas, resultados de exames) e busca uma única causa para elas, apesar da existência de várias. 

    É o fato de somente um mecanismo se relacionar com somente uma causa e somente um conjunto de consequências que possibilita a realização de uma dedução: se o paciente tem a doença C, causada pelo mecanismo M, logo terá consequências pertencentes a um único conjunto - R. 

    Nosso conhecimento sobre o mecanismo das doenças se dá com base em todas as áreas da pesquisa biomédica, incluindo a epidemiologia, a bioquímica, a biofísica e a farmacologia. É, portanto, possível e desejável a utilização de métodos quantitativos para realizar estimativas de frequências/propensões. 

    Entretanto, é o nosso conhecimento acumulado sobre o mecanismo de uma doença que possibilita que façamos estimativas (sempre qualitativas, mas com possível e desejável componente quantitativo) sobre a propensão, por exemplo, de uma pessoa com determinadas características infartar nos 5 próximos anos. 

     Esse processo nada tem de probabilístico, porque não envolve o acaso. Também não está relacionado com a subjetividade, porque envolve somente dados e análises científicas. Logo, não há bayesianismo no raciocínio clínico, mas sim uma abordagem científico-filosófica realista e objetivista, que entende a processualidade causal do adoecimento e busca desvelar mecanismos que conectem causas e consequências. 

            




       


Comentários

Postagens mais visitadas