Neste artigo, pesquisadores discutem o impacto da publicação de estudos mal feitos para a ciência e para a saúde. Artigos sem o correto embasamento científico contribuíram para a propagação de ideias falsas sobre os efeitos colaterais da vacina contra covid-19, o que pode ter afastado uma parcela da população das campanhas de imunização.
Prefeitura de Uberaba/Divulgação
O aumento da disponibilidade de dados para pesquisa contribuiu, paradoxalmente, para a desinformação científica. Quando a pessoa não possui o conhecimento para analisá-los criticamente, os dados podem ser mal usados e mal interpretados.
Embora o acesso fácil à informação seja útil, ele também permite que análises ruins se espalhem sem controle. O problema piora quando estudos mal feitos são publicados em revistas científicas, levando o público leigo a acreditar que são “cientificamente validados”.
A crise da revisão por pares
Veículos científicos conceituados usam o sistema de revisão por pares. Especialistas na área do artigo avaliam os estudos antes da publicação para garantir sua qualidade.
Porém, mudanças no modelo de negócios das editoras estão enfraquecendo esse sistema. Muitas revistas científicas agora priorizam lucro, aceitando artigos mal conduzidos em troca de pagamento de taxas de publicação. Quanto mais artigos publicam, mais ganham, sem se preocupar com a qualidade.
Essas revistas fazem revisões superficiais, chamando revisores sem o conhecimento adequado para reler os artigos. Isso resulta na publicação de estudos com erros graves, que são tratados como ciência confiável.
Um exemplo é o artigo “Evaluation of post-COVID mortality risk in cases classified as severe acute respiratory syndrome in Brazil: a longitudinal study for medium and long term”, publicado na Frontiers in Medicine em dezembro de 2024. Os revisores deste artigo não eram especialistas na área, nem tinham nenhuma experiência sobre epidemiologia da COVID-19 no Brasil.
O artigo afirma que as vacinas contra a COVID-19 aumentam o risco de morte não relacionadas à COVID um ano após a infecção. Surpreendentemente, único critério usado para definir mortes “não relacionadas à COVID” era que ocorressem mais de três meses após o início dos sintomas — uma escolha sem base científica.
Ministério da Saúde anuncia como será a vacinação contra Covid em 2025
Dados mal interpretados
O artigo usou dados públicos sobre casos de síndrome respiratória aguda grave (SRAG) no Brasil de 2020 a 2023. O problema é que o sistema usado para registrar esses dados foi feito para monitorar doenças respiratórias graves no início da doença, ou seja, não é o melhor para esse tipo de pesquisa.
O sistema registra datas como início dos sintomas, hospitalização, alta ou morte, e vacinação. A maioria dessas informações (exceto vacinação) é inserida manualmente, o que aumenta o risco de erros e exige ajustes para garantir precisão.
Além disso, o sistema só registra mortes que acontecem na hospitalização por SRAG ou mortes relacionadas à SRAG que acontecem fora do hospital. Como o sistema foca em mortes por SRAG, a definição de mortes “não relacionadas à COVID” é inerentemente falha. O banco de dados mais adequado para essa análise seria o SIM (Sistema de Informação sobre Mortalidade), que registra todas as mortes, independentemente da causa.
Figura 1: Evidências de dados mal interpretados e erros de registro
úmero de casos no banco de dados de acordo com o tempo entre início de sintomas até óbito ou alta, em dias. Cada barra representa um intervalo de 7 dias. Os retângulos vermelhos representam os períodos de 360 a 390 dias e 730 a 760 dias.
Reprodução/Thiago Cerqueira
Como o sistema foi projetado para casos agudos, registros com intervalos maiores que 3 meses provavelmente refletem erros de digitação. Utilizando o mesmo banco de dado que o artigo, encontramos que a maioria dos casos têm intervalo até 14 dias entre os sintomas e alta ou morte, como mostrado na figura 1.
Notavelmente, cerca de 99% dos casos estão entre 0 e 84 dias. O número de casos com intervalos de tempo maiores diminui progressivamente, até chegar nos intervalos próximos de um ou dois anos. Esses picos sugerem erros ao digitar as datas, especificamente ao registrar o ano. Um banco de dados com mais de 2 milhões de casos, em que apenas 0,07% deles apresentam esse intervalo de tempo tão longo reforça a ideia de que esses registros são erros.
Informações falsas atrapalham avanço de cobertura vacinal em crianças e adolescentes em SP, aponta pesquisa
Erros de análise e seus impactos nos resultados
Apesar desses erros nos registros, não é esperado que estejam concentrados em grupos específicos, como vacinados ou não vacinados. Assim, os resultados obtidos a partir da análise desses dados deveriam refletir padrões gerais da amostra. Mas o estudo usou uma análise inadequada.
O principal problema está relacionado ao tempo do início da vacinação no Brasil, que começou em 2021. Então casos de 2020 não podem ser comparados em relação a vacinação, uma vez que não existia vacinados naquele momento.
A comparação correta seria entre pessoas com início dos sintomas no mesmo período do ano (tempo calendário). Neste caso, vacinados e não vacinados serão comparados em condições semelhantes de capacidade do sistema de saúde e medidas de controle da pandemia.
Mas os autores compararam esses grupos com base no intervalo entre sintomas e óbito ou alta. Assim, pessoas infectadas em 2020 foram comparadas, por exemplo, a pessoas infectadas em 2022, ignorando diferenças importantes. Em 2020, o sistema de saúde estava despreparado para a pandemia e não havia vacina disponível. Em contraste, em 2022, as vacinas estavam amplamente distribuídas e o número de novas hospitalizações devido à COVID-19 era significativamente menor.
Outro problema significativo no estudo é a forma de categorização da situação vacinal. O sistema de SRAG vincula as datas de vacinação, mas essas podem ser registradas após a alta hospitalar, incluindo doses aplicadas após o início dos sintomas. Isso distorce a análise, pois essas doses não representam status de vacinação no momento da infecção.
A classificação correta deve considerar apenas doses recebidas antes do inícios dos sintomas, porque as doses recebidas após o início dos sintomas referem-se a indivíduos não vacinados no momento da infecção.
Como o artigo não especifica como as doses de vacinas foram contadas, consideramos a vacinação antes ou depois do início dos sintomas como iguais para tentar corresponder à classificação de 1/2/3 doses encontrada no artigo. Em nossa análise, os números da abordagem errada são semelhantes, porém não iguais, aos do artigo. Todos os dados e códigos utilizados em nossa análise podem ser acessados aqui.
Figura 2: Impacto da análise errada
Estimativas de “Hazard Ratio” (medida que reflete o risco de ir a óbito comparando os grupos com 1/2/3 doses versus não vacinados). As estimativas foram obtidas usando o modelo correto (tempo calendário) e o modelo errado (tempo desde o início dos sintomas). Valores menores que 1 indicam proteção daquele grupo em relação a não vacinados e valores maiores que 1 indicam aumento de risco daquele grupo em relação a não vacinados.
Reprodução/Thiago Cerqueira
Os resultados usando as abordagens correta e errada são bem diferentes. Como mostrado na Figura 2, utilizar o método incorreto gerou uma falsa associação entre vacinação e maior risco de morte. Por outro lado, a análise correta revelou a vacinação como um fator protetor.
O papel da má ciência na disseminação da desinformação
É importante notar que, mesmo empregando a abordagem correta (usando o tempo de calendário), o tipo de análise apresentada no artigo não é ideal para responder à pergunta de pesquisa. Os autores limitaram a amostra a pessoas que sobreviveram mais de um ano (ou 3 meses) após os sintomas, ignorando as mortes no período inicial. Porém é necessário avaliar o risco de morte desde o período inicial.
Um exemplo ilustrativo desse problema pode ser encontrado na Segunda Guerra Mundial, quando reforços em aviões danificados foram inicialmente priorizados nas áreas com mais marcas de tiro. Contudo concluiu-se que era o oposto: se os aviões conseguem voltar era porque essas áreas atingidas eram menos críticas, e decidiu-se então por reforçar as áreas sem danos aparentes. Do mesmo modo, restringir a análise do artigo a sobreviventes após um ano distorce os resultados pois exclui os casos que não resistiram e que seriam cruciais para análise completa.
O artigo discutido aqui está sendo usado como evidência para alimentar movimentos anti-vacina nas redes sociais. Essa repercussão reflete diretamente a responsabilidade dos autores, revisores e editores. Ao falharem em garantir análises rigorosas e interpretações precisas, eles acabam contribuindo para a disseminação de desinformação.
Os erros graves como os apresentados inviabilizam qualquer confiabilidade naquele estudo. No entanto, ao ser aceito e divulgado como válido, ele acaba gerando uma falsa sensação de incerteza sobre a segurança das vacinas e enfraquece os esforços de saúde pública. Quando a má ciência se propaga, serve de combustível para a pseudociência e a desinformação, tornando-se um perigo real para a saúde coletiva.
*Thiago Cerqueira-Silva é pesquisador do Departamento de Estatística Médica na London School of Hygiene & Tropical Medicine.
*Manoel Barral-Netto é presidente da ACB, Academia de Ciências da Bahia (ACB).
*Viviane Boaventura é pesquisadora da Fiocruz e professora da Faculdade de Medicina da Bahia na Universidade Federal da Bahia (UFBA).
**Este texto foi publicado originalmente no site da The Conversation Brasil.