- Uma análise recente revelou que dados de cinco grandes bancos de saúde estão sendo usados para produzir um número crescente de artigos científicos de baixa qualidade.
- O estudo, publicado no medRxiv, mostra que entre 2021 e 2024, as publicações aumentaram de aproximadamente quatro mil para onze mil e quinhentas.
- Muitos artigos apresentam títulos repetitivos e seguem formatos padronizados, sugerindo a exploração de modelos de linguagem e empresas que produzem artigos sob demanda.
- A pesquisa abrangeu trinta e quatro bancos de saúde abertos, como o US National Health and Nutrition Examination Survey (NHANES) e o UK Biobank, e identificou um crescimento acentuado em seis conjuntos de dados.
- Os pesquisadores expressaram preocupação com a qualidade das publicações e a possibilidade de que conclusões simplistas sejam disseminadas, o que pode afetar a integridade da pesquisa biomédica.
Uma nova análise revela que dados de cinco grandes bancos de saúde estão sendo utilizados para gerar um número crescente de artigos científicos de baixa qualidade. O estudo, publicado como pré-print no medRxiv, destaca que entre 2021 e 2024, a produção de publicações científicas utilizando esses dados saltou de aproximadamente 4 mil para 11,5 mil.
Os pesquisadores identificaram que muitos desses artigos apresentam títulos repetitivos e seguem um formato padrão, indicando uma possível exploração por meio de modelos de linguagem e empresas conhecidas como “paper mills”, que produzem artigos sob demanda. O coautor do estudo, Matt Spick, um cientista biomédico da Universidade de Surrey, alerta que essa situação pode inundar a literatura científica com publicações de qualidade questionável.
Crescimento Acelerado
A análise abrangeu dados de 34 bancos de saúde abertos, incluindo o US National Health and Nutrition Examination Survey (NHANES), o UK Biobank e o Adverse Event Reporting System (FAERS) da FDA. Os pesquisadores usaram um algoritmo para prever o crescimento esperado de publicações entre 2014 e 2024. Ao comparar as previsões com os números reais, foram identificados seis conjuntos de dados que superaram significativamente as expectativas.
Por exemplo, o uso de dados do FinnGen cresceu quase 15 vezes no período analisado, enquanto o FAERS e o UK Biobank aumentaram em quase 4 e 2,4 vezes, respectivamente. Essa explosão de publicações levanta preocupações sobre a qualidade e a relevância dos achados, uma vez que muitos estudos apresentam conclusões simplistas sobre condições de saúde complexas.
Riscos à Saúde Pública
Os pesquisadores também encontraram artigos que fazem associações questionáveis entre variáveis de saúde. Um estudo, por exemplo, investigou se o consumo de leite semi-desnatado poderia proteger contra a depressão. Outro analisou como o nível educacional influencia o desenvolvimento de hérnias após cirurgias. Spick expressou preocupação com a acessibilidade dessas pesquisas ao público, ressaltando que muitos achados podem ser inseguros.
O aumento na produção de artigos de baixa qualidade representa um desafio significativo para a integridade da pesquisa biomédica. A análise serve como um alerta para revisores, editores e pesquisadores sobre as vulnerabilidades no sistema de publicação científica.
Entre na conversa da comunidade