Nome original do viés: Wrong sample size bias
Tradutor: Carolina Oliveira Cruz Latorraca
Primeiro revisor: Rafael Leite Pacheco
Segundo revisor: Enderson Miranda
Terceiro revisor: Rachel Riera
LEGENDA TRADUZIDA
Ocorre quando um estudo utiliza o tamanho inadequado de amostra. Amostras de tamanho insuficiente podem levar a um achado devido ao acaso, enquanto amostras grandes normalmente são estatisticamente significantes, mas não clinicamente relevantes.
TEXTO TRADUZIDO
Introdução
Estudos sobre saúde humana utilizam amostras para inferir informações sobre toda a população relevante e para representar de forma acurada a população de interesse. Quando tamanhos de amostra pequenos são utilizados, o risco de que os resultados observados sejam ao acaso é grande, o que não é o caso em estudos de grande tamanho amostral. Porém, tamanhos de amostra muito grandes podem detectar associações pequenas que podem não ser clinicamente importantes ou relevantes.
Indicadores estatísticos, incluindo o valor de p e o intervalos de confiança, são utilizados para ajudar a determinar o nível de certeza de que os resultados observados não tenham ocorrido ao acaso. Amostra muito grandes podem levar a um amplo número de resultados estatisticamente significantes, mas que podem não ser importantes se o tamanho do efeito for pequeno, ou se a relação encontrada não for clinicamente relevante para a saúde.
Estudos com grande tamanho amostral são muito melhores que os pequenos, porém deve se tomar cuidado na interpretação dos resultados de ambos, pois tamanhos de amostra grandes podem ampliar qualquer viés presente.
Exemplos
No artigo de Ioannidis, “Por que a maioria dos estudos publicados têm resultados falsos” (Why Most Published Research Findings Are False) ele afirma que “quanto menor o tamanho de amostra de um estudo científico, menor a probabilidade de que os achados da pesquisa sejam verdadeiros“. Como exemplo, em ensaios clínicos placebo-controlados sobre medicamentos anti-reumáticos de segunda linha, o viés de tamanho de amostra demonstrou que o efeito decaiu conforme o tamanho da amostra aumentava.
Tamanhos de amostra grandes também podem estar errados. Na eleição de 1936, a maior pesquisa de intenção de votos da história dos Estados Unidos, realizada com 2,4 milhões de participantes, teve um resultado completamente errado. O resultado da pesquisa mostrava que Landon ganharia com a maioria dos votos. Porém, Roosevelt ganhou em 46 dos 48 estados. A pesquisa foi conduzida pela Literary Digest, que teve como participantes seus próprios leitores, pessoas que apoiavam Landon. Este erro ocorreu devido ao viés de averiguação, mas a conclusão é: não seja enganado pelo tamanho da amostra.
Impacto
Uma comparação dos benefícios estimados dos tratamentos por estudos com amostras grandes (pelo menos 100 participantes por braço) e por estudos com amostras pequenas mostrou que, em média, os efeitos dos tratamentos foram maiores em estudos com amostras pequenas. Na neurociência, os tamanhos de amostra tendem a ser pequenos, dando poder pequeno para detectar associações e assim a probabilidade de que um achado seja verdadeiro é pequena.
Passos para prevenção
Para prevenir o viés de tamanho inadequado de amostra, ao planejar um estudo é essencial buscar a assessoria de um estatístico. Ao interpretar os resultados, não fique convencido apenas por grandes números e pequenos intervalos de confiança. Considere explicações racionais para os resultados observados, e a relevância do tamanho do efeito observado. Tome cuidado ao utilizar os valores de p para sustentar ou refutar hipóteses, especialmente quando um grande número de testes estatísticos foi realizado para fornecer este valor de p.
Estudos observacionais muito grandes, como o Million Women Study, ao invés de usarem intervalos de confiança de 95% para indicar a confiança em uma estimativa, algumas vezes utilizam intervalos de confiança de 99%.
Outra área em que níveis mais rigorosos de significância estatística são utilizados inclui os estudos de associação de genoma, que lidam com um grande número de dados e avaliam um amplo número de associações. Para a descoberta de genes desses estudos, é mais importante evitar falsos-positivos do que perder algumas associações verdadeiras; assim, esses estudos têm como padrão utilizar um nível de significância estatística muito mais rigoroso.
Link para o original: https://catalogofbias.org/biases/wrong-sample-size-bias/
Deve ser citado como: Catalogue of Bias Collaboration, Spencer EA, Brassey J, Mahtani K, Heneghan C. Wrong sample size bias. In: Catalogue Of Bias 2017. https://catalogofbias.org/biases/wrong-sample-size-bias/
Fontes
Armstrong ME et al. Million Women Study Collaborators. Relationship of Height to Site-Specific Fracture Risk in Postmenopausal Women. J Bone Miner Res. 2016 Apr;31(4):725-31.
Barsh GSet al. Guidelines for genome-wide association studies. PLoS Genet. 2012 Jul;8(7):e1002812.
Bartolucci AA et al. Meta-analysis of multiple primary prevention trials of cardiovascular events using aspirin. Am J Cardiol. 2011;107(12):1796–801
Button KS et al. Power failure: why small sample size undermines the reliability of neuroscience. Nat Rev Neurosci. 2013 May;14(5):365-76.
Gøtzsche PC et al. Meta-analysis of second-line antirheumatic drugs: sample size bias and uncertain benefit. J Clin Epidemiol. 1992 Jun;45(6):587-94.
Ioannidis JP. Why most published research findings are false. PLoS Med. 2005 Aug;2(8):e124.
Nüesch E et al. Small study effects in meta-analyses of osteoarthritis trials: meta-epidemiological study. BMJ 2010;341:c3515
Porta M et al. A dictionary of epidemiology. 6th edition. New York: Oxford University Press: 2014
Sackett DL. Bias in analytic research. J Chron Dis 1979; 32: 51-63
Wellcome Trust Case Control Consortium: Burton PR, Clayton DG et al. Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls”. Nature 2007. 447 (7145): 661–78
PubMed feed
Esta fonte pode ser recuperada a partir do PubMed:
Habermehl C, Benner A, Kopp-Schneider A. Addressing small sample size bias in multiple-biomarker trials: Inclusion of biomarker-negative patients and Firth correction.