Três interpretações inadequadas do valor P (Parte 1)

Três interpretações inadequadas do valor P (Parte 1)

Esse texto divide-se em duas partes. Abaixo, apresento uma introdução bastante breve sobre o valor P, também chamado de P-valor, P value, ou probabilidade de significância estatística. Nessa primeira parte, busco apresentar um conceito simples dessa abordagem e exemplificar rapidamente a aplicabilidade do “P” para testes de hipóteses.  O uso de valores P é muito frequente na literatura científica de viés quantitativo. Assim, também há excelentes materiais críticos sobre as aplicações e a interpretação desta métrica estatística.

As três más interpretações do valor P estão presentes na parte 2 deste texto. Para apresentá-las, é válido apresentar a definição e fornecer um exemplo simples para seu uso.
Portanto…

O “P” é a probabilidade da ocorrência do resultado observado, ou de resultados mais extremos, se a hipótese nula fosse verdadeira.

Na literatura biomédica, o valor P é usado para indicar diferença estatística entre dois ou mais grupos, ou dois ou mais momentos no tempo, ou ainda para indicar associações “confiáveis” entre variáveis. Diversos testes e técnicas de bioestatística derivam valores P, e estes geralmente possuem um ponto de corte para indicar a probabilidade de um resultado (por exemplo, um efeito de tratamento, ou uma associação entre variáveis) ser real/diferente em relação à hipótese nula. Esse valor é definido de forma arbitrária, sendo de P<0,05 (ou seja, menor do que 5%) na maioria dos estudos.

Exemplificando…
Podemos hipotetizar que você realizou uma intervenção de exercício físico e sua variável de interesse (que indica o resultado) é a massa corporal (em kg). Para controlar melhor o efeito do “grupo treinamento”, você adiciona um segundo grupo de pessoas, o qual não se exercita ao longo do estudo (“grupo controle”).

Nesse exemplo, a hipótese nula seria de que não há diferenças “estatísticas” entre os grupos.

Nos resultados hipotéticos, você mede o peso corporal dos indivíduos, observando uma redução de 2 kg no grupo que fez exercício (por exemplo, de 102 kg para 100 kg, na média do grupo). Na avaliação do grupo controle, digamos que suas medidas resultaram numa mudança média de “zero” para o grupo que não se exercitou. Ou seja, seu grupo controle, em média, manteve o peso inicial até o final do estudo.

Portanto, você compara a variação de -2 kg no grupo treinado, ou variações ainda mais amplas (por exemplo, -5 kg), com a variação de “zero” no grupo controle. O teste de hipótese resulta em um valor P=0,03. Colocando a definição neste exemplo, isso indica que há probabilidade de 0,03 (= 3%) para ocorrência da diferença observada (no nosso exemplo, -2 kg), caso a hipótese nula fosse verdadeira.

Porém, as inferências pelo valor P tem sérias limitações, pois assume-se sempre a hipótese nula como verdadeira.

Na parte 2 desse texto, você encontrará a explicação de interpretação inadequada sobre (i) “resultados semelhantes” entre grupos; (ii) estudos “controversos/conflitantes” a partir do valor P; e (iii) similaridade de valores P e efeitos diferentes entre estudos científicos.

Clique aqui para ser direcionado à parte 2.

Professor, pesquisador, e pai. Sócio-fundador do Evidência Saúde. Interessado em exercício em grupos especiais, metodologia científica, e disseminação científica.

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.