Bioestatística

Authors

  • José Fausto de Morais Matemático, Mestre em Estatística Aplicada (EST-Unb), Doutorando em Estatística (IME-USP), Prol. Da Universidade Presbiteriana Mackenzie, Pesquisador do Núcleo de Estudos do Terceiro Setor da UPM e Consultor de Bioestatística

Abstract

Algumas Considerações sobre a Teoria da Decisão e Testes Estatísticos

1.IntroduçãoPara Edwards et ai 1, talvez motivado pela contínua necessidade que o ser humano tem de tomar decisões, nenhum aspecto da Estatística clássica tem sido tão popular para os cientistas das áreas social e da saúde como os testes de significância ou de hipóteses. Muito desses cientistas chegam a acreditar que a Estatística é essencialmente formada por esse conjunto de ferramentas, que são usadas, no contexto das ciências factuais, para a demonstração de proposições ou de hipóteses.Em Matemática, as proposições são construídas em relação a objetos abstratos. Tais objetos têm comportamento controlável, posto que estão sujeitos a um número administrável de variáveis intervenientes. A demonstração de tais proposições é feita com base no método dedutivo, o que garante sua validade universal e atemporal. Nesse sentido, se numa certa teoria matemática é demonstrada uma dada proposição, a validade dessa não depende do que acontece no mundo real nem do que acontece em outras teorias matemáticas.As proposições trabalhadas no contexto factual, por terem como objeto o homem ou as relações as quais ele está sujeito, referem-se a fenômenos complexos, a realidades caóticas e estão permeadas de incertezas². A demonstração de proposições dessa natureza, quase sempre, faz uso de métodos quantitativos.Visto que os testes estatísticos figuram como principais métodos quantitativos, que estes em amostras dos fenômenos e, considerando-se a complexidade dos fenômenos dos que são alvos da investigação estatística, as conclusões obtidas nunca são absolutamente falsas ou verdadeiras, mas provavelmente falsas ou verdadeiras conforme a quantidade de evidência que a amostra oferece a favor de uma dada hipótese.O objetivo deste artigo é tecer algumas considerações sobre teoria da decisão, testes estatísticos e apresentar um resumo contendo os testes usualmente mais empregados em ciências sociais e da saúde.2. Teoria da DecisãoA todo o momento é necessário tomar decisões. Solomon3 ilustra esta questão com o simples e corriqueiro ato de atravessar a rua. Tal procedimento exige uma quantidade de operações não triviais que são executadas na esfera do subconsciente.Inicialmente, você avalia a velocidade dos carros que vêm em ambos os sentidos e a sua própria velocidade, a seguir, decide o melhor caminho a ser tomado de modo a realizar a travessia com segurança e ao menor tempo possível.Ao avaliar as velocidades e estabelecer uma margem de segurança a ser acrescida a sua própria velocidade, vockkê faz uso da Física e da Estatística. Ao determinar que vai atravessar em linha reta, você faz uso da geometria. Quando reúne toda essa informação e operacionaliza a travessia, você faz uso da Administração.Observe que todo o processo decisório para a simples tarefa de atravessar uma rua é baseado em um considerável volume de informações prévias, o que sugere a construção de uma teoria, cujo propósito é estudar a forma.Usualmente, a teoria da decisão4 é baseada na relação de custo-benefício ou de perdas e lucros ligados à decisão. No caso do exemplo dado, o ganho é representado pela travessia tranquila da rua e a perda é a ocorrência de algum acidente com você ou com o motorista.É natural intuir' que um indivíduo pode decidir sob condições de certeza (onde ele tem o controle de todas as variáveis envolvidas no processo); sob condições de confronto (onde o seu ganho implica a perda de seu oponente e vice-versa) e sob condições de incerteza. No primeiro caso, a questão é determinar a decisão que minimize custos em vista das restrições observadas. O segundo caso evoca a teoria dos jogos e o último caso refere-se aos processos estatísticos.É bem provável que os testes estatísticos tenham surgido da tentativa de sistematização desses modos subconscientes de se tomar decisões sob condição de incerteza. Um exame detido na forma como tomamos decisões nos conduzirá a conclusão de que usamos a informação contida em urna amostra de realidade para decidir sobre uma hipótese que será usada num contexto geral. Essa é a ideia central dos testes estatísticos.3. Estrutura de um Teste EstatísticoA Figura 1 exibe um diagrama que ilustra a estrutura geral de um teste estatístico. Se considerarmos somente a estrutura, sem os apêndices decisórios ligados ao Ecal (E calculado) ou a p-value, teremos a estrutura dos testes de significância. Se, por outro lado, agregarmos ao Ho uma hipótese alternativa e considerarmos os apêndices decisórios, teremos a estrutura dos testes de hipóteses.Figura 1 — Teste estatísticoA figura permite observar que, dada uma determinada Ho (hipótese nula), devemos retirar uma amostra da população e reunir a informação contida nessa amostra com o valor da Ho através da função matemática "E" (denominada Estatística de Teste) e determinar o valor dessa função com base na Ho em estudo e na amostra colhida. O Ecal obtido irá representar a quantidade de evidência que a amostra oferece contra o H0. A primeira regra de decisão que poderá ser adotada é baseada no Ecal, assim, para um Ecal suficientemente grande, tem-se forte evidência contra o Ho o que sugere a sua rejeição.Avaliar a magnitude do Ecal é costumeiramente trabalhoso. Em vista disso, Pearson6 introduziu o valor de prova (p-value) que representa a probabilidade de se obter uma amostra que gere um Ecal, em valor absoluto, superior ao valor absoluto do Ecal obtido para a amostra alvo. Dentro desse enfoque, o p passa a medir a quantidade de evidência que a amostra oferece a favor de Ho.A segunda regra de decisão que poderá ser adotada é baseada no p. Assim, para um p suficientemente pequeno, tem-se fraca evidência contra o H0 o que sugere a sua rejeição. Nesse contexto, a "E" trabalha contra a H0 e o trabalha a favor.Dependendo da forma como o teste estatístico será trabalhado, este se apresentará na forma de um teste de significância ou de um teste de hipóteses.4. Teste de SignificânciaOs testes de significância são de certo modo conhecidos desde a antiguidade. Segundo Cordeiro7, a primeira publicação de um teste de significância data de 1-10 e apareceu em um artigo de John Arbuthnot. Apesar de sua introdução há quase três séculos, sua formali7ação e estruturação começou há cerca de 100 anos, com Pearson (ensaios do Qui-quadrado), continuou com Gosset8 e recebeu, no segundo quartel do século passado, o impulso decisivo de Fisher9 (ao qual coube a definição do p-value).Para Fisher, a perspectiva evidencial é a que interessa ao cientista. O autor pontua que a decisão de aceitar ou rejeitar uma hipótese com base em custo-benefício ou perdas e lucros é "vestir a pele do comerciante". Em vista disso, Fisher prefere limitar-se a declinar o valor do p enquanto medida da quantidade de evidência que a amostra oferece a favor da hipótese, sem entrar no problema da decisão.Os ensaios de significância possuem características que os distingue dos ensaios de hipóteses, dentre elas, citamos a ausência de qualquer hipótese alternativa e a base evidenciai ao qual está sujeita.5. Testes de HipótesesA teoria de Neyman-Pearson" sobre ensaios de hipóteses contrasta em vários aspectos com a construção de Fisher, a começar pela filosofia de base: a inferência indutiva (evidenciai) cede lugar ao comportamento indutivo (decisional).Ao contrário dos testes de significância, os testes dão essência e relevância à classe de denominadas hipóteses alternativas e, desse se à escolha da região crítica que permite controlar a probabilidade de se cometer cada um dos clássicos (erro tipo I- rejeitar H0 quando verdadeira; erro tipo II - aceitar H0 de fato, falsa). Digno de nota, os conceitos de risco do produto e risco do consumidor, introduzidos por Dodge e Romig, em 1925¹¹, foram precursores dos referidos.6. ControvérsiasComo vimos, o p-value representa a probabilidade de observarmos uma outra amostra cujo Ecal supere (em valor absoluto) o Ecal obtido, dado que H0 é assumida. O fato do p-value ser a probabilidade de se observar algo que não foi observado, (a segunda amostra) é alvo de críticas, sobretudo dos estatísticos Bayesianos. Eles questionam que sentido pode atribuir-se a algo que poderia ter sido observado, mas que efetivamente não foi 12.Outra questão discutível é o nível de significância estabelecido para o teste que é fixado a priori (precisão inicial). Na perspectiva da inferência Bayesiana, o interesse reside na precisão obtida com o particular e único conjunto de dados disponíveis, isto é, ela usa a precisão final do experimento.7. Usos e Restrições dos TestesExiste na literatura especializada10, 13, 14 um grande número de testes estatísticos disponíveis e, quase sempre, a utilização desses tem sido feita de forma inadequada.Essencialmente, os testes procuram avaliar a distribuição de variáveis (testes de aderência), comparar grupos por meio de variáveis escalares ou ordinais (testes para diferença), correlacionar variáveis (testes de correlação ou de associação) e avaliar efeitos lineares (testes de efeito).Os Quadros de 1 a 3 exibem os testes usualmente mais empregados, relacionados a um conjunto de respondentes ou a grupos de respondentes.Quadro 1- Testes diagnósticos 

                             Quadro 2— Testes paramétricos


Quadro 3 —Testes não paramétricos
É importante não perder de vista que os resultados obtidos nos testes estatísticos são altamente dependentes da obediência aos pressupostos estatísticos. Dentro da analogia que existe entre o Estatístico e o Feiticeiro, os dados colhidos na amostra constituem a "bola de cristal" e os testes são as fórmulas usadas para a realização das leituras. Se a bola estiver difusa ou as fórmulas não forem pronunciadas direito, o feitiço não funciona.No próximo artigo, iremos falar um pouco mais sobre a "bola de cristal", particularmente sobre a sua amplitude (tamanho da amostra), e apresentaremos um quadro de testes estatísticos que são usados quando temos uma única amostra de respondentes e as medidas são repetidas (amostras dependentes).


Downloads

Download data is not yet available.

References

Edwards W, Lindman H, Savage LJ. Bayesian Statistical Inference for Psychological Research; 1963.

Diehl AA, Tatim DC. Pesquisa em ciências sociais aplicadas. Métodos e Técnicas. São Paulo: Prentice Hall; 2004.

Solomon C. Matemática. Trad. Maria P B M Charlier e René F J Charlier, São Paulo: Melhoramentos; 1969.

Murteira BJF. Estatística: Inferência e Decisão. Lisboa: Imprensa Nacional — Casa da Moeda; 1988.

Downing D, Clark J. Estatística aplicada. Trad. Alfredo A. F. São Paulo: Saraiva; 2000.

Pearson ES. Karl Pearson Early Statistical Papers. Cambridge: University Press; 1948.

Cordeiro GM. Cronologia de alguns conceitos e fatos importantes da Estatística. Consultado em 12/05/2004 em www.abe.com.br.

Pearson ES, Wishart J. Student Collected Papers. Londres: University College; 1942.

Wiley J. Contributions to Matheinatical Statistics. Nova Iorque: J Wiley & Sons Inc; 1995.

Murteira BJE. Probabilidade e estatística. São Paulo: McGraw-Hill; 1990.

Wilks SS. Mathematical Statistics. Nova Iorque: J Wiley & Sons Inc; 1962.

Kendall MG, Stuart A. The advanced theory of statistics. Londres: Charles Griffin & Co Ltd; 1967.

Siegel S. Estatística não-paramétrica (para ciências do comportamento). Trad: Alfredo Alves de Farias. São Paulo: McGraw-Hill; 1975.

Stevenson JW. Estatística aplicada à administração. São Paulo: Harbra; 1987.

Published

2004-06-01

How to Cite

1.
Morais JF de. Bioestatística. ESTIMA [Internet]. 2004 Jun. 1 [cited 2024 Dec. 22];2(2). Available from: https://www.revistaestima.com.br/estima/article/view/151

Issue

Section

Article