Artigo de Revisão - Abordagens Metodológicas Utilizadas na Construção de Instrumentos de Medida Relacionados com o Cuidado de Lesões
Abstract
RESUMO
A importância dos instrumentos de avaliação em dermatologia tem sido reconhecida, auxiliando na prevenção, diagnóstico
e tratamento de lesões. O objetivo desta revisão integrativa foi identifi car a metodologia utilizada entre os estudos
de validação na área do cuidado com lesões cutâneas e/ou mucosas. Realizou-se a pesquisa nas bases Medline,
Lilacs e Pubmed Central, utilizando-se como descritores: estudos de validação, reprodutibilidade dos testes, confi abilidade,
lesões e feridas, sem restrição de data. Selecionaram-se seis publicações que continham a versão completa
disponível em bases de dados eletrônicas. Os resultados apontaram concordância na adoção de três atributos para a
avaliação da confi abilidade: a estabilidade, a equivalência e a homogeneidade. Em relação à validade, as abordagens
mais utilizadas foram: a validade de conteúdo, do tipo convergente e discriminante e do tipo concorrente. Concluiu-se
que os autores estão em consenso, quanto às abordagens metodológicas e rigor científi co, fato signifi cativo para a
pesquisa. Esta revisão contribui para uma maior divulgação e agilidade de acesso no conhecimento dessa temática.
DESCRITORES: Medidas, Métodos e Teorias. Estudos de Validação. Reprodutibilidade dos Testes. Ferimentos e lesões.
INTRODUÇÃO
A utilidade dos instrumentos de medida em dermatologia
tem sido reconhecida. Na prática clínica, orienta a prevenção,
o diagnóstico e o tratamento/cuidado das lesões. Para a
investigação cientí ca, um instrumento de medida pode trazer
avanços no ensino e exercer grande in uência na formulação
de programas de saúde e de políticas institucionais1-3.
Atualmente, pesquisadores e organizações internacionais
têm desenvolvido instrumentos de medidas importantes
e de grande aplicabilidade, sendo possível encontrar um
grande número de questionários e escalas na área da saúde2,3.
Um exemplo signi cativo é a Escala de Braden, instrumento
desenvolvido originalmente em 1987, e que vem
sendo utilizado até os dias de hoje, em inúmeras instituições
brasileiras e pesquisas cientí cas. Com o objetivo de colaborar
na prevenção de úlceras de pressão, esse instrumento
trouxe subsídios, para indicar quais pacientes correm maior
risco para desenvolvê-las e predizer o risco de sua formação.
Outros exemplos de escalas de avaliação de risco de desenvolvimento
de úlceras de pressão também importantes são:
Norton, Gosnell, Waterlow e Bergstron4.
Apesar do aumento signi cativo do número de escalas
de avaliação e/ou questionários, muitos não são desenvolvidos
e validados de forma apropriada2. A literatura nacional
e internacional tem proposto normas para assegurar a elaboração
e adaptação de instrumentos de uma forma metodologicamente
correta. Para que sejam con áveis, válidos e
com boas propriedades psicométricas, é fundamental que
sejam desenvolvidos por meio de métodos cientí cos, exigindo
do pesquisador segurança e conhecimento do construto
de nido, bem como a inexistência de outro instrumento
similar que possa atender a mesma nalidade pretendida5-7.
Nesse sentido, quais seriam as abordagens metodológicas
utilizadas na realização de estudos de validação de
instrumentos de medida relacionados com o cuidado de lesões?
Desta forma, o presente estudo teve como objetivo
identi car as metodologias adotadas entre os estu dos de
validação, na adaptação transcultural ou criação de novos
instrumentos de medida, relacionados com o cuidado de
lesões cutâneas e/ou mucosas. Assim, o estudo pode contribuir
para uma maior agilidade na divulgação das metodologias
utilizadas, bem como oferecer subsídios para o
conhecimento dos diversos tipos de estudos de validação.
MÉTODO
Trata-se de um estudo de revisão integrativa da literatura,
cuja elaboração percorreu as seguintes etapas: formulação
da questão norteadora, seleção das pesquisas que compuseram
a amostra e estabelecimento dos critérios de inclusão
e exclusão, de nição das informações que seriam extraídas
dos estudos ou coleta de dados, avaliação ou análise dos
estudos incluídos, interpretação dos resultados e apresentação
da revisão.
Formulou-se a seguinte questão norteadora, conforme
os preceitos de Flemming8: Quais abordagens metodológicas
vêm sendo utilizadas, entre os pesquisadores da literatura
atual, na realização de estudos de validação de novos
instrumentos de medida ou adaptação dos preexistentes na
área do cuidado com lesões cutâneas e/ou mucosas?
Foram realizadas pesquisas de estudos nas seguintes
bases de dados: Medical Literature On-line (Medline),
Literatura Latino-Americana e do Caribe em Ciências da
Saúde (Lilacs) e Pubmed Central (PMC), sem restrições de
data e, tampouco, de idioma. Os unitermos e/ou palavras
utilizados foram: estudos de validação, reprodutibilidade
dos testes, con abilidade, lesões e feridas — sendo realizada
uma combinação entre eles.
Como critérios de inclusão, foram pesquisados estudos
que apresentassem no título ou resumo da publicação
uma ou mais das seguintes palavras: adaptação, validação,
con abilidade, reprodutibilidade, construção ou elaboração
de escalas; estudos primários. Os trabalhos analisados estavam
nos idiomas inglês, espanhol, alemão ou português; e
com conteúdos que abordassem a adaptação transcultural
de um instrumento validado ou a elaboração e validação de
um novo instrumento de mensuração; relacionados exclusivamente
com a temática “lesão de pele e/ou mucosa em
humanos”. Como critérios de exclusão, foram de nidos: a
ausência do resumo e a indisponibilidade de acessar ao trabalho
na íntegra nas bases de dados.
Identi caram-se 590 publicações, das quais restaram
62, retirando-se as publicações repetidas e aplicando-se
os critérios de seleção. Em seguida, procedeu-se à leitura
das publicações na íntegra, selecionando-se, por m, uma
amostra de seis artigos.
Em um primeiro contato, aplicou-se um instrumento
previamente elaborado para sistematizar as informações
extraídas dos estudos incluídos. Este instrumento continha
o nome dos autores, o título do artigo, o periódico e
ano de publicação, os objetivos, a metodologia utilizada, a
indicação do instrumento elaborado e os principais resultados
e conclusões.
Em seguida, procedeu-se à leitura informativa de
cada publicação e, quando necessário, a tradução, para
esclarecimento da metodologia utilizada em cada estudo.
Após essa etapa, realizou-se o agrupamento por similaridade
das propostas metodológicas. Esses agrupamentos
representam os resultados da revisão, que serão apresentados
resumidamente em quadros e posteriormente analisados de
forma descritiva.
RESULTADOS
Com relação ao ano de publicação da amostra, encontraram-
se publicações nos anos de 2005 a 2009, notando-se a
predominância do ano de 2009. Mesmo havendo abertura
de maiores períodos de busca, os estudos de relevância para
esta revisão começaram a aparecer em 2005, trazendo a essa
temática, estudos de validação, um olhar relativamente recente.
Em sua maioria, os estudos foram nacionais (n=4)
e publicados em língua inglesa (n=4), sendo os países de
origem dos estudos, o Brasil (n=4/6), o Canadá (n=1) e os
Estados Unidos da América (n=1).
Dentre os periódicos, destacou-se a predominância da
Revista Latino-Americana de Enfermagem (n=2). Osdemais
foram: Revista da Escola de Enfermagem da USP, Acta
Paulista de Enfermagem, Injury Prevention e Journal of the
Canadian Dental Association . O Quadro 1 apresenta a descrição
dos estudos incluídos na amostra.
O Quadro 2 descreve, resumidamente, as abordagens
metodológicas adotadas entre os estudos e os testes aplicados
em cada abordagem.
DISCUSSÃO
Encontraram-se, na presente amostra, escalas para avaliação
de feridas do processo de cicatrização em úlceras de pressão
(Pressure ulcer scale for healing – PUSH), do processo de cicatrização
em úlceras crônicas, de autoavaliação dos sintomas da
mucosite oral que interferem na qualidade de vida do paciente
(Patient-reported oral mucositis symptom scale – PROMS), um
índice de qualidade de vida do paciente portador de feridas
agudas e crônicas de diferentes etiologias (Índice de Qualidade
de Vida de Ferrans e Powers – versão feridas – IQVFP-VF),
e um inventário que avalia o risco de ferimentos para crianças
no domicílio (Home injury survey – HOME). Destaca-se,
assim, entre os estudos, a área do cuidado em dermatologia
relacionada com feridas agudas e crônicas.
Observou-se, entre os estudos, uma busca pelo percurso
metodológico mais adequado para a avaliação da validade e
da con abilidade de cada instrumento elaborado. Comrelação
à validade, existem três tipos principais que variam, de
acordo com o tipo de informação fornecida no instrumento
e com o objetivo do investigador, a validade de conteúdo,
de construto e de critério15 .
Entre os estudos9,10,13 , notou-se a adoção da abordagem
da validade de conteúdo correlacionada à apreciação do instrumento
elaborado por um comitê de juízes. Nessa fase, o
instrumento elaborado ainda não teve sua aplicação clínica
e aguarda uma concordância entre juízes, sobretudo, referente
ao conteúdo, semântica e clareza. Esse tipo de abordagem
metodológica, conforme os estudos9,13 , necessitaria da
adoção de um nível de concordância mínima de 80%, assim,
o instrumento estaria pronto para a aplicação clínica com
capacidade de medição apropriada. Já outras autoras10 adotaram
o uso do coe ciente de concordância Kappa Múltiplo
e o teste Qui-quadrado (2 ) de Cochran, sendo o nível de
signi cância adotado de 5% (p<0,05).
A validade de conteúdo representa o domínio de um
dado construto. Após ter de nido o construto, o pesquisador
realiza a elaboração do instrumento com questões ou
itens de observação, que se propõem a medir com precisão
o construto. Em seguida, solicita-se a um grupo de juízes
que indiquem sua concordância face aos itens do instrumento.
Para essa apreciação, são utilizadas escalas tipo Likert
e acrescenta-se um espaço, onde o juiz pode justi car sua
avaliação ou sugerir modi cações no item. Posteriormente,
calcula-se a porcentagem de concordância entre juízes para
cada item do instrumento. Quando o nível de concordância
for inferior ao previamente estabelecido, ocorrerá a necessidade
de reconstrução do instrumento, no qual poderão ser
feitos ajustes e acréscimos3,5,15,16 .
Com relação à escolha dos juízes, seu número e representatividade
podem afetar o potencial de conhecimento,
como também a quantidade de dados a serem analisados17 .
Nota-se, entre os estudos da amostra9,10,13 , a concordância
de que o comitê de juízes deve ser composto por especialistas
no tema abordado, com experiência clínica na área e
atuando no momento da pesquisa. O número de juízes teve
variação de três a cinco pro ssionais.
Com relação à validade de critério, notou-se, em um
estudo13 , a adoção da abordagem de validade do tipo concorrente
e utilização, como testes estatísticos do coe ciente
de correlação de Pearson ou Spearman. A validade de critério
é obtida pela comparação entre os resultados advindos
de um determinado estudo, e outra medida considerada
“padrão ouro”. Pode-se testar com esse tipo de validade, a
acurácia de um instrumento como um todo, ou de cada um
dos itens que o compõem5 .
A validade de critério do tipo concorrente é de nida
como o grau de correlação entre duas medidas sobre o mesmo
conceito, aplicadas ao mesmo tempo, e a alta correlação indica
concordância entre as duas medidas15 . Noestudo cinco (E5),
as autoras13 avaliaram a validade de critério pelo cálculo da
correlação entre os escores do item, satisfação com a vida,
com os escores dos domínios e do instrumento total Índice
de Qualidade de Vida de Ferrans e Powers - versão feridas
(IQVFP-VF), demonstrando por meio dos testes correlações
moderadas e fortes.
Com relação à validade do construto, notou-se, em três
estudos9,12,13 , a adoção da abordagem de validade do tipo
convergente e discriminante. A validade do tipo convergente
é obtida comparando-se o instrumento com outros
que medem o mesmo conceito, sendo aplicado concomitantemente5,15 .
Este tipo de validação é, particularmente, importante
na elaboração de novos instrumentos, sendo utilizados
coe cientes de correlações, cujos valores variam de 0 a +115 .
Outro estudo9 avaliou a validade do tipo convergente,
correlacionando os escores do instrumento PUSH com a
classi cação das úlceras de pressão em estágios propostos
pelo e National Pressure Ulcer Advisory Panel (NPUAP).
Encontraram-se por meio da análise estatística, correlações
positivas e signi cativas (p<0,001) para as observações dos
três avaliadores, con rmando-se a validade convergente
do PUSH.
Outras autoras13 avaliaram a validade do tipo convergente
por meio de análises de correlação entre os domínios
do IQVFP-VF e os domínios do World Health Organization
Quality of Life Assessment Instrument (WHOQOL-bref).
Observaram-se, por meio da análise estatística, correlações
signi cativas e fortes entre a qualidade de vida geral de
ambos os instrumentos, con rmando a validade convergente
do IQVFP-VF.
A validade do tipo discriminante envolve a aplicação de
dois instrumentos simultaneamente em uma amostra, e, posteriormente,
a análise da discriminação entre eles15 . Osescores
obtidos distinguem indivíduos ou populações em que se
espera obter a diferença, conforme as variáveis observadas5 .
Um estudo13 avaliou a validade do tipo discriminante ou
divergente, comparando-se os valores obtidos nos domínios
do instrumento e na qualidade de vida geral, entre indivíduos
com diferentes faixas etárias, número, tempo de duração da
ferida e intensidade da dor. Assim, para a variável, número
de ferida, constatou-se a ocorrência de discriminação nos
escores de qualidade de vida geral, revelando que as pessoas
com maior número de feridas apresentavam piora na qualidade
de vida, não havendo diferença entre os domínios.
Outro estudo12 avaliou a validade do tipo discriminante
por meio da correlação entre a avaliação clínica do grau de
severidade da mucosite oral e da escala Stressful life events
Scale (SLE – a escala de avaliação de eventos estressantes na
vida do paciente) com o instrumento PROMS e as escalas
A ect Balance Scale (ABS – escala de equilíbrio) e Center for
Epidemiologic Studies Depression Scale (CES-D – escala do
centro epidemiológico de estudos de depressão). Assim, para
a variável sintomas de depressão (CES-D), encontrou-se
correlação estatisticamente signi cativa com os escores do
PROMS, além de concluir-se que os sintomas da mucosite
oral são fortes estressores e comprometem a qualidade
de vida do paciente.
Com relação à con abilidade, os três atributos principais
de uma escala con ável são: a estabilidade, a homogeneidade
e a equivalência15 . Desta forma, considera-se que um
instrumento demonstra equivalência quando dois ou mais
observadores têm uma alta porcentagem de concordância
de um comportamento observado15 .
Veri cou-se em quatro estudos9-11,14 , a adoção da abordagem
da Con abilidade interobservadores. Nesses estudos, a
aplicação do instrumento elaborado foi realizada por dois ou
mais indivíduos, sendo previamente treinados e orientados.
Quando o instrumento elaborado depende de uma
observação direta para a aplicação, torna-se necessário que
o registro sistemático de seus avaliadores seja testado para
veri car a con abilidade do instrumento5 . Assim, a escala de
avaliação do processo de cicatrização de úlceras9 e o inventário
de avaliação do risco de ocorrência de lesão domiciliar14
dependeram da observação direta, fosse ela, clínica ou
ambiental, de seus aplicadores e tiveram sua con abilidade
avaliada pelo cálculo do coe ciente de correlação entre os
escores atribuídos para cada item.
Através da mesma abordagem, outro estudo10 demonstrou
um valor de índice Kappa que signi cou a ausência
deconcordância entre os juízes, reforçando a necessidadede
reestabelecer os critérios de medição.
Da mesma forma, um estudo australiano17 , cujo objetivo
foi avaliar a concordância entre juízes para uma classi
cação de laceração da pele nos idosos, demonstrou
índice Kappa insatisfatório. Vinte e seis enfermeiras da
Associação Australiana de Cuidado com Feridas receberam
um treinamento prévio sobre o instrumento elaborado
e uma cópia dos itens que deveriam ser seguidos para a
classi cação das lesões por meio de fotogra as. Asenfermeiras
foram solicitadas a classi car 25 fotogra as de
lacerações de pele, sendo o índice Kappa calculado para
cada fotogra a.
O resultado demonstrou grande discordância entre os
juízes quanto à classi cação das lesões, além de erros na
categoria correta de algumas fotogra as. Em face destes
resultados, considerou-se que, apesar do treinamento, as
enfermeiras poderiam ter utilizado sua experiência clínica
para a classi cação das lesões em lugar do instrumento
elaborado pelos pesquisadores17 . Nestes dois estudos10,17 ,
os resultados de baixa con abilidade foram úteis, evidenciando
a necessidade de readaptação ou reelaboração do
instrumento para futuras aplicações.
O atributo homogeneidade ou consistência interna
demonstra que todas as questões ou itens de um instrumento
medem o mesmo conceito. A coerência interna das
questões permite ao investigador obter o escore total para
o conceito mensurado. Assim, existem quatro métodos para
testar a homogeneidade: correlações totais, con abilidade de
metade dividida, coe ciente de Kuder-Richardson e coe -
ciente - de Cronbach15 .
Dois estudos12,13 utilizaram o coe ciente de Cronbach
na abordagem da consistência interna, um coe ciente de
grande utilização e aceitação no meio acadêmico para
a estimação da con abilidade18 . Descritos na literatura,
encontram-se os pressupostos adotados pelos pesquisadores
na aplicação do de Cronbach nos estudos de
validação, tais como: o questionário dever estar divido e
agrupado em dimensões, ou seja, as questões tratarem de
um mesmo aspecto18 .
Em um desses estudos13 , agruparam-se 70 itens de seu
questionário em duas dimensões (o grau de satisfação relacionado
a um determinado aspecto da vida e a importância
de um determinado aspecto da vida). Outro pressuposto é
a necessidade de aplicação do questionário a uma amostra
signi cativa e heterogênea18 . Quando Yamada e Santos13 ,
em sua primeira etapa do estudo, adotaram a abordagem
da validade de conteúdo e a análise semântica, procurou-se
por meio do comitê de juízes a validação prévia do instrumento
(conteúdo). Em seguida, a aplicação do mesmo em
uma população alvo, cujos critérios de elegibilidade e locais
de estudo foram previamente estabelecidos, demonstrou a
representatividade da amostra heterogênea. A população-alvo
foi composta de pessoas portadoras de feridas de qualquer
etiologia, exceto as existentes em pacientes com câncer,
síndrome da imunode ciência adquirida e queimaduras
muito extensas, com idade igual ou superior a 18 anos, com
condições físicas e mentais de responder ao questionário e
consentimento de participação no estudo.
Os mesmos cuidados quanto aos três pressupostos
foram tomados por outro estudo12 , onde escreveu-se que a
elaboração da escala PROMS ocorreu em pesquisa anterior,
nos quais dados foram coletados de uma amostra de
38pacientes, que haviam recentemente se submetido à
terapia mieloablativa, antes do transplante de medula óssea.
Asdescrições das características sociodemográ cas da população-
alvo ressaltaram a presença da amostra heterogênea.
Com relação ao atributo estabilidade, observou-se, em
um estudo13 , a adoção da abordagem de Teste-Reteste para
a aferição de con abilidade, sendo o teste aplicado, o coe-
ciente de correlação intraclasse. A estabilidade existirá
quando os mesmos resultados forem obtidos em repetidas
aplicações do instrumento15 .
Nesta revisão, notou-se a coerência na escolha do método
de validação face ao objetivo de cada estudo. Ao comparar-se
os achados da presente revisão integrativa com a literatura
existente sobre o tema1-3,5,6,15,16,18 , notou-se que os autores da
amostra estão em concordância, quanto à forma metodológica
do processo de validação de instrumentos de medida.
CONSIDERAÇÕES FINAIS
Os estudos da amostra demonstraram a utilização de uma
metodologia atualizada e com semelhanças entre si. Osinstrumentos
elaborados tiveram sua validade e con abilidade
testadas, conforme a abordagem de cada pesquisador em adequação
ao tema e instrumento especí co. Notou-se, entre os
estudos, o alto grau de exigência metodológica e cientí ca
relacionado com a necessidade de clareza, detalhamento
do processo de validação, adequação de testes estatísticos e
conhecimento do tema pesquisado.
Ao comparar-se os achados com a literatura atual,
concluiu-se que os autores estão em consenso quanto à
forma metodológica do processo de validação de instrumentos
de mensuração e que existe uma grande quantidade
de testes estatísticos, que podem variar conforme a
necessidade dos estudos.
Esta revisão integrativa contribuiu para o esclarecimento
e a compreensão de algumas abordagens metodológicas adotadas
pelos estudos de validação relacionados com o cuidado
de lesões e para maior divulgação e agilidade no acesso ao
conhecimento sobre essa temática no meio cientí co.
REFERÊNCIAS
1. Melo RP, Moreira RP, Fontenele FC, Aguiar ASC, Joventino ES,
Carvalho EC. Critérios de seleção de experts para estudos
de validação de fenômenos de enfermagem. Rev Rene.
2011;12(2):424-31.
2. Cano SJ, Hobart JC. The problem with health measurement.
Patient Prefer Adherence. 2011;5:279-90.
3. Coluci MZO, Alexandre NMC, Milani D. Construção de
instrumentos de medida na área da saúde. Ciênc. Saúde
Coletiva. 2015;20(3):925-36.
4. Serpa LF, Santos VLCG, Campanili TCGF, Queiroz M.
Validade preditiva da Escala de Braden para o risco de
desenvolvimento de úlcera por pressão em pacientes
críticos. Rev Latino-Am Enferm. 2011;19(1):50-7.
5. Streiner DL, Norman GR. Health measurements scales:
a practical guide to their development and use. Oxford
University Press; 2008.
6. Keszei A, Novak M, Streiner DL. Introduction to health
measurement scales. J Psychosom Res. 2010;68(4):319-23.
7. Terwee CB, Bot SDM, Boer MR, van der Windt DA, Knol
DL, Dekker J, et al. Quality criteria were proposed for
measurement properties of health status questionnaires. J
Clin Epidemiol. 2007;60(1):34-42.
8. Flemming K. Perguntas passíveis de respostas. In: Cullum
N, Ciliska D, Haynes RB, Marks S. Enfermagem baseada em
evidências: uma introdução. Artmed; 2011. p. 42-8.
9. Santos VLCG, Azevedo MAJ, Silva TS, Carvalho VMJ, Carvalho
VF. Adaptação transcultural do pressure ulcer scale for
healing (push) para a língua portuguesa. Rev Latino-Am
Enferm. 2005;13(3):305-13.
10. Bajay HM, Araújo IEM. Validação e confi abilidade de um
instrumento de avaliação de feridas. Acta Paul Enferm.
2006;19(3):290-5.
11. Santos VLCG, Sellmer D, Massulo MME. Inter rater reliability
of pressure ulcer scale for healing (push) in patients with
chronic leg ulcers. Rev Latino-Am Enferm. 2007;15(3):391-6.
12. Kushner JA, Lawrence HP, Shoval I, Kiss TL, Devins GM, Lee
L, et al. Development and validation of a patient-reported
oral mucositis symptom (proms) scale. JCDA. 2008;74(1):59.
13. Yamada BFA, Santos VLCG. Construção e validação do índice
de qualidade de vida de Ferrans & Powers-versão feridas.
Rev Esc Enferm USP. 2009;43(Esp):1105-13.
14. Phelan KJ, Khoury J, Xu Y, Lanphear B. Validation of a home
injury survey. Inj Prev. 2009;15(5):300-6.
15. Burns N, Grove SK. The practice of nursing research:
conduct, critique and utilization. Elsevier;2005.
16. Alexandre NMC, Coluci MZO. Validade de conteúdo nos
processos de construção e adaptação de instrumentos de
medida. Cien Saúde Coletiva. 2011;16(7):3061-8.
17. Carville K, Lewin G, Newall N, Haslehurst P, Michael
R, Santamaria N, et al. Star: a consensus for skin tear
classifi cation. Primary intention. 2007;15(1):18-28.
18. Hora HRM, Monteiro GTR, Arica J. Confi abilidade em
questionários para qualidade: um estudo com o coefi ciente
alfa de Cronbach. Produto & Produção. 2010;11(2):85-103.