PSICOMETRIA
II

 

 

 

 

 

 

 

 

 

 

Validade e Fiabilidade

We Will Write a Custom Essay Specifically
For You For Only $13.90/page!


order now

 

A importância da análise científica de um instrumento

 

 

 

 

Rafael
Pereira

Nº 21501712

Curso de Psicologia 3º ano

 

 

Curso de Psicologia Docente: Dr. Pedro
Rosa

 

 

 

 

 

 

 

 

 

 

Dezembro de 2017

Universidade Lusófona de Humanidades e
Tecnologias

Validade e Fiabilidade

 

 

 

Introdução

 

Muitas
investigações na área das Ciências Sociais envolvem a realização de
questionários ou a construção de instrumentos de medida. Tipicamente, a
validade e a fiabilidade constituem preocupações dos investigadores de todas as
áreas das ciências sociais e, em especial, da psicologia, por se encontrarem
inerentes à necessidade de se avaliar sujeitos, com a utilização de
instrumentos de medida.

Quaisquer dados
recolhidos no mundo real contêm variabilidade e os dados em psicologia não são
exceção. Mas, apesar desta variabilidade, os investigadores esperam poder tirar
conclusões gerais a partir destes dados. Mais ainda: a variabilidade não pode
ser entendida necessariamente como inimiga porque compreender as fontes da
variabilidade que afetaram os dados, pode fornecer pistas acerca dos fatores
que influenciam os dados.

De um modo
geral, o que se pretende é explicar o sentido que têm as respostas dadas pelos
sujeitos a uma série de tarefas, tipicamente chamadas de itens. A teoria
clássica dos testes (TCT) preocupa-se em explicar o resultado final total, isto
é, a soma das respostas dadas a uma série de itens, expressa no resultado total
(T).

A teoria de
resposta ao item (TRI), por outro lado, não se debruça sobre o resultado total
de um teste, mas sobre cada um dos 30 itens, para determinar qual a
probabilidade (e quais são os fatores que afetam esta probabibilidade) de cada
item individualmente produzir resultados que diferenciem os sujeitos em
diferentes eixos bi ou multi-polares.

 

Conceito de Validade

 

Existem, de
acordo com vários autores, várias definições para o conceito de Validade. No
entanto, tal como se poderá perceber pelos aqui citados, é de consenso que a
Validade pode ser definida como a capacidade de o instrumento medir aquilo que
pretende medir, independentemente da exatidão da medida. (Creswell & Miller, 2000).

É cada vez mais
presente que deverá existir uma correta avaliação das qualidades dos
instrumentos de recolha de dados. “Os mais importantes atributos desses
instrumentos são:

 

1

validade
(validity), fiabilidade (reliability), praticabilidade (usability),
sensibilidade (sensitivity) e responsividade (responsiveness). Na realidade, as
características de validade e de fiabilidade são particularmente importantes ao
se escolher, desenvolver ou realizar a adaptação cultural de instrumentos que
serão usados tanto em pesquisas como na prática clínica”. (Alexandre, 2011)

Ainda segundo
este último autor, a “validade verifica se o instrumento mede exatamente o que
se propõe medir. Isto é, avalia a capacidade de um instrumento medir com
precisão o fenómeno a ser estudado. Pode-se considerar um instrumento válido
quando ele consegue avaliar realmente o seu objetivo”. (Alexandre, 2011)

De acordo com de
Andrade Martins (2006), citando Gressler (1989) “a
questão fundamental para se admitir a validade de um instrumento de medidas é
dada pela resposta à seguinte pergunta: Será que se está medindo o que se crê
que deve ser medido? Se a resposta é sim, a sua medida é válida, se não, não
é.”

 

A Validade pode
ser avaliada por meio dos seguintes métodos: validade de construto, validade
externa, validade ecológica ou preditiva e validade de conteúdo.

Então, para se
analisar a validade de um instrumento, podemos utilizar diferentes formas de
apreciação dessa capacidade no instrumento analisado:

 

Validade
de construto

 

Esta constitui a
forma fundamental de validade dos instrumentos psicológicos, e pretende
verificar a hipótese da legitimidade de o instrumento conseguir traduzir uma
representação comportamental dos traços latentes.

Uma das
possibilidades de métodos para análise da validade de construto é a Análise
Fatorial. Por isso podemos também referir-nos a Validade Fatorial — que é
quando a distribuição dos fatores é semelhante à organização da prova. (Healy
& Perry, 2000). Este método permite verificar se as dimensões
especificadas no instrumento traduzem a estrutura real dos traços avaliados. A
Análise fatorial exploratória permite identificar os

fatores
latentes, e assim a estrutura fatorial subjacente a um conjunto de variáveis. A
análise fatorial confirmatória é um outro método de a verificação da validade
de construto. Neste

 

2

caso, os
itens do instrumento são submetidos a uma comparação forçada com as dimensões
que se aceita existirem subjacentes ao instrumento. Este método permite assim
observar a aproximação ou afastamento do instrumento relativamente às dimensões
estabelecidas, para se verificar a validade de construto.

Segundo Sampieri (1998), dificilmente a validade de
constructo será estabelecida num único estudo. Ela é construída por vários
estudos que investigam a teoria do constru to

particular que está a ser medido. Medidas de variáveis do
campo das ciências sociais aplicadas têm vida limitada. Com a acumulação de
resultados de pesquisas, os investigadores descobrem limitações e criam novas
medidas para corrigir possíveis problemas. Esse processo leva ao aprimoramento
das medidas e a uma compreensão mais completa das variáveis subjacentes que
estão a ser estudadas.

 

Validade
externa

 

Este tipo de
validade é a que permite analisar a competência do instrumento, por comparação
com critérios externos ao teste. Por esta razão também se denomina Validade por
referência a critério externo. Pode ser obtida com diferentes métodos de
comparação, entre os quais destacamos a comparação dos resultados obtidos no
instrumento em causa, e aqueles obtidos num instrumento que, supostamente,
avalia o mesmo construto.

Nesse caso,
quando se verifica convergência entre os resultados obtidos nos dois
instrumentos de medida, e podemos aceitar que estão cumpridos os critérios de
validade externa, através da análise da validade convergente. (Creswell & Miller, 2000).

Um método
complementar de análise da validade consiste em comparar o instrumento com
outros que, supostamente, avaliam construtos efetivamente não relacionados.
Neste caso, a variação dos resultados do instrumento não pode ser explicada
pelos resultados do segundo instrumento, nem variar em acordo com este. Quando
se verifica independência de resultados, isso significa que o construto em
analise presenta alguma robustez concetual, pois mantem a independência de
resultados relativamente a instrumentos que avaliam construtos já identificados
como independentes.

A divergência na variação dos resultados permite assumir que existe
validade divergente.

 

 

 

3

Validade ecológica ou preditiva

 

Trata-se de
analisar em que medida um teste ou instrumento de medida consegue captar os
traços latentes que especificam comportamentos reais no mundo real. Um teste
terá uma boa validade preditiva se aquilo que mede puder ser verificado na
ação, comportamento do sujeito, ou outro aspeto prático do mundo real. (Davies & Dodd, 2002)

Neste caso, os
resultados do teste relativamente a um determinado construto, devem ser
comparados com a informação do meio real em que o sujeito ou sujeitos se movem,
relativamente ao mesmo construto. A validade do instrumento será ainda mais
preditiva se a recolha de informação do contexto real ocorrer com desfasamento
temporal relativamente à administração do instrumento, preferencialmente com
anterioridade relativamente à manifestação do comportamento real.

 

Validade de conteúdo

 

A validade de
conteúdo de uma prova ou instrumento consiste em se analisar em que medida o
instrumento mede realmente o que se pretende medir, tendo em conta a
investigação existente até ao momento, ou a opinião de especialistas na área
que o instrumento pretende avaliar. (Creswell &
Miller, 2000).

Um dos métodos de
estudo desta validade é o Acordo Interobservadores. Neste método é solicitada a
opinião de diferentes especialistas na área que o instrumento supostamente
avalia, relativamente à aproximação ou distanciamento dos aspetos teóricos
conhecidos acerca do que o instrumento avalia. O Coeficiente de kappa (k)
permite calcular o número de vezes em que existe acordo interobservadores,
fundamentando assim (ou não) a validade de conteúdo do instrumento.

De Andrade
Martins (2006) afirma a este respeito que a
validade de conteúdo se refere ao grau em que um instrumento evidencie um
domínio específico de conteúdo do que pretende medir. É o grau em que a medição
representa o conceito que se pretende medir. Por exemplo, uma prova de
operações aritméticas não terá validade de conteúdo se incluir somente
problemas de adição e excluir problemas de subtração, multiplicação e divisão.

 

 

4

Conceito de Fiabilidade

 

 

Conforme explica Cozby (2003), fiabilidade de um
instrumento de medição refere-se ao grau em que a sua repetida aplicação, ao
mesmo sujeito ou objeto, produz resultados iguais. Por exemplo, ao se medir de
forma constante a temperatura de uma sala climatizada, o termómetro que
apresentar resultados diferentes em cada medição deve ser considerado não
confiável, pois, sabemos que nessas condições, não há motivo para mudanças de
temperatura. Se ocorrerem resultados alterados o instrumento de medida não terá
a característica de fidedignidade e os seus resultados não serão confiáveis.

De maneira geral, uma medida fidedigna é consistente e
precisa porque fornece uma medida estável da variável. Por outras palavras,
fiabilidade refere-se à consistência ou estabilidade de uma medida.( Healy & Perry, 2000).

Fiabilidade
significa precisão da medida, e pode ser analisada através da análise da
consistência ou estabilidade da medida.

 

Consistência
interna

 

A medição da
consistência interna de um instrumento permite analisar se os itens ou
subescalas estão orientados em acordo com o resultado total obtido na escala.
Pode ser efetuado através de procedimento de Bipartição baseado na divisão dos
itens de cada prova em duas metades, assegurando-se assim que ambas as metades
têm o mesmo comportamento na prova. É também possível executar este
procedimento para séries aleatórias de bi-partições de metade dos itens, o que
avalia, de forma ainda mais robusta, a consistência interna da prova.

A fiablidade é a
capacidade em reproduzir um resultado de forma consistente no tempo e no
espaço, ou com observadores diferentes. Os seguintes procedimentos são
utilizados para sua avaliação: estabilidade (teste-reteste), homogeneidade e
equivalência (inter observadores). (Neuza, 2009)

 

 

 

 

 

5

Estabilidade temporal

 

Um teste ou
instrumento de medida com fiabilidade não deve produzir resultados
significativamente diferentes se for repetido sobre o mesmo indivíduo. Healy, M., & Perry, C. (2000).

A possibilidade
de o instrumento produzir resultados temporais estáveis no tempo é uma forma de
se valorizar quanto ao índice de fiabilidade.

 

Técnica do Teste-Reteste

 

 

No caso desta técnica, o instrumento de
medida utilizado é aplicado a um mesmo grupo duas vezes, depois de um espaço de
tempo entre as aplicações. Se a correlação entre os resultados das duas
aplicações for bastante positiva o instrumento pode ser

considerado confiável. Quando a variável que estamos a analisar
“apresentar um nível intervalar de mensuração, pode-se calcular o coeficiente de correlação linear de Pearson”. (Sampieri, 1998).

O período de tempo entre as medições é um fator a
considerar quando da aplicação desta técnica, pois percebeu-se que períodos
muito longos são suscetíveis às mudanças e ao favorecimento de aquisição de
novas aprendizagens. Mudanças estas que podem comprometer aquilo que será a
interpretação do coeficiente de confiabilidade que obtivemos. Por sua vez, se o
período é curto, podemos ter a interferência da memória de curto ou médio
prazo.

O intervalo longo entre o teste e reteste pode provocar
uma sub-avaliação da estabilidade. Um exemplo claro desta situação pode
ser o encontrado aquando da realização de um trabalho na cadeira de Psicometria
I, onde foi aplicado um questionário com a seguinte pergunta: qual a refeição
que prefere comer quando sai com amigos?

a)   Sandes
b)    bitoque    c)    bacalhau com natas    d)    hambúrguer    e) tanto faz Na
primeira aplicação o participante respondeu a opção d). Contudo, o facto de se ter

deparado com outros pratos, levou o participante eventualmente,
ao despertar para outras possibilidades.

 

 

 

6

Após um período de tempo considerado longo aplicou-se o
reteste e o mesmo participante respondeu a opção b).

Ao compararmos as respostas podemos ser levados a afirmar
que o questionário não tem a estabilidade pretendida. Contudo, não podemos
perder de vista que se trata de uma mudança do participante. Estamos, portanto,
uma sub-avaliação da chamada estabilidade do instrumento.

 

Técnica do Split-Half

 

 

Esta técnica exige apenas uma única aplicação, ou seja, o
objetivo é o de avaliar a confiabilidade usando respostas obtidas numa única
aplicação do instrumento de medidas. Split-half
trata as duas metades de uma medida como formas alternativas. Essa estimativa
de “split-half” é então intensificada até o cumprimento total do
teste usando a fórmula de previsão Spearman-Brown. Às vezes é referido como o
coeficiente de consistência interna. A medida de consistência interna mais
comum é o alfa de Cronbach, que geralmente é interpretado como a média de todos
os possíveis coeficientes de Split Half. O alfa de Cronbach é uma generalização
de uma forma anterior de estimar a consistência interna, Kuder-Richardson 20
(KR-20).

 

Coeficiente KR-20

 

 

Este indicador do grau de fiabilidade de um instrumento
de medição foi desenvolvido por Kuder e Richardson (1937) e tem finalidade
semelhante ao coeficiente de Cronbach. É utilizado quando os t e s t e s t ê m
r e s p o s t a s d i c o t ó mi c a s : s i m / n ã o ; …

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

Conclusões

 

Pelo anteriormente descrito, e à luz da literatura consultada, pode-se
concluir que para medir a maioria dos conceitos de validade temos que aplicar
medidas de correlação ou associação, tais como as apresentadas, para medir
fiabilidade.

Ao longo desta
explanação teórica também se encontrou em vários autores, o conceito de
validade associado a estudos observacionais (para além dos habituais
instrumentos de medida utilizados). Quando assim é importa classificar ou
organizar a validade em dois tipos: interna e externa.

No que respeita
à validade interna, esta depende da capacidade do estudo responder efetivamente
às questões apresentadas. Mede, portanto, até que ponto os resultados do estudo
são produto das variáveis selecionadas, observadas e medidas.

Por outro lado,
a validade externa mede até que ponto os resultados obtidos pelo estudo podem
ser generalizados para outras situações com outros indivíduos.

O que se pretendeu com este trabalho foi apresentar e, na
medida do possível, explicar e até mesmo exemplificar, bem como explanar sobre
os critérios de exigências de medidas que advém de instrumentos de recolhas de
dados e respetivas técnicas de aferição. Para o efeito analisaram-se a validade
e fiabilidade dos instrumentos.

Nesta análise, foi claramente percetível que, ainda que
não concordando em todos os pontos, os autores são unânimes ao mencionar dois
critérios fundamentais para que possamos considerar um instrumento como bom:
fiabilidade e validade.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

Referências:

 

 

Alexandre,
N.M.C., e Coluci, M.Z.O., (2011). Validade de conteúdo nos processos
de construção e adaptação de instrumentos de medidas. Ciência &
Saúde Coletiva, 16(7):3061- 3068.

 

COzBy, P. C. (2003). Métodos de pesquisa em ciências
do comportamento. são. Paulo: Editora
Atlas.

Creswell,
J. W. & Miller, D. L. (2000). Determining validity in qualitative inquiry.
Theory into Practice, 39(3), 124-131.

 

Davies,
D., & Dodd, J. (2002). Qualitative research and the question of rigor.
Qualitative Health research, 12(2), 279-289.

 

Healy,
M., & Perry, C. (2000). Comprehensive criteria to judge validity and
reliability of qualitative research within the realism paradigm. Qualitative
Market Research, 3(3), 118- 126.

 

Pasquali, L. (2009). Psicometria. Revista da Escola de Enfermagem da USP,
43, 992-999. Alexandre, N. M. C., & Coluci, M. Z. O. (2011). Validade de
conteúdo nos processos de construção e adaptação de instrumentos de medidas. Ciência & Saúde Coletiva.

 

Sampieri, R. H., Collado, C. F., Lucio, P. B., &
Pérez, M. D. L. L. C. (1998). Metodología
de la investigación (Vol. 1). México: Mcgraw-hill.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

Author