Wagner Iared1; Andrea Puchnick2; Eduardo Bancovsky3; Paulo Roberto Bettini3; Leonardo Modesti Vedolin4; Maria Cristina Chammas5
RESUMO
OBJETIVO: Apresentar e verificar a reprodutibilidade de um sistema quantitativo de avaliação da qualidade de exames de ultrassonografia (SQUALUS), levando em consideração as imagens documentadas e a coerência entre as imagens obtidas e o laudo final. MATERIAIS E MÉTODOS: Foram elaborados quesitos considerando o número de imagens, a adequação das imagens ao protocolo estabelecido, o ajuste do foco, a profundidade e ganho e a adequação das medidas. Para exames com Doppler também foram avaliadas a adequação das fotos coloridas, a análise espectral e a correção do ângulo. Para a qualidade do laudo foi considerada a coerência com as imagens documentadas e seu conteúdo. Um sistema numérico foi atribuído conferindo uma nota final à qualidade das imagens, ao conteúdo do laudo e à média das duas avaliações. Trinta exames de ultrassonografia de diferentes tipos foram avaliados por dois examinadores independentes, cegos à avaliação um do outro. MATERIAIS E MÉTODOS: Os avaliadores apresentaram concordância estatisticamente significante em 8 de 10 quesitos para avaliação da qualidade da imagem. Na avaliação dos laudos, a concordância entre os avaliadores foi quase perfeita. CONCLUSÃO: O sistema quantitativo de avaliação da qualidade de exames ultrassonográficos proposta é uma ferramenta reprodutível que pode ser utilizada em auditorias e em programas de acreditação.
Palavras-chave: Ultrassonografia; Controle de qualidade; Melhoria de qualidade; Certificação; Acreditação.
ABSTRACT
OBJECTIVE: To present a quantitative system for assessing the quality of ultrasound examinations—SQUALUS—and to determine its reproducibility, taking into consideration the images on file, as well as the consistency between the images obtained and the final report. MATERIALS AND METHODS: The system includes questions related to the number of images; the appropriateness of images in relation to the protocol established; focus adjustment; depth; gain; and appropriateness of the measurements for B-mode examinations. For Doppler examinations, the system includes questions related to the appropriateness of color images, the spectral analysis, and correction of the insonation angle. To assess the quality of the report, the system includes questions related to the consistency between the images obtained and the contents of the report. An overall numerical score was assigned by averaging the scores for image quality and for the contents of the report. Two independent examiners, each blinded to the evaluation of the other, assessed 30 different types of ultrasound examinations. RESULTS: There was statistically significant agreement between the two examiners for 8 of the 10 questions related to image quality. For the questions related to the quality of the reports, the interexaminer agreement was almost perfect. CONCLUSION: The proposed quantitative system for assessing the quality of ultrasound examinations is a reproducible tool that can be used in audits and accreditation programs.
Keywords: Ultrasonography; Quality control; Quality improvement; Certification; Accreditation.
INTRODUÇÃO A preocupação com a qualidade dos serviços médicos é uma realidade. A Agência Nacional de Saúde Suplementar do Ministério da Saúde tem desenvolvido normas e padrões, como o Programa de Divulgação da Qualificação dos Prestadores de Serviços na Saúde Suplementar, instituído pela Resolução Normativa nº 267, de 24 de agosto de 2011, e o Programa de Monitoramento da Qualidade dos Prestadores de Serviços na Saúde Suplementar, instituído pela Resolução Normativa nº 275, de 1º de novembro de 2011(1), para promover a qualidade dos prestadores com foco nos beneficiários. Isso vem ao encontro dos esforços do Colégio Brasileiro de Radiologia e Diagnóstico por Imagem (CBR) em seus programas de certificação de qualidade(2) e do Programa de Acreditação em Diagnósticos por Imagem (PADI)(3). A avaliação da qualidade dos exames de ultrassonografia (US) é diferente de outras modalidades de exames de diagnóstico por imagem. Em modalidades como mamografia, radiografia, tomografia computadorizada e ressonância magnética, há profissionais não médicos (técnicos, tecnólogos e biomédicos) que fazem a aquisição e registro das imagens segundo protocolos determinados, que podem ser alterados caso a caso pelos radiologistas responsáveis. Na US, no entanto, é o próprio médico que adquire e registra as imagens, além de elaborar o laudo final. E, embora o CBR, por meio da Comissão Nacional de Ultrassonografia (CNUS)(2) e do PADI(3), além de outras instituições, tenham padronizado protocolos de documentação mínima das imagens de cada tipo de exame de US, ainda encontramos enorme disparidade no padrão de resultados entre diferentes médicos e diferentes instituições. Em relação ao laudo do exame, diferentemente do que ocorre com outras modalidades de diagnóstico por imagem, em que as mesmas imagens podem ser interpretadas por mais de um médico radiologista, a US é um método dinâmico em que a varredura dos diversos órgãos e estruturas pode e deve ser realizada em diversos planos, mas um número limitado de imagens é registrado na documentação. Presume-se que as imagens registradas sejam as mais representativas dos achados normais e patológicos, conforme os protocolos de documentação mínima especificam. Disso decorre a dificuldade em se avaliar a qualidade técnica de exames de US. Não há na literatura científica, até agora, trabalho preconizando algum método de avaliação da qualidade do exame ultrassonográfico semelhante ao que estamos propondo. Há estudos com foco em aspectos técnicos dos equipamentos(4,5), estudos sobre parâmetros técnicos relacionados ao treinamento no método(6) e estudos sobre a influência da qualidade das imagens em diagnósticos específicos(7–9), mas não estudos sobre a qualidade do exame realizado e laudado pelo profissional médico. O objetivo deste trabalho é apresentar e verificar a reprodutibilidade de um sistema quantitativo de avaliação da qualidade de exames de US (SQUALUS), levando em consideração as imagens documentadas e a coerência entre as imagens obtidas e o laudo final. MATERIAIS E MÉTODOS Elaboração dos critérios de avaliação da qualidade da imagem Tomando como base as normativas do PADI(3) e da CNUS/CBR(2), e levando em conta os parâmetros técnicos propostos pela Associação Americana de Radiologia e pelo Instituto Americano de Ultrassom em Medicina(10), foi elaborada uma lista de quesitos que foi utilizada para avaliação dos exames. Para exames de rotina, foram utilizados os seguintes parâmetros: • Número mínimo recomendado de imagens. • Adequação das estruturas documentadas às recomendações. • Adequação da profundidade. • Ajuste do foco. • Ajuste do ganho/frequência do transdutor/mapa de cinzas. • Adequação das medidas pertinentes. Para exames de Doppler, foram avaliadas, adicionalmente: • Adequação das imagens com Doppler colorido. • Análise espectral apropriada. • Correção do ângulo para análise das velocidades de fluxo. Para cada quesito, o avaliador deveria verificar e responder sim, não ou não se aplica. Para diferentes tipos de exame, diferentes pesos foram aferidos a cada quesito. A Tabela 1 mostra o checklist utilizado para todos os tipos de exame e a Tabela 2 mostra os pesos de cada quesito para os diferentes tipos de exame. Se a resposta fosse sim para todos os quesitos, a soma seria no máximo 10. Se um exame estivesse totalmente fora do padrão (resposta não a todos os quesitos pertinentes), a nota seria zero. Elaboração dos critérios de avaliação da adequação e coerência do laudo com as imagens Como a obtenção das imagens é dependente do operador, o laudo final do exame ultrassonográfico foi avaliado de acordo com a coerência com as imagens obtidas. O grau de concordância entre o laudo e as imagens foram classificados em quatro diferentes categorias: • Laudo adequado e coerente com as imagens. • Discordância de baixa relevância. • Discordância de média relevância. • Discordância de alta relevância. Erros leves de digitação ou ortografia que não comprometeram a compreensão do laudo e nem o diagnóstico final foram considerados como discordância de baixa relevância. Erros grosseiros de ortografia ou digitação, descrições inapropriadas e impressões diagnósticas dúbias foram considerados como discordância de moderada relevância. Descrições e impressões diagnósticas incompatíveis com as imagens documentadas foram consideradas como discordância de alta relevância. Para laudo adequado e coerente foi atribuída a nota 10; para laudo com discordância de baixa relevância, nota 7; para laudo com discordância de média relevância, nota 3; e para laudo com discordância de alta relevância foi atribuída a nota 0. O laudo e as imagens são indissociáveis, portanto, a média aritmética entre as notas da qualidade das imagens documentadas e a nota da adequação e coerência do laudo foi utilizada como parâmetro final para julgar a qualidade de cada exame avaliado. Se um exame apresentou qualidade de imagens excelente e um laudo com discordância de alta relevância, a nota final foi no máximo 5. Se as imagens foram excelentes e um laudo com discordância de moderada relevância, a nota foi no máximo 6,5. Da mesma forma, um laudo adequado e coerente com imagens que fugissem totalmente dos critérios preconizados, ou seja, com resposta não a todos os quesitos, teve nota 5. Teste de concordância A equipe médica que realizou os exames foi previamente informada quanto ao padrão de documentação a ser seguido e que os exames seriam auditados aleatoriamente. Foi guardado sigilo da identidade dos médicos que realizaram os exames envolvidos neste estudo, assim como da identidade dos pacientes. Dois avaliadores independentes, ambos radiologistas titulados pelo CBR, um com 23 anos de experiência em US e o outro com 16 anos de experiência, avaliaram os mesmos 5 exames de cada tipo, somando 30 avaliações de cada avaliador. Os exames avaliados foram extraídos aleatoriamente entre os realizados em unidades dos laboratórios de uma empresa privada de São Paulo, em agosto e setembro de 2016. Cada avaliador aplicou o checklist sem o conhecimento da avaliação do outro. Os tipos de exames avaliados foram: abdome total, pelve transvaginal, mamas, Doppler de tireoide para avaliação de nódulos, Doppler de tireoide para avaliação de doença difusa, Doppler de carótidas e Doppler das veias dos membros inferiores. Análise estatística A análise estatística das informações coletadas nesta pesquisa foi inicialmente feita de forma descritiva. Para as variáveis "nota da imagem", "nota do laudo" e "média final do exame", de natureza quantitativa (numérica), foram calculadas medidas-resumo, como média e desvio-padrão. As demais variáveis, de natureza qualitativa (categorizada), foram analisadas por meio de cálculo de frequência absoluta e relativa (porcentagem). O estudo da concordância entre os dois avaliadores para todos os parâmetros avaliados foi feito empregando- se a estatística kappa (κ). Para verificar a concordância entre os valores das notas e médias dadas pelos dois avaliadores, foram feitas, inicialmente, a construção do gráfico de Bland-Altman e, posteriormente, a estimação do coeficiente de correlação intraclasse (κicc). Para todas as medidas foi calculado o intervalo de confiança de 95%. A força da concordância dos coeficientes de kappa (κ; κicc) foi interpretada de acordo com a Tabela 3.