Supercomputação na Deteção e Diagnóstico do Cancro da Mama

A utilização de recursos de Supercomputação na região do Porto tem seguido uma tendência de crescimento nos últimos anos, impulsionada por empresas e por grupos de investigação. Neste artigo, investigadores da Universidade do Porto (INEGI -FEUP- Instituto de Ciência e Inovação em Engenharia Mecânica e Engenharia Industrial) exploram novas estratégias e paradigmas de inovação no âmbito da deteção do cancro da mama, assim como os desafios chave relativos à sua adoção, recorrendo ao uso desta ferramenta imprescindível.

corpo

Miguel Guevara e Mário Vaz são dois investigadores do Instituto de Ciência e Inovação em Engenharia Mecânica e Engenharia Industrial (INEGI), que nasceu no seio do departamento de Engenharia Mecânica e Gestão Industrial da FEUP, tendo como objetivo servir de ponte entre o mundo académico e a indústria. Ambos os investigadores fizeram parte da construção de um repositório digital de pacientes com cancro da mama (BCDR), composto por imagens de mamografias, historiais clínicos, provas de biopsias e outras informações médicas relevantes para o diagnóstico do cancro da mama. O BCDR é uma base de dados de referência (ao nível Ibérico) para o desenvolvimento de métodos computacionais de apoio à deteção e diagnóstico do cancro da mama, que atualmente integra dados anotados de aproximadamente 2 mil pacientes. Este projeto foi financiado pelo fundo FEDER e pelo CIEMAT (Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas de Espanha), e teve como parceiros um grupo de radiologistas e técnicos em radiologia coordenados pela Professora Isabel Ramos da Faculdade de Medicina – Centro Hospitalar São João, Universidade do Porto e um grupo de investigadores do “Centro Extremeño de Tecnologias Avanzadas” da Extremadura, CIEMAT, Espanha. Por acordo dos membros do consórcio vários “data sets” extraídos do BCDR (representativos de lesões associadas a massas e calcificações) foram validados e disponibilizados com o objetivo de que universidades e centros de investigação sem fins lucrativos pudessem utilizá-los como referência.

Os dados clínicos dos pacientes e as características extraídas das lesões (marcadas manualmente por radiologistas experientes) nas imagens mamográficas são usados como ponto de partida – são o input – para produzir classificadores automáticos que visam o apoio à deteção precoce do cancro da mama”, explica Miguel Guevara. Com recurso à Supercomputação, a algoritmos de reconhecimento de padrões e de aprendizagem computacional, o INEGI deduziu as relações complexas que existem face à análise de imagens e dados biomédicos – Machine Learning (ML) um subcampo dentro da Inteligência Artificial. “Ao explorar os diversos grupos de características trazidos pelas imagens e pelos dados clínicos, retirados a partir do relatório dos pacientes, tentamos comparar como se comportavam os algoritmos de ML em imagens de baixa resolução quando comparados com imagens de alta resolução, com vista à criação de métodos de apoio ao diagnóstico do cancro da mama”, explica Miguel. Este projeto procura assim explorar as potencialidades dos algoritmos de ML e avaliar a performance dos métodos de apoio ao diagnóstico (CADx – Computer-Aided Diagnosis) no cancro da mama.

cancro_mama

 

A importância dos sistemas CADx está relacionada com a recomendação da Organização Mundial da Saúde quanto ao diagnóstico do cancro da mama, que aconselha a leitura das mamografias por dois radiologistas para despistar um possível cancro. No entanto, esta opção é dispendiosa, pelo que optar por utilizar CADx faz com que seja possível ter uma segunda opinião com apenas um radiologista. Para conseguir produzir classificadores robustos, é essencial ter uma base de dados de referência anotada, que inclua toda a informação associada ao paciente: conteúdos digitais (imagens de diferentes modalidades) e os meta-dados associados (historial do paciente, dados clínicos, provas de biopsias, etc.)

Sabia que…

Os sistemas computacionais de apoio a análise de lesões patológicas relacionadas com o cancro podem ser agrupados, atendendo aos seus objetivos, em 2 grupos ou categorias: métodos de apoio à deteção e métodos de apoio ao diagnóstico:

1) Sistemas de Apoio a Deteção (CADe) – que tem como objetivo detectar possíveis regiões suspeitas nas imagens: com este propósito normalmente as imagens são armazenadas num servidor PACS (Picture Archiving and Communication System) e de forma automática são revistas por algoritmos treinados para detetar regiões suspeitas de ser patológicas. O resultado é a mesma imagem mas com algumas marcações (em determinadas regiões da imagem) que representam uma indicação para que o médico posteriormente analise a região marcada.

2) Sistemas de Apoio ao Diagnóstico (CADx) – que tem como objetivo, a partir de que uma região na imagem e marcado pelo radiologista (médico) ou pode ser também tomando como input uma imagem processada previamente com um sistema CADe, oferecer uma “segunda opinião” sobre o diagnóstico da lesão analisada (por exemplo, se é benigna ou maligna). Os métodos/sistemas CADx foram o foco do projeto da equipa de Mário e Miguel.

 

Um projeto com “duplo valor”

“Uma componente importante que distingue este projeto em particular é que, ao contrário do que acontece com outras bases de dados nesta área sabemos a origem dos dados – pertencem a arquivos históricos (anotados) de pacientes que são usados regularmente pela Faculdade de Medicina – Centro Hospitalar São João, Universidade do Porto para o ensino de futuros médicos e radiologistas. Portanto, são dados representativos de lesões totalmente estudadas/avaliadas e corretamente diagnosticadas. Alem disto, com o apoio decisivo, dum grupo de radiologistas e técnicos de radiologia coordenados pela Professora Isabel Ramos, diretora do serviço de radiologia do HSJ, foram marcadas manualmente as regiões correspondentes às lesões nas imagens para completar o processo de anotação das lesões (“Ground Truth”). Este facto é algo fundamental para o treino dos classificadores com recurso às técnicas de aprendizagem automática (ML) e reconhecimento de padrões, pois assim é possível ter uma referência correta do que é uma lesão benigna e uma lesão maligna. É este facto o que torna o BCDR “um repositório de referência”.

Embora o projeto ainda esteja oficialmente numa fase considerada experimental, os resultados obtidos têm sido bastante satisfatórios. “Neste momento, este diagnóstico computacional consegue indicar quando há necessidade de efectuar uma biopsia. Os resultados experimentais que temos alcançado são alentadores, logrando-se valores de até 0.9 na área debaixo da curva ROC (medida utilizada para avaliar a performance dum classificador, que pode ir de 0 a 1) quando são combinados dados clínicos e características (descritores) baseadas na radiografia”.

imagem1

A adaptação às técnicas de supercomputação/computação distribuída

A participação neste projeto do Centro Extremeño de Tecnologia Avançada (CETA), uma unidade do CIEMAT, Espanha, permitiu-nos o aceso à comunidade GRID/Cloud, que foi posteriormente potenciado com a colaboração estabelecida com o grupo que coordena a computação GRID na UP, que se disponibilizou para dar suporte e criar as condições necessárias para alojar o BCDR nas suas infraestruturas.

“Este tipo de projetos traz valias incalculáveis para a sociedade mas o maior problema com que nos temos confrontado é com o financiamento, que não é dado de forma “continuada”, conta Mário. “Acho que estamos a desenvolver ferramentas importantes, uma mais-valia, não só para o nosso Sistema Nacional de Saúde, mas até para exportar, vender ou comercializar em qualquer outra forma para outros países, de modo a incluir dados de outros pacientes. As conclusões a que estamos a chegar são valiosas e é uma pena que não tenhamos, internamente, capacidade para manter uma estrutura de investigação durante mais tempo. Não há dúvidas, desde o primeiro minuto, de que o caminho é este, o que é preciso é que isto seja feito de forma consistente… não pode ser feito de forma alternada, isto porque na computação a continuidade é algo fundamental”, explica Mário.

Quanto ao reconhecimento da supercomputação como sendo uma ferramenta-chave para o progresso, Mário considera que em Portugal “a infraestrutura está montada, o problema é que ela precisa de um conjunto de investigadores altamente especializados que consigam fazer a ponte entre a computação e a realidade, entre as várias áreas que podem beneficiar dela, de forma a aproveitar todo o seu potencial. E isso é que tem faltado nos últimos anos à supercomputação em Portugal, bem como o financiamento a esses mesmos investigadores”.

O apoio e o financiamento continuado aos investigadores são aspetos que os dois investigadores consideram particularmente importantes para o desenvolvimento deste e de outros projetos que dependem da supercomputação. Nesse mesmo contexto, Mário e Miguel explicam o próximo objetivo deste projeto: “pretendemos tentar desenvolver/descobrir novos biomarcadores de imagens, envolvendo outras modalidades de imagem e ampliando os meta-dados associados, identificar indicadores de risco, face a conseguir uma maior estratificação dos pacientes e portanto ter um abordagem mais personalizado dos pacientes. É esse o nosso objetivo”.

 

 

Artigo desenvolvido em colaboração com:

mariovaz

Mário Augusto Vaz

Mário Augusto Pires Vaz é doutorado pela FEUP desde 1995 e desde 2000 que é o Director do Laboratório de Óptica e Mecânica Experimental do INEGI. As suas áreas de especialização passam pela Engenharia Mecânica, Mecânica Experimental e técnicas de holografia laser. Para além disso, desenvolve projetos e esteve envolvido em múltiplas publicações em várias áreas científicas, como a inspecção não destrutiva, técnicas de caracterização de forma, caracterização de materiais em solicitação de impacto e em biomecânica. Atualmente, os seus principais interesses de investigação prendem-se com as técnicas de interferometria, inspecção não destrutiva, monitorização da integridade estrutural, caracterização do comportamento dinâmico de materiais e estruturas e a biomecânica.

miguelguevara2

Miguel Guevara

Miguel A. Guevara López é licenciado em Matemática no Instituto Superior de Educação “Jose Marti” Camaguey (Cuba) e doutorado em Técnicas Científicas no Instituto de Computação, Matemática e Física da Academia Cubana das Ciências, em 1997. Iniciou as suas pesquisas em 1988 no âmbito do processamento de imagens digitais, reconhecimento de padrões, machine learning, data mining e técnicas de inteligência artificial com aplicação na análise de dados e imagens. De 1988 a 2008 foi professor e investigador na Universidade de Ciego de Avila, Cuba (UNICA). Em 2008 é contratado como Investigador Auxiliar para o INEGI, onde fundou e lidera o grupo BIOIDA (Biomedical Image and Data Analysis), um grupo de investigação multidisciplinar que faz pesquisa aplicada em imagens e dados biomédicos. É membro da APRP (Associação Portuguesa de Reconhecimento de Padrões).

Quer explorar a Supercomputação na sua organização?

Nome*
Email*
 

Telefone*
Descrição*

*Campos obrigatórios