CHNSpec Technology (Zhejiang)Co.,Ltd chnspec@colorspec.cn 86--13732210605
No diagnóstico patológico tradicional, uma amostra de tecido de câncer de mama precisa passar por mais de dez processos, como fixação, incorporação, seccionamento e coloração. Desde a entrega da amostra até a emissão do relatório, muitas vezes leva várias horas ou até mais. Na etapa de congelação intraoperatória, os pacientes muitas vezes precisam estar em estado de espera anestésica, e a redução desse tempo é crucial para a segurança cirúrgica.
Um estudo publicado recentemente na revista "Scientific Reports" tenta usar um caminho técnico "sem rótulos e sem manchas" combinado com algoritmos de aprendizagem profunda para fornecer uma nova solução para esse problema clínico.
![]()
Quando as imagens patológicas “perdem” a cor
As imagens patológicas com as quais estamos familiarizados são geralmente apresentadas em tons azul-púrpura após coloração H&E, com limites claros entre o núcleo da célula e o citoplasma. A tecnologia de imagem hiperespectral microscópica (MHSI) pode obter 128 bandas de informações espectrais da luz visível ao infravermelho próximo (397-1032 nm) por meio da varredura de seções de tecido sem qualquer coloração.
O desafio direto trazido por esse estado “livre de manchas” é: as imagens carecem de contraste morfológico, dificultando a interpretação direta do olho humano. Porém, a vantagem dos dados hiperespectrais reside no fato de registrar curvas espectrais contínuas para cada ponto do pixel, e diferentes componentes bioquímicos (como proteínas, lipídios, ácidos nucléicos) apresentarão características de reflexão diferenciadas em comprimentos de onda específicos. Como extrair informações com valor diagnóstico de dados tão dimensionais e morfológicos fracos tornou-se um novo tópico na patologia computacional.
![]()
Transformando "diagnóstico de seção" em "aprendizado multi-instância"
A equipe de pesquisa construiu um conjunto de dados hiperespectrais contendo 468 seções de tecido de 60 pacientes com câncer de mama. Diferente dos métodos tradicionais que realizam previsão de ponto único em campos de visão locais, os pesquisadores modelaram o diagnóstico patológico como um problema de Aprendizagem Multi-Instâncias (MIL): tratando uma seção inteira de tecido como uma “bolsa”, e os cubos espectrais coletados de 20 regiões diferentes na seção como “instâncias” dentro da bolsa. O modelo precisa sintetizar as informações de todas as instâncias para gerar o resultado do diagnóstico para toda a seção.
Esta abordagem está mais próxima da lógica real de leitura de imagens dos patologistas – primeiro navegando globalmente sob um microscópio de baixa potência e depois concentrando-se em áreas suspeitas para um julgamento abrangente.
![]()
Mecanismo de "atenção" multinível
Visando as características dos dados hiperespectrais, a equipe propôs uma Rede de Atenção Hierárquica Multiescala (MS-HAN), cujo design central inclui três níveis principais:
![]()
1. A extração de recursos em várias escalas tira lições da estrutura Inception, usando diferentes tamanhos de núcleos de convolução em paralelo na mesma resolução espacial para extrair recursos, de modo a capturar informações de multigranularidade, desde diferenças espectrais sutis até padrões de textura locais.
2. O mecanismo de atenção dupla primeiro modela explicitamente as dependências entre bandas através da atenção do canal espectral, dando pesos mais elevados às bandas com informações mais ricas; em seguida, gera um mapa de calor bidimensional por meio de atenção espacial para localizar regiões com valor diagnóstico em termos de morfologia celular, sem depender de rotulagem em nível de pixel.
![]()
3.Agregação hierárquica e aprendizagem de protótipos. Para lidar com a alta variabilidade intraclasse nos espectros biológicos, o modelo introduz um conjunto de "vetores de protótipo" que podem ser aprendidos, atribuindo recursos de instância a esses protótipos e evita o colapso do modo, restringindo a entropia da distribuição de uso do protótipo. Finalmente, um mecanismo de autoatenção é utilizado para modelar as dependências entre diferentes regiões dentro da seção, obtendo a representação de toda a seção através do pool de atenção.
Sob treinamento fracamente supervisionado usando apenas rótulos em nível de seção, o modelo alcançou uma precisão de 86,7% e uma AUC de 0,92 em um conjunto de testes independente (94 seções), mostrando uma melhoria estatisticamente significativa em comparação com os principais modelos de linha de base da AMI, como TransMIL e CLAM.
![]()
Omissão da etapa de coloração e redução do tempo gasto
O ponto de apoio desta pesquisa não é substituir os patologistas, mas explorar um fluxo de trabalho de “secção óptica” mais “triagem primária de IA”. A omissão da etapa de coloração não significa apenas uma redução no custo de reagentes e consumíveis, mas, mais importante ainda, comprime significativamente o intervalo de tempo desde a amostragem até o diagnóstico digital. Para cenários urgentes, como congelamento intraoperatório, espera-se que este modo "cut-scan-analyse" reduza o tempo de espera dos pacientes sob anestesia.
Claro, esta pesquisa ainda está em fase de prova de conceito. A escala do conjunto de dados de centro único de 60 casos é relativamente limitada, e o desempenho do modelo diante de artefatos de preparação, baixa densidade celular ou subtipos moleculares raros ainda precisa de validação externa com dados multicêntricos e de amostras grandes. Além disso, o custo de hardware do equipamento de imagem hiperespectral é alto, e a mudança do laboratório para os departamentos de patologia de rotina ainda requer considerações nos níveis de engenharia e economia da saúde.