CancerGPT: a nova Inteligência Artificial que pode ajudar no combate à doença

Um grupo de pesquisadores dos EUA desenvolveu um modelo de Inteligência Artificial (AI, na sigla em inglês) chamado CancerGPT, que usa grandes modelos de linguagem pré-treinados (LLMs) para prever como diferentes combinações de medicamentos podem afetar tecidos humanos raros encontrados em pacientes com câncer.

Esta nova abordagem pode representar um grande progresso no domínio da investigação médica, particularmente em áreas em que os dados estruturados e a dimensão da amostra são limitados.

O estudo foi conduzido por uma equipe conjunta da Universidade do Texas e da Universidade de Massachusetts, e usou LLMs para extrair conhecimento prévio de textos de pesquisa médica e, em seguida, aplicou-o às tarefas de inferência biológica propostas. A equipe afirma que o modelo alcançou uma precisão significativa.

“Nossos experimentos, que envolveram sete tecidos raros de diferentes tipos de câncer, demonstraram que o modelo de previsão baseado em LLM alcançou precisão significativa mesmo com um número bem pequeno de amostras”, de acordo com o artigo.

AI na medicina

O uso de LLMs de AI na pesquisa médica tem sido um tema bem discutido em 2023. Recentemente surgiu o Ankh, um LLM que entende como as proteínas se comunicam, e que foi criado por um grupo de especialistas das universidades de Munique e Columbia em colaboração com a empresa de biotecnologia Protinea.

Além disso, outro grupo de pesquisadores usou a tecnologia de Inteligência Artificial para identificar três candidatos promissores para medicamentos senolíticos, que têm o potencial de retardar o processo de envelhecimento e mitigar doenças relacionadas à idade, matando as “células zumbi .”

Como funciona o CancerGPT

O CancerGPT é um LLM com aproximadamente 124 milhões de parâmetros, comparável ao modelo GPT-3 afinado, que tem aproximadamente 175 milhões de parâmetros.

O estudo utilizou o GPT-3 Zero-shot, um tipo de LLM, para fornecer respostas coerentes. Com isso, os cientistas avaliaram as respostas a diferentes tarefas comparando-as com a literatura científica existente e constataram que o LLM fornecia argumentos precisos na maioria das vezes.

No entanto, eles também observaram, no entanto, que “a precisão de seus argumentos nem sempre pode ser verificada e pode ser suscetível a alucinações.”

Os pesquisadores acreditam que alguns tipos de câncer possuem dados estruturados limitados e ainda têm informações valiosas representadas na literatura científica. Ao alavancar o poder de modelos linguísticos pré-treinados, eles foram capazes de fazer uso dos recursos existentes e obter “generalização”, melhorando sua capacidade de fazer previsões para reações futuras.

Generalizabilidade (uma palavra que surge da ideia de generalização) é a capacidade de um modelo de aplicar o que aprendeu com os dados de treinamento para prever dados novos e invisíveis. Esta é uma das coisas que diferencia a AI dos programas de computador determinísticos tradicionais.

Os pesquisadores recomendam que estudos futuros aprofundem a abordagem e desenvolvam um método de conjunto que utilize efetivamente recursos estruturados existentes e conhecimentos prévios recém-surgidos codificados em LLMs.

Apesar dos desafios potenciais, os resultados do estudo destacam o valor da tecnologia de AI na biologia moderna. Desde melhorar a personalização até aumentar a eficiência e aumentar as taxas de sucesso, a AI a cada dia se apresenta como um divisor de águas.

*Traduzido por Gustavo Martins com autorização do Decrypt.