A Microsoft anunciou hoje uma ferramenta de inteligência artificial que superou um painel de médicos para diagnosticar casos complicados.
O Microsoft AI Diagnostic Orchestrator (MAI-DXO) enfrentou 21 médicos experientes dos EUA e do Reino Unido, apresentados com casos complexos documentados no New England Journal of Medicine. Mai-DXO deu um diagnóstico correto para 85,5% dos casos de teste, enquanto os médicos atingem a marca 20% do tempo.
A ferramenta ainda não está disponível para uso clínico.
“Estamos dando um grande passo em direção à superinteligência médica”, disse Mustafa Suleyman, CEO da Microsoft AI, no LinkedIn Post.
A Microsoft usou a ferramenta com modelos de IA bem conhecidos, incluindo GPT, Llama, Claude, Gêmeos, Grok e Deepseek. A melhor configuração foi o Mai-Dxo emparelhado com o Open O3.
Como um médico humano, o MAI-DXO diagnostica analisando sintomas, colocando perguntas e recomendando exames médicos. Um recurso essencial é sua capacidade de otimizar os custos, impedindo a ordem de diagnósticos supérfluos que contribuem para gastar excessivamente nos cuidados de saúde.
Enquanto o Mai-DXO superou os prestadores médicos, a empresa de tecnologia reconheceu que, em condições normais, os médicos não estariam operando isoladamente e poderiam consultar colegas e recursos on-line e impressos.
A nova referência de desempenho de diagnóstico foi criada a partir de 304 casos recentes documentados pelo New England Journal of Medicine.
A ferramenta se baseia nos testes anteriores do desempenho da IA em medicina, que questionaram os bots no teste padronizado do US Medical Licensing Examination (USMLE). A Microsoft disse que as ferramentas de IA evoluíram para obter pontuações quase perfeitas no teste, mas sua estrutura de múltipla escolha favorece “a memorização sobre o entendimento profundo”.
A nova referência usando casos complicados requer habilidades de ordem superior para realizar “diagnóstico seqüencial, uma pedra angular da tomada de decisão médica do mundo real”, de acordo com a postagem do blog da Microsoft.
As próximas etapas para o desenvolvimento da ferramenta para uso público incluem testar suas habilidades contra doenças mais comuns. Antes de poder ser implantado nas práticas de saúde, seria necessário testar em um ambiente clínico de segurança e desempenho e aprovação dos reguladores.
Como tem com outros aplicativos de IA, a Microsoft enfatizou que os bots não pretendem substituir as pessoas, mas otimizar sua saída, neste caso automatizando tarefas de rotina, auxiliando no diagnóstico e criando estratégias de cuidados personalizados.