GPT-Rosalind: a nova IA da OpenAI para fluxos de trabalho científicos na biologia
A OpenAI anunciou o lançamento da GPT-Rosalind, um novo modelo de inteligência artificial criado especificamente para tarefas em biologia, desenvolvimento de medicamentos e medicina translacional. O modelo foi optimizado para fluxos de trabalho científicos e combina uma utilização de ferramentas mais robusta com uma compreensão mais profunda de química, engenharia de proteínas e genómica.
Hoje, o desenvolvimento de um novo medicamento nos Estados Unidos demora, em média, entre 10 e 15 anos - desde a procura de uma meta biológica até à aprovação pelas entidades reguladoras. E são precisamente as fases iniciais da investigação que mais influenciam o sucesso final: a escolha correcta da alvo, a formulação de hipóteses e a qualidade dos ensaios determinam a eficácia de toda a cadeia de desenvolvimento.
Uma das principais limitações nas ciências da vida continua a ser não apenas a complexidade da própria biologia, mas também a fragmentação dos processos de investigação. Os cientistas têm de trabalhar com enormes volumes de literatura, bases de dados especializadas, resultados experimentais e hipóteses em constante mudança. Estes processos exigem muito trabalho, escalam mal e consomem recursos significativos.
Na OpenAI, acredita-se que sistemas avançados de IA podem acelerar estes processos - não só através da automatização, mas também pela capacidade de identificar ligações pouco evidentes, explorar mais hipóteses e chegar mais depressa a conclusões fundamentadas. A GPT-Rosalind foi concebida para apoiar tarefas como a síntese de dados científicos, a geração de hipóteses, o planeamento de experiências e a execução de cenários de investigação em عدة etapas.
O modelo já está disponível em pré-visualização de investigação no ChatGPT, no Codex e através da API para um grupo limitado de clientes no âmbito do programa de acesso de confiança. Foi também apresentado um plug-in especial Life Sciences para o Codex, que dá acesso a mais de 50 ferramentas científicas e fontes de dados.
Entre os parceiros que trabalham com o modelo estão uma das maiores empresas independentes de biotecnologia dos Estados Unidos, a Amgen; a Moderna, empresa de biotecnologia pioneira no desenvolvimento de medicamentos e vacinas com base em RNA mensageiro (mRNA); o Allen Institute - organização de investigação científica independente e sem fins lucrativos, especializada em investigação biológica e inteligência artificial; e a Thermo Fisher Scientific, um grupo multinacional e fornecedor líder mundial de equipamento científico, reagentes, consumíveis, software e serviços para diagnóstico, investigação laboratorial, biologia e indústria. Estas entidades estão a utilizar a GPT-Rosalind para acelerar a investigação e o desenvolvimento de novas soluções em biologia e medicina.
O nome do modelo remete para Rosalind Franklin - a cientista cujas investigações tiveram um papel decisivo na descoberta da estrutura do ADN e lançaram as bases da biologia molecular moderna.
Segundo a OpenAI, a GPT-Rosalind demonstra elevada eficácia em tarefas que exigem raciocínio científico complexo - desde a análise de reacções químicas até à interpretação de sequências genéticas e interacções entre proteínas. O modelo também lida melhor com a utilização de ferramentas científicas especializadas em tarefas multi-etapa, incluindo análise de literatura, interpretação de dados e planeamento experimental.
Nos testes realizados em benchmarks públicos, o modelo apresentou resultados líderes. No BixBench, orientado para tarefas reais de bioinformática e análise de dados, a GPT-Rosalind alcançou os melhores resultados entre os modelos com resultados publicados. No LABBench2, que avalia a execução de tarefas de investigação, o modelo superou o GPT-5.4 em 6 de 11 categorias, incluindo o desenho de protocolos moleculares.
Além disso, o modelo foi testado em conjunto com a Dyno Therapeutics numa tarefa de previsão e geração de sequências de RNA. Nesse ensaio, os melhores resultados do modelo ultrapassaram o desempenho de 95% dos especialistas nas tarefas de previsão e atingiram cerca do 84.º percentil nas tarefas de geração.
O plug-in Life Sciences para o Codex funciona como uma camada de orquestração para tarefas científicas, ajudando a trabalhar com genética, estrutura de proteínas, bioquímica e dados clínicos. Reúne o acesso a dezenas de bases de dados e ferramentas, permitindo resolver de forma mais eficiente questões de investigação complexas.
O lançamento do modelo é acompanhado por medidas de segurança reforçadas. O acesso à GPT-Rosalind é concedido apenas a organizações que cumpram os requisitos relativos à actividade científica, gestão de riscos e controlo de utilização. A OpenAI sublinha que o objectivo é promover o avanço da ciência minimizando os riscos potenciais.
A empresa vê a GPT-Rosalind como o primeiro passo de uma estratégia de longo prazo para criar sistemas de IA especializados para a ciência. No futuro, planeia alargar as capacidades do modelo, sobretudo em tarefas com cadeias de investigação longas e complexas, e aprofundar a colaboração com organizações científicas, incluindo laboratórios nacionais.
Na OpenAI, espera-se que, com o tempo, estes sistemas se tornem ferramentas completas para descobertas científicas - ajudando a acelerar a passagem de hipóteses para provas e de resultados de investigação para a criação de novos tratamentos.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário