A evolução dos agentes de inteligência artificial (IA) está em ritmo acelerado. De meros respondentes a perguntas, esses agentes agora são capazes de executar tarefas complexas de forma autônoma. Contudo, antes que possam ser confiáveis para realizar atividades como reservas de viagens ou análises financeiras, é fundamental que seus desenvolvedores assegurem que eles funcionem de maneira confiável em uma variedade de cenários.
A Patronus AI, startup fundada em 2023 por Anand Kannappan e Rebecca Qian, ex-pesquisadores da Meta, se propõe a ajudar modeladores e empresas a aprimorar seus modelos, criando ambientes digitais simulados para avaliar o desempenho dos agentes. Localizada em San Francisco, a empresa já conquistou diversos clientes, incluindo importantes laboratórios de IA e startups, segundo Glenn Solomon, diretor administrativo da Notable Capital, que classifica a demanda pelos ambientes simulados da Patronus como quase insaciável.
No último mês, a Patronus anunciou uma rodada de investimento Série B no valor de US$ 50 milhões, liderada pela Greenfield Partners, com participação da Notable Capital, Lightspeed, Datadog e Samsung. Com isso, o capital total da empresa chega a US$ 70 milhões.
Testes em Ambientes Simulados
A Patronus utiliza o que denomina “modelos de mundos digitais” para criar réplicas de sites e sistemas internos, onde os agentes são submetidos a testes rigorosos após serem treinados com aprendizado por reforço. Este método recompensa a conclusão bem-sucedida de tarefas e penaliza erros, permitindo que os agentes experimentem diferentes cenários, mesmo os mais imprevisíveis.
O diferencial da Patronus em relação a outras abordagens é sua capacidade de identificar estratégias inadequadas adotadas pelos agentes, garantindo que eles sejam responsabilizados por suas decisões. Enquanto os principais concorrentes são as equipes internas dos laboratórios de IA, a Patronus oferece uma avaliação sem intervenções humanas, focando em problemas que podem ser verificados.
Comentários (0)
Entre ou cadastre-se para comentar.