A OpenAI está próxima de lançar o Operator, uma ferramenta de inteligência artificial que pode controlar computadores e executar tarefas automaticamente em nome dos usuários. A Ferramenta é amplamente especulada como um sistema capaz de realizar ações complexas, como escrever códigos e reservar viagens, de forma autônoma.
De acordo com Tibor Blaho, engenheiro de software reconhecido por vazar informações precisas sobre produtos de IA, evidências sobre o Operator foram encontradas recentemente. Publicações como a Bloomberg já haviam mencionado o desenvolvimento dessa ferramenta, que é descrita como um sistema “agente”, com potencial para revolucionar a interação homem-máquina. Segundo o site The Information, o lançamento está sendo planejado para janeiro de 2025.
Evidências Recentes e Desempenho
Blaho identificou opções ocultas no cliente do ChatGPT para macOS que sugerem funções como “Alternar Operator” e “Forçar Encerramento do Operator”. Além disso, referências ao Operator foram encontradas no site da OpenAI, embora ainda não estejam visíveis ao público. Há também tabelas comparando o desempenho do Operator com outros sistemas similares, indicando que o modelo, embora promissor, ainda apresenta limitações dependendo da tarefa.
Confirmed – the ChatGPT macOS desktop app has hidden options to define shortcuts for the desktop launcher to "Toggle Operator" and "Force Quit Operator" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS
— Tibor Blaho (@btibor91) January 19, 2025
Nos benchmarks vazados, o “OpenAI Computer Use Agent (CUA)”, possível base do Operator, obteve 38,1% no teste OSWorld — um ambiente simulado que replica o uso de um computador real. Apesar de superar o modelo da Anthropic, o desempenho ficou aquém dos 72,4% alcançados por humanos. Por outro lado, o CUA mostrou resultados superiores aos humanos no teste WebVoyager, que avalia a navegação e interação com websites, mas ficou atrás no benchmark WebArena, também baseado em tarefas na web.
Outro ponto destacado nos vazamentos é a dificuldade do Operator em executar tarefas específicas. Em um teste para criar uma máquina virtual em um provedor de nuvem, a ferramenta teve uma taxa de sucesso de apenas 60%. Para criar uma carteira de Bitcoin, a taxa de sucesso foi ainda menor: apenas 10%.
OpenAI website already has references to Operator/OpenAI CUA (Computer Use Agent) – "Operator System Card Table", "Operator Research Eval Table" and "Operator Refusal Rate Table"
Including comparison to Claude 3.5 Sonnet Computer use, Google Mariner, etc.
(preview of tables… pic.twitter.com/OOBgC3ddkU
— Tibor Blaho (@btibor91) January 20, 2025
Concorrência e Riscos no Mercado de Agentes de IA
O lançamento do Operator ocorre em um momento em que concorrentes como Google, Anthropic e outros estão investindo em tecnologias semelhantes, com o mercado de agentes de IA projetado para atingir US$ 47,1 bilhões até 2030, segundo a Markets and Markets. Apesar de seu potencial, os agentes de IA ainda estão em estágio inicial e enfrentam desafios de segurança e eficiência.
Um dos gráficos vazados mostra que o Operator teve bom desempenho em testes de segurança, como evitar realizar atividades ilícitas e buscar dados pessoais sensíveis. No entanto, a OpenAI parece estar adotando uma abordagem cautelosa em relação ao desenvolvimento da ferramenta, devido à sua complexidade e aos possíveis riscos associados.
A questão da segurança também gerou debates no setor. Em uma publicação recente, Wojciech Zaremba, cofundador da OpenAI, criticou a Anthropic por lançar um agente sem mitigações adequadas de segurança. Segundo Zaremba, se a OpenAI fizesse um lançamento similar, enfrentaria críticas ainda mais severas.
Embora a OpenAI já tenha sido alvo de críticas por priorizar o lançamento de produtos em detrimento de trabalhos de segurança, o desenvolvimento prolongado do Operator parece refletir um esforço maior em mitigar riscos antes de sua liberação.
O Futuro dos Agentes de IA
A entrada da OpenAI no segmento de agentes inteligentes marca um passo significativo na evolução da IA. Embora ainda sejam considerados primitivos, esses sistemas têm o potencial de transformar a forma como humanos interagem com tecnologia. No entanto, a segurança e a confiabilidade continuam sendo os principais desafios. Com o Operator, a OpenAI busca equilibrar inovação e responsabilidade, respondendo às expectativas do mercado e às preocupações da comunidade científica.
Resta aguardar o lançamento oficial para avaliar como o Operator poderá impactar o mercado de tecnologia e a vida dos usuários.