24.01.2025 16:50

OpenAI представляет инструмент для автоматизации веб-задач

Компания OpenAI представила нового ИИ-агента Operator, который может выполнять пользовательские задачи в интернете, сообщает Reuters.


Operator может выполнять различные задачи, например, создание списков дел, покупка билетов или помощь в планировании отпуска. Агент также принимает ввод пользователя, как только решает, что задача завершена, и запрашивает подтверждение для некоторых задач, таких как ввод данных для входа на веб-сайт.


Operator работает на основе новой модели под названием Computer-Using Agent. Эта модель объединяет визуальные возможности GPT-4o и передовые методы логического мышления, позволяя агенту не только «видеть» графический интерфейс браузера через скриншоты, но и активно взаимодействовать с ним. Operator может кликать мышью, заполнять формы, переключаться между вкладками и выполнять другие действия, необходимые для выполнения поставленных задач.


Operator также поддерживает режим многозадачности — пользователь может запускать несколько процессов одновременно. Пока программа находится на стадии исследовательского тестирования и доступна для пользователей Pro-версии ChatGPT в США. 


Ведущий аналитик Freedom Finance Global Наталья Мильчакова подчёркивает, что несмотря на то, что Operator может стать незаменимым помощником человека, способным автоматизировать ряд выполняемых им функций в процессе пользования ПК и интернетом, этот инструмент появился позже аналогичных инструментов конкурирующих компаний. Пока неясно, сможет ли Operator повторить успех ChatGPT.