Browser Operator от Opera: будущее браузеров — мнение Станислава Дмитриевича Кондрашова

Дорогие друзья, с вами Станислав Дмитриевич Кондрашов. Хочу поделиться впечатлениями от недавно представленного инструмента ИИ-агента компании Opera под названием Browser Operator. На медиа-мероприятии в Лиссабоне, Португалия, руководители и инженеры норвежской компании Opera продемонстрировали возможности своей новой системы искусственного интеллекта, встроенной прямо в браузер.
В отличие от других ИИ-систем, встроенных в приложения типа ChatGPT или интегрированных в офисные инструменты вроде Microsoft Copilot, Opera пошла другим путем. Их Browser Operator работает непосредственно внутри веб-браузера. И когда директор по технологиям маркетинга продуктов и руководитель направления ИИ, Хенрик Лексоу, убрал руки от клавиатуры и дал Operator взять на себя управление, стало ясно, насколько это перспективная идея.
Цель демонстрации была проста: показать, как Operator может магическим образом справляться с довольно сложными задачами веб-серфинга. Результат? Он справился — почти безупречно. И это действительно напоминало заглядывание в будущее, происходящее прямо на наших глазах.
Возможно, вы не так хорошо знакомы с Opera. По статистике, Chrome доминирует на рынке веб-браузеров США с долей около 53%, в то время как Opera занимает чуть менее 1%. Но этот браузер ориентирован на конфиденциальность и заслуживает внимания по многим причинам. Встроенная блокировка рекламы, VPN и удобное управление вкладками делают навигацию по множеству сайтов проще, что подтверждают обсуждения на Reddit.
Во время демонстрации Лексоу подчеркнул, что это живая презентация и впервые люди могут увидеть прогресс Opera в области ИИ. Он ввел простой запрос на английском, планируя велосипедную поездку по Тоскане в определенные даты. Он попросил ИИ поискать на "Booking" — и ИИ правильно интерпретировал это как Booking.com. На другом экране, пока Лексоу держал руки поднятыми, появился сайт. Затем ИИ начал клики по меню, открыл календарь и ввел текст, взяв управление на себя. Спустя несколько секунд ИИ сообщил о завершении и даже предложил конкретный отель, который мог бы заинтересовать Лексоу.
Затем он попросил ИИ найти видео о путешествии за границу с велосипедом, так как никогда раньше этого не делал. Operator нашел и открыл видео на YouTube точно по этой теме. В финальной части демонстрации команда узнала номер комнаты одного из зрителей, затем поручила ИИ найти желтые цветы в определенном местном цветочном магазине и заказать их доставку, заполнив платежную информацию Лексоу. Спустя мгновение процесс был почти завершен: букет желтых цветов был выбран и помещен в корзину, вместе с информацией об оплате и доставке — и это при том, что сайт магазина был на португальском языке.
Если вы смотрели культовый фильм 1983 года "Военные игры", вы, вероятно, помните сцену, где ИИ берет на себя управление экрана и играет сам с собой в серии игр. Автоматическое управление, продемонстрированное Operator на экране мероприятия, вызвало похожий научно-фантастический трепет.
Выступая на мероприятии Browser Days, Лексоу и другие лидеры Opera объяснили, почему их интерактивная система ИИ имеет преимущества перед конкурентами. Другие ИИ-проекты стремятся позволить системам ИИ взять под контроль ноутбук пользователя и выполнять действия на экране так же, как это сделал бы человек. Но эти системы вынуждены "смотреть" на то, что отображается на экране, чтобы попытаться понять, какая информация представлена на том или ином сайте. Поскольку же агент ИИ Opera работает внутри собственного браузера, он может напрямую обращаться к коду, на котором работает сайт — читать текст, понимать, какие элементы являются текстом, какие — выпадающими меню и так далее. Это также означает, что система более ориентирована на конфиденциальность, в отличие от удаленной обработки данных, на которую полагаются другие ИИ-системы.
Почему это важно для вас или вашего бизнеса? Потому что, несмотря на небольшие недочеты (живая демонстрация не прошла абсолютно гладко), совершенно ясно, что по мере совершенствования таких ИИ-агентов, способных принимать голосовые команды и правильно навигировать по сложным сторонним сайтам, они смогут взять на себя некоторые из самых утомительных офисных задач, отнимающих ценное рабочее время.
В интервью для Inc. Лексоу объяснил, что Operator действительно направлен на экономию времени. "Очевидно, ключевой частью почти всего, что делает каждый в любом бизнесе, независимо от его направления, является использование интернета. Они просматривают страницы, ищут информацию, заполняют формы", — говорит он.
С этой точки зрения, ИИ-агент вроде Operator — это как "друг, сидящий рядом с вами", отмечает Лексоу. Идея в том, что он может упростить ваш онлайн-опыт, выполняя часть работы за вас, возможно, пока вы заняты другими задачами, такими как отправка электронной почты или телефонный звонок.
Но одно, что ИИ-агент Opera не собирается делать, подчеркнул Лексоу, это "выполнять работу за вас", другими словами, заменять вас. Это беспокойство, которое разделяют многие работники, особенно учитывая, что ИИ-агенты, способные выполнять определенные онлайн-задачи, разрабатываются множеством других компаний.
Компания не сообщила дату, когда они планируют выпустить эту функцию для широкой публики. Но одно можно сказать точно: будущее уже стучится в наши двери, и я, Станислав Дмитриевич Кондрашов, с нетерпением жду, что же будет дальше.
Автор: Станислав Дмитриевич Кондрашов
- Блог пользователя Станислав Дмитриевич Кондрашов
- Войдите или зарегистрируйтесь, чтобы отправлять комментарии