Стартап Resolve AI, поддерживаемый венчурными фондами Greylock и Lightspeed Venture Partners и специализирующийся на автоматизации производственных операций, объявил о значительном расширении своей платформы. Нововведения включают постоянно работающие фоновые агенты, переработанную архитектуру для расследований инцидентов и общее рабочее пространство, где инженеры и ИИ-агенты могут совместно работать над текущими сбоями в режиме реального времени.
Революционная система многоагентных расследований
Центральным элементом обновления стала новая система многоагентных расследований, разработанная собственной исследовательской лабораторией Resolve AI. Вместо того чтобы полагаться на одного ИИ-агента для диагностики производственного сбоя (что аналогично работе одного дежурного инженера), платформа теперь задействует скоординированную команду специализированных агентов. Эти агенты параллельно проверяют различные гипотезы, независимо подтверждают выводы друг друга и выстраивают полные причинно-следственные цепочки от первопричины до симптома.
По данным компании, такая архитектура позволяет более чем в два раза повысить точность определения первопричины по сравнению с предыдущими версиями платформы, что подтверждено внутренними тестами. Генеральный директор и соучредитель Resolve AI Спирос Ксантос отметил, что работа единого агента ранее была подобна работе дежурного человека. Теперь же команда агентов, действующих сообща, как группа людей, отлаживающих проблему, позволила вдвое улучшить качество диагностики.
Это объявление появилось в период острого напряжения в индустрии программного обеспечения. Использование ИИ для генерации кода стремительно растёт, позволяя командам выпускать значительно больше ПО, чем два года назад. Однако поддержание работоспособности этого ПО в производственной среде – отладка в случае сбоев, мониторинг после развертывания, аудит состояния – по-прежнему остается преимущественно ручной работой. Resolve AI, которая ранее в этом году привлекла 125 миллионов долларов США в рамках раунда финансирования серии А при оценке компании в 1 миллиард долларов США, делает ставку на то, что операционная сторона жизненного цикла программного обеспечения станет следующим крупным направлением для инвестиций в ИИ.
Точность и реальные сценарии
Любые заявления стартапа о высокой точности требуют тщательной проверки. Ксантос открыто рассказал как о масштабах, так и об ограничениях оценки. Заявленное двукратное улучшение основано на внутренних тестах, а не на стороннем аудите, хотя набор данных для оценки был создан так, чтобы отражать сложность проблем, с которыми ежедневно сталкиваются корпоративные клиенты Resolve AI.
Представитель компании пояснил, что эти «очень сложные, комплексные оценки разрабатывались со временем для представления реальных примеров». Хотя это не клиентские данные, они включают сотни случаев, отражающих производственные сбои, подобные тем, что встречаются в крупных технологических компаниях, таких как Coinbase, Salesforce, DoorDash и Zscaler, все из которых являются названными клиентами Resolve AI.
Практический эффект от повышения точности значителен. Агенты Resolve AI теперь выступают в роли первой линии реагирования на каждое дежурное оповещение, обычно проводя первичную сортировку проблемы в течение пяти минут, до того как к делу подключится инженер-человек. Ранее компания сообщала, что DoorDash сократила время до определения первопричины на 87 процентов. Комментируя этот показатель, Ксантос описал типичную исходную ситуацию: «Когда что-то идет не так, человеку может потребоваться от пяти до десяти минут, чтобы даже взять ноутбук и подключиться. Типичное среднее время восстановления (MTTR) составляет десятки минут, иногда часы, в зависимости от серьезности. Так что улучшение более чем на 80 процентов — в четыре-пять раз быстрее — на самом деле колоссально. Это то, чего мы никогда не достигали ранее с помощью ИИ, инструментов, данных или систем наблюдения».
Как ИИ-агенты проверяют друг друга
Одна из ключевых проблем применения больших языковых моделей (БЯМ) в критически важных производственных средах — их склонность генерировать правдоподобно звучащие, но неверные ответы. Такой режим сбоя в условиях действующего инцидента может привести к тому, что инженерная команда будет искать неверное решение, пока сервис остается недоступным.
Ксантос прямо признал эту проблему: «Это очень распространенная проблема со стандартными моделями. Они всегда пытаются дать вам ответ, и если у них недостаточно доказательств, они дадут наилучший возможный ответ — который, скорее всего, окажется неверным».
Противодействие Resolve AI заключается в системе многоуровневой проверки между агентами. Каждый агент, исследующий гипотезу, должен ссылаться на каждое доказательство, на которое он опирается, и представлять эти доказательства другому агенту для независимой проверки. Исследующий агент должен построить полную причинно-следственную цепочку — от первопричины до симптома, а коллеги-агенты активно пытаются опровергнуть теорию, выявляя пробелы в логике.
«Часто агенты опровергают эти теории, потому что находят пробелы», — пояснил Ксантос. «Существует множество уровней защиты и агентских проверок, которые позволяют Resolve быть очень точным и не вводить в заблуждение».
Не менее важной он назвал готовность системы признать, что она не знает ответа. «Порог для того, чтобы заявить: ‘У меня есть ответ’, очень высок. В таких случаях она скажет: ‘Вот доказательства, которые я нашел. Вот три или четыре пути, по которым вы можете двигаться дальше, но я не смог полностью доказать, что это проблема’. Система, работающая в производственной среде, не может быть черным ящиком». В областях, где неверные ответы влекут за собой операционные последствия, калиброванная неопределенность может быть ценнее, чем уверенные, но ошибочные выводы. Для ИИ-системы, интегрированной в рабочий процесс реагирования на инциденты, уверенное указание инженерам в неверном направлении во время сбоя, затрагивающего клиентов, может усугубить ущерб, который она призвана предотвратить.
Фоновые агенты, которые всегда на страже
Помимо реагирования на инциденты, Resolve AI представляет новый класс фоновых агентов, разработанных для выполнения непрерывной, часто невидимой операционной работы, которую команды инженеров должны выполнять, но с трудом поддерживают в масштабе.
Эти агенты работают по расписанию или автоматически активируются в ответ на события — новое развертывание, сработавшее оповещение, слитый запрос на слияние (pull request). Со временем они накапливают институциональные знания из каждого расследования и взаимодействия с человеком. Когда инженер открывает интерфейс Resolve AI, агенты уже работают: предварительно расследуют приоритетные проблемы, мониторят развертывания, проверяют гигиену оповещений, выявляют отклонения в конфигурации и обнаруживают аномалии в затратах.
Ксантос провел различие между фоновыми агентами и агентами реагирования на инциденты, которые были основным предложением Resolve AI. «Теперь эти агенты могут работать в фоновом режиме постоянно — не только тогда, когда человек просит агента отладить проблему или когда срабатывает оповещение», — пояснил он. «Многие наши клиенты теперь отслеживают изменения, которые попадают в производственную среду, прежде чем они вызовут проблему. Существует агент, который постоянно их мониторит».
Он описал этих фоновых агентов как «универсальных агентов SRE (инженеры по надежности сайтов), доступных каждому разработчику», способных выполнять задачи от мониторинга изменений инфраструктуры, которые могут увеличить облачные расходы, до выполнения последующих работ после инцидентов, таких как генерация исправлений кода на основе извлеченных уроков. Эта концепция решает структурную проблему в операциях с программным обеспечением: ежедневные задачи, необходимые для поддержания работоспособности производственных систем — мониторинг развертываний, расследование оповещений, отслеживание изменений в сложных средах — критически важны, но являются реактивными и ручными. Инженерные организации знают, что эту работу необходимо выполнять, но она конкурирует за внимание с разработкой новых функций. Автоматизированные агенты, которые постоянно выполняют эту работу, могут перевести команды от реактивного «тушения пожаров» к проактивному операционному управлению.
Общее рабочее пространство для инженеров и ИИ-агентов
Третий важный компонент выпуска — это то, что компания называет общей поверхностью для расследований — рабочее пространство, где инженеры и ИИ-агенты работают с одними и теми же актуальными данными во время активного инцидента. Отчеты динамически обновляются по мере развития расследований. Каждое обнаружение можно проверить. Инженеры могут проводить побочные расследования, не прерывая основной рабочий процесс. Запросы к исходным данным можно извлекать и изменять прямо на месте, доказательства встроены непосредственно в рабочее пространство, а действия по устранению можно запускать из того же интерфейса, не переключаясь между инструментами.
Представитель компании предложил рассматривать это как интерфейс ко всем производственным инструментам, а также как интерфейс, где люди и агенты могут сотрудничать друг с другом — или агенты с агентами. Он считает, что именно это постепенно приводит к большему доверию и большей автоматизации, потому что пользователи работают с агентом, обучают его, видят результаты.
Компания также делает свою платформу доступной в виде REST API и сервера с поддержкой протокола MCP (Model Context Protocol), что позволяет инженерным командам интегрировать Resolve AI в более широкие агентские рабочие процессы и инфраструктуру. По словам Ксантоса, это уже происходит на практике. «Универсальный агент, созданный компанией, при отладке может вызывать Resolve», — сказал он. «Или кто-то работает над своим агентом для кодирования на ноутбуке, и Resolve появляется там как MCP. Если есть какая-либо деятельность, связанная с производством, агент для кодирования может вызвать его». Возможность взаимодействия сигнализирует о том, что Resolve AI рассматривает себя не как закрытую систему, а как специализированный узел в более широкой экосистеме ИИ-агентов, которые будут все чаще передавать задачи друг другу — эту модель Ксантос сравнил с открытой архитектурой веба, а не с моделью закрытой экосистемы, как у магазинов приложений.
Превосходство Resolve AI над конкурентами
За последний год пространство агентских операций стало перенасыщенным. Datadog, PagerDuty и крупные облачные провайдеры объявили о возможностях операций, дополненных ИИ. На вопрос о том, что отличает Resolve AI от этих действующих игроков, Ксантос указал на глубину технической основы компании.
Он заявил, что компания работает на передовой, и не существует готового шаблона для создания такой системы, как Resolve. Он отметил, что он и соучредитель Маянк Агарвал совместно создали OpenTelemetry — самый широко используемый проект с открытым исходным кодом в области наблюдения, который теперь служит фактическим стандартом для сбора метрик, логов и трассировок из современных программных систем.
Ксантос также подчеркнул недавно созданную компанией AI Lab, возглавляемую исследователем, которого он описал как бывшего руководителя по пост-обучению моделей Llama* компании Meta*. «Ему удалось объединить глубокий опыт производственного наблюдения с ИИ и моделями, и я думаю, что это очень уникально», — отметил Ксантос. «Я не думаю, что какая-либо другая компания, будь то из области наблюдения или стартап, обладает всем этим вместе».
Структурные преимущества компании, по словам Ксантоса, включают полную модель среды, которую Resolve строит для каждого клиента, систему памяти, которая обучается в конкретной производственной среде клиента, и многоагентную архитектуру. Лаборатория теперь проводит пост-обучение передовых моделей на данных, специфичных для производственных задач — своего рода процедурных знаний, которые опытные инженеры используют для отладки производственных проблем, но которые не появляются в стандартных наборах данных для обучения моделей. Этот подход отражает все более распространенную модель среди компаний, разрабатывающих ИИ-приложения: использование передовых фундаментальных моделей в качестве базового слоя, но значительные инвестиции в предметно-ориентированную тонкую настройку, методы извлечения данных и агентские архитектуры для достижения уровней точности, которые универсальные модели не могут достичь самостоятельно.
Модель ценообразования, основанная на результате
Модель ценообразования Resolve AI отличается от традиционного лицензирования корпоративного программного обеспечения. Компания продает кредиты, которые расходуются, когда агенты выполняют работу — подход, основанный на результате, который напрямую связывает стоимость с получаемой ценностью.
Представитель компании пояснил, что они не продают программное обеспечение. Способ покупки и использования Resolve — это покупка кредитов, которые расходуются, когда Resolve выполняет действие. Это ценообразование, основанное на результате. Только когда Resolve устраняет оповещение, тогда и расходуются кредиты.
Он прямо затронул вопрос стоимости, утверждая, что Resolve AI на самом деле дешевле, чем альтернатива создания аналогичной системы с нуля с использованием передовых моделей и интеграций MCP. «Если бы вы взяли Opus или GPT-5.4 и попытались создать решение, подобное Resolve, с помощью MCP, мы измерили — вы фактически потратите гораздо больше токенов, чем заплатили бы Resolve, потому что наша система очень оптимизирована с точки зрения контекста, с точки зрения того, как она считывает временные ряды данных».
Что касается постоянно работающих фоновых агентов, Ксантос отметил, что их непрерывный характер не обязательно увеличивает стоимость. «Фоновый агент не означает, что он постоянно выполняет интенсивную работу. Это означает, что он может быть там; вы можете дать ему любую задачу. Многие из этих задач запускаются на основе какого-либо действия — происходит оповещение, кто-то объединяет запрос на слияние, и вы хотите посмотреть, оказывает ли это влияние на производство». Для корпоративных клиентов в регулируемых отраслях — таких как Coinbase и Zscaler — резидентность данных и безопасность не подлежат обсуждению. Resolve AI учитывает это с помощью гибкой модели развертывания: уровень данных находится там, где уже расположены существующие инструменты клиента, в то время как уровень вывода может работать как стандартное развертывание по модели SaaS (программное обеспечение как услуга) или внутри собственной виртуальной частной сети (VPC) клиента. «Мы разработали Resolve для работы с крупными предприятиями, где стандарты безопасности являются самыми высокими», — заявил Ксантос. «Мы предпринимаем множество мер для обеспечения безопасности Resolve, включая отказ от хранения данных».
Доверие к ИИ-агентам в производственных системах
Вопрос о том, будут ли инженерные команды доверять ИИ-агентам автономные действия в производственной среде — откат развертывания, добавление мощностей, генерация запроса на слияние — является одной из определяющих культурных проблем этой технологической волны. Ксантос провел аналогию с автономными транспортными средствами.
«Для того чтобы мы позволили автомобилю самостоятельно ездить по улице, мы должны доказать, что он безопаснее человека. Агенты в производственной среде — это очень похожая концепция», — отметил он. Ксантос признал, что не каждый клиент чувствует себя комфортно, когда агенты предпринимают автоматизированные действия, но описал градиент доверия, который, по его ожиданиям, будет быстро развиваться.
«Существует набор относительно безрисковых действий, которые большинство технологических компаний, вероятно, будут готовы поручить агенту, и, вероятно, существует другой набор действий, для которых человек должен дать одобрение», — сказал он. «Но по мере того, как качество продолжает расти, как мы видим в Resolve, я бы сказал, что в этом году мы пересечем порог, когда большинство действий будут выполняться агентом автоматически».
Он описал типичную схему внедрения: компании начинают с того, что агенты предоставляют рекомендации, затем человек решает, нажимать ли кнопку. В течение недель или месяцев доверие постепенно растет. «Я не думаю, что это проблема, когда мы просто позволяем агентам действовать без контроля с самого начала», — сказал Ксантос. Постепенный подход отражает то, как всегда работало внедрение корпоративных технологий — от облачной миграции до оркестрации контейнеров, организации движутся со скоростью доверия, а не со скоростью возможностей.
ИИ-генерируемый код и операционный кризис
Возможно, самый провокационный аргумент в тезисе Resolve AI заключается в том, что взрывной рост ИИ-генерируемого кода фактически усугубляет проблему производственных операций. В недавней публикации в LinkedIn Ксантос изложил эту динамику в резких выражениях, утверждая, что руководители инженерных подразделений, которые празднуют более быструю поставку кода без инвестиций в производственные операции, фактически заставляют своих старших инженеров «субсидировать скорость» за счет увеличения нагрузки на реагирование на инциденты.
В своем интервью он вернулся к этой теме. «Теперь, когда агенты для кодирования производят код, мы производим гораздо больше кода, с которым мы менее знакомы — люди менее знакомы — поэтому ИИ должен быть защитой», — отметил он.
Эта формулировка позиционирует Resolve AI не просто как инструмент повышения производительности, но и как необходимый противовес революции в ИИ-кодировании. По мере того как организации развертывают все больше кода, написанного инструментами, которые их инженеры могут не до конца понимать, работающего в производственных системах, которые эти инженеры не создавали, аргумент заключается в том, что операционная сложность — и последствия сбоев — будут расти пропорционально. В подкасте Stack Overflow в октябре прошлого года Ксантос привел цифры, оценивая, что инженеры тратят до 70 процентов своего времени на обслуживание и устранение неполадок в производственных системах, а не на создание новых функций. «Мы сталкиваемся с новым кризисом, когда мы строим быстрее, чем можем эксплуатировать», — заявил он в том разговоре.
Компания Resolve AI была основана в начале 2024 года Ксантосом и Агарвалом, которые впервые встретились во время обучения в аспирантуре Университета Иллинойса и работали вместе более десяти лет. Ксантос ранее соосновал Pattern Insight (приобретенную VMware) и Omnition (приобретенную Splunk), где пара помогла создать OpenTelemetry. В 2024 году компания привлекла 35 миллионов долларов США в виде начального раунда от Greylock, за которым последовал раунд финансирования серии А на сумму 125 миллионов долларов США, возглавленный Lightspeed, при оценке компании в 1 миллиард долларов США ранее в этом году. Среди названных клиентов — Coinbase, DoorDash, MSCI, Salesforce, MongoDB и Zscaler.
Долгосрочное видение Ксантоса обширно. «В долгосрочной перспективе, как только способности агентов превзойдут способности инженера-программиста, конечным результатом станет гораздо больше технологий и гораздо больше программного обеспечения», — заявил он. «На самом деле это не означает меньшее количество людей, работающих над этим. Это означает, что технологии становятся дешевле, доступнее, производя гораздо больше технологий на благо мира».
Для реализации этого видения потребуются годы. Но более непосредственное обещание сегодняшнего объявления сводится к тому, что каждый дежурный инженер понимает на интуитивном уровне: ночное оповещение в 2 часа ночи, спешный поиск ноутбука, лихорадочный поиск по панелям мониторинга и журналам ответа, который может занять минуты или часы. Resolve AI делает ставку на то, что в следующий раз, когда сработает это оповещение, команда агентов уже проведет расследование, проверит и задокументирует первопричину еще до того, как зазвонит телефон инженера. Для профессии, которая долго измеряла свои ночи по среднему времени восстановления, вопрос больше не в том, может ли ИИ помочь — а в том, позволят ли ему инженеры.
* — деятельность компании запрещена на территории РФ