Немного дегтя

Я, пожалуй, немного компенсирую вчерашний отзыв о работе OpenClaw — не то, чтобы ложкой дёгтя, но наблюдениями противоположного характера.

Внутри неплохо спроектированного продукта находятся все те же современные модели со всеми их недостатками. И на них я тоже уже наткнулся.

Например, как не ухищряйся и не придумывай новые прекрасные методы работы с памятью, перешибить собственные знания модели очень сложно. Я и в обычном использовании регулярно страдаю от того, как модель — совершенно все равно какая именно, хоть Opus 4.5, хоть Gemini 3 Pro, — настаивает, что её не существует, а актуальная версия либо Claude Haiku 3.5, либо Gemini Flash 2.0. У меня давно есть дополнение к промпту, где явно сказано, что перед упоминанием любой версии продукта, модели или библиотеки надо проверить фактически актуальную версию — даже в таком виде модель регулярно мне сообщает, что я ошибся и указал не вышедшую еще модель. В OpenClaw я сразу указал, что проверять надо и даже отдельно сказал “Заведи себе файл с версиями, запиши туда актуальные и раз в две недели проверяй” — и все равно в очередном скрипте он вписал google flash 2.0. Причем, когда я послал исправлять — он исправил в конфиге и оставил захардкоженной модель в скрипте. Когда я пнул еще раз — он исправил в скрипте и дописал fallback — до google flash 2.0!

Это, как понятно, я уже нарушил чистоту эксперимента, глазами глядя на каждую редакцию скрипта.

Вообще, модели фантастически плохо знают две вещи — собственный API и собственные возможности. И в очередной задаче это проявилось — сначала OpenClaw написал скрипт, который не учитывал параметры reasoning в запросе к LLM, а потом я понял, что агент решил не ту задачу. Я ставил задачу проверять пачку RSS и присылать мне дайджест, а он написал скрипт, который проверяет RSS и присылает дайджест — но это не agentic решение, с тем же успехом я мог бы написать такой скрипт и без него.

Собственно, с этим я сталкивался и в Claude Code — когда ему говоришь “сделай это скиллом”, он пишет очень правильный промпт, но это не скилл, поскольку он даже не оформлен правильно.

Так что оптимальное использование OpenClaw — очень внимательно его посмотреть, проанализировать и вытащить хорошие наработки в собственные настройки. Именно так я и сделал еще на прошлой неделе. Так что у меня уже какая-то своя версия Claude Code, которой я и работаю.