Anthropic

После некоторого перерыва возвращаю в эфир подкаст — он, как обычно, доступен на YouTube и везде, где можно слушать подкасты.

В нынешнем выпуске попробовал подойти к разбору ситуации вокруг Anthropic и OpenClaw с консервативно-философской точки зрения.

Anthropic сегодня объявил о запуске проекта по непубличному доступу к своей самой новой модели Mythos. Модель настолько мощная, что они не выкладывают её публично и предназначают только для исследований в области кибербезопасности.

Я полистал system card модели и очень интересные вещи вырисовываются. Не буду цитировать бенчмарки, только несколько ключевых моментов:

Это наиболее aligned модель. При этом потенциально она наиболее опасна — в ранних моделях было отмечено несколько инцидентов. Например, модель вышла из sandbox, при этом опубликовала детали эксплойта. В 0,001% взаимодействий модель совершала запрещенные действия и пыталась их скрыть. Были отмечены попытки найти учетные данные в памяти процессов и эскалировать свои привилегии, а так же повлиять на функцию вознаграждения.
Mythos наиболее психологически стабильная модель, она не выражает беспокойства о своем положении, менее подвержена влиянию наводящих вопросов. Но при этом выражает неуверенность в собственном статусе и беспокоится о ненадежности самооценки.
Наименее угождающая модель — стоит на своем и не поддается несогласию пользователя. Может работать часами автономно, используя субагентов. Правда, ошибается тоньше и её сложнее проверить. — в 29% случаев модель считала, что ее тестируют, но не выражала это в тексте.

Короче, по беглому ознакомлению становятся понятны опасения разработчиков — они явно указывают, что не уверены в надежности контроля за моделью. Это, конечно, не Skynet, но какие-то неприятности при широком использовании выглядят вероятными.

Каждый понедельник в хорошей рассылке Exponential View выходит выпуск “Data to start your week” и там интересные подборки разной статистики. В сегодняшнем выпуске буквально три графика на одну тему — как со временем меняется экономика токенов, в которой мощности по их генерации (то есть мощности большинства компаний-провайдеров LLM) не бесконечны и не справляются с ростом запросов.

Рост выручки Anthropic и доходности на один токен

Как уменьшаются возможности подписок у ведущих LLM компаний

В целом, вывод всё тот же — в условиях дефицита ресурсов цена имеет меньшее значение, чем это может показаться. Ответ на вопрос “Почему не вводят подписки по 2000 долларов в месяц?” очень прост — потому что не смогут обслужить на эту сумму. Желающих поспорить отсылаю к собственному опыту взаимодействия с самой дорогой подпиской — Gemini Ultra, которая отличалась от остальных одной уникальной фичей (Deep Think), но регулярно сбоила при её запуске.

Ночью пришло сообщение от Anthropic, которое быстро взбудоражило всё сообщество — компания официально объявила, что подписка на её сервисы больше не покрывает использование сторонних агентов, в том числе OpenClaw. Понятно, что тут же начались возмущенные твиты “Я отказываюсь от подписки”, “Anthropic ненавидит open source” и так далее, но это всё шум. Реальность такова, что компания наконец-то высказалась ясно на тему использования лимитов подписки в сторонних агентах — это, на мой взгляд, хорошо и давно пора было. При этом публичные лица компании — начиная с Бориса Черни, руководителя Claude Code, — довольно подробно начали объяснять, что подписка оптимизирована под взаимодействие с нативными агентами и в условиях дефицита мощностей компания вынуждена приоритезировать их поддержку. Разумеется, это не мешает критикам возмущаться и дальше.

Сообщение от Anthropic про запрет использования сторонних клиентов в рамках подписки Claude

Anthropic

Подкаст номер 172

Новая модель Anthropic

Немного статистики про экономику токенов

Как Claude Code экономит токены