ElKornacio
11.1K subscribers
180 photos
58 videos
1 file
226 links
Авторский канал про технологии и бизнес.
Тут матерятся (и дают качественную аналитику).
@sewald
Download Telegram
некоторое время назад я поделился историей, как вместо покупки подписки на SaaS-сервис я его пересоздал с нуля через ИИ (с заточенными под меня фичами), и это оказалось даже дешевле.

а сегодня в канале Вани Замесина вышел очень хороший пост-размышление на эту же тему.

и вот подумалось, мы часто при появлении новой технологии обсуждаем "какие бизнес-модели теперь заработают", где сошлась экономика, а где что-то вообще стало впервые возможным. в общем, чё по opportunities.

но ведь обратная сторона медали: что-то сломалось. какую-то проблему новая технология решает лучше, чем те бизнесы, что решали её раньше. где-то экономика дистрибуции теперь разаливается из-за роста конкуренции. а где-то происходит структурный слом - ваша бизнес-модель не задета, но те бизнесы (ваши клиенты), которые вам платили, могли постарадать.

вот стало интересно, как думаете, что сломал ИИ?
какие прибыльные вчера модели уже развалились?
а какие ещё не развалились только потому, что есть инерция по интеграции ИИ?

мои мысли:
1. продукты вокруг несложной в повторении (<$100k dev costs) технологии, потому что ИИ-кодинг радикально снижает dev costs
2. большая пачка no-code тулов. AI-coding для обывателя - это по сути тот же no-code, но с гипер-кастомизацией. зачем Webflow, если тоже самое (и ещё в 500 раз больше) делает Cursor?
3. глобальные универсальные продукты (без сетевых эффектов), в которых не-идеальная адаптация под локальные рынки, окупались за счёт того, что разовая дорогая разработка универсального решения открывала доступ ко всему миру сразу. ИИ даёт удешевление разработки -> можно делать локальных конкурентов с локальной адаптацией и выбивать глобального игрока рынок за рынком.
4. (ща будет неожиданно) UGC-платформы. пока AI-слоп ещё иногда отличим от людей, но уже скоро совсем перестанет выделяться. medium и reddit превращаются в помойки с ужасающей скоростью. проверенные и подтверждённые авторские группы будут сильно выгоднее смотреться на этом фоне. и я не вижу пока даже намёков (и даже теоретических обоснований) того, что проблема идентификации ИИ-контента будет решена в ~10 лет.
5. "being human is the new black" - тренд на "живых людей в бизнесе" потенциально может создать проблемы для тех, у кого ИИ-автоматизация продаж/поддержки - ключевой актор сходимости экономики.

вообще, мыслей ещё тонны - что OF-моделям трудно конкурировать с ИИ-рендером, браузерным автоматизациям - с Comet/Atlas, как ИИ-чаты влияют на сходимость paid ads, и прочее.. но не хочется уходить в лютый лонгрид, гораздо интереснее послушать ваши мнения.

что думаете?
🔥255🤣5🤷‍♂4🤔2
Forwarded from AI[ex]Time
Сегодняшний апдейт лидерборда swe-rebench мне кажется одним из самых интересных за все время, по нескольким причинам:

1. Добавили целый ряд моделей: gpt-5.2, gpt-5.1-codex-max, Gemini 3 Pro, DeepSeek-v3.2, Devstral2. Все модели от openai теперь прогоняются через responses API с сохранением ризонинг блоков. И все модели по-своему интересны:
– gpt-5.2 прыгнула на самый верх и теперь соревнуется с Sonnet/Opus 4.5. А главное посмотрите на кол-ве потраченных токенов в среднем на задачу – почти как gpt5-minimal.
– gpt-5.1-codex-max сильно лучше gpt5-codex, но на фоне других моделей от openai не так уж выделяется.
– Gemini 3 Pro – огромный скачок в агентских задачах по сравнению с 2.5 Pro. Оффтоп, но это моя любимая модель на текущий момент в бытовом пользовании, не могу народоваться фиче с нативной обработкой видео.
– DeepSeek-v3.2 – новая сота в open-source, но также и сота по потреблению токенов 💀
– Devstral2 выглядит очень неплохо. Вроде как незаметный релиз от Mistral врывается в топ open-source моделей.
– Не забывайте, что к ранжированию нужно относиться осторожно, задач не так много и доля случайности все еще большая, даже несмотря на усреднение по 5 ранам. Но общая картина думаю понятна хорошо.
2. Добавили Claude Code как reference сота агента 🎉 Режим запуска указан в инсайтах.
3. Для прозрачности Cost per Problem, добавили колонку Cached Tokens, как минимум для понимания, включен у модели кэшинг или нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍156🤔3🤣3🥱1
https://blog.google/technology/google-labs/cc-ai-agent/

кто-то в гугл же реально сидел, и такой "блин, все эти чат-интерфейсы, голосовой ввод... насколько же они не чувствуют юзеров. мы сделаем ИИ, с которым надо общаться по email, вот это будет реально огонь"

при моей действительно большой любви к Google как к компании, я думаю, там есть технология, типа как в сериале "Разделение" - когда ты проходишь двери офиса, тебя на пару секунд переклинивает, глазки закатываются, и ты забываешь всё, что знал о UI/UX.

P.S. отдельный респект за нейминг. "как сказать, что ты полностью оторван от контекста ИИ-агентов, прямо это не говоря"
😁395👍2👎1😍1
btw, Anthropic заопенсорсила Skills: https://agentskills.io/home

... правда, на момент "опенсорсинга" его уже итак поддержали крупные вендоры ...

... да и опенсорсить там, если честно, +- нечего... по сути очень тонкая документация ...

... не говоря уже о том, что context-based retrieval для rules в Cursor был завезён год назад, и де-факто это точно такая же механика, что и у Skills ...

--

вообще вокруг Claude Code сформировался небольшой странный культ, когда завезённые туда фичи воспринимаются как супер-инновация, когда другие тулы поддерживают их уже сто лет как.
главная, и самая сильная инновация Claude Code - очень крутой механизм субагентов, который и по сей день в настолько же удобном виде мало кто повторил (хотя Cursor вон в бетку недавно завезли, но пока сыровато).
но когда вижу в инете, как писаются кипятком от того, что в CC добавили conditional rules по файловым маскам.. или что другие conditional rules, по которым агент сам решает грузить их или нет на основе поля description, называют Skill и позиционируют как инновацию, это очень удивляет 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
👍188😁6🥱1💯1
отдельно впечатлился с этой херни 🤯

чтоб вы понимали: "repeatable workflow" это не более чем промпт, в котором этот workflow описывается. никаких гарантий, что агент будет ему следовать, Agent Skills не вносят.

для сравнения, в том же суперкоде workflow из цепочек соединённых smart actions дают гарантированное следование workflow, с возможностью ветвления и всего такого. а custom roles точно так же позволяют задавать роли и разрешённые тулы.
все workflow, которыми я пользуюсь (plan-and-implement / implement-and-refactor / implement-and-test / etc) устроены именно так, и как раз их гарантированность - самый главный фактор.

возьмите OpenAI/Google модели, и сделайте 10 запусков какого-нибудь workflow, который тупо описан в промпте, и вы поймёте, почему гарантированность выполнения шагов в workflow - это реально важно (спойлер: потому что в 1 случае из 4 не-Anthropic модели на хую вертели ваши просьбы следовать workflow, а Anthropic модели - в 1 случае из 10)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2510🗿1
ElKornacio
отдельно впечатлился с этой херни 🤯 чтоб вы понимали: "repeatable workflow" это не более чем промпт, в котором этот workflow описывается. никаких гарантий, что агент будет ему следовать, Agent Skills не вносят. для сравнения, в том же суперкоде workflow…
This media is not supported in your browser
VIEW IN TELEGRAM
для сравнения, что я считаю хорошей имплементацией гарантированных workflow: четко задаёшь порядок actions, агент не может отойти от жестко прописанного workflow, каждый action - отдельный фиксированный или динамический промпт, отдельные action можно помечать как conditional (то есть по какому-то критерию их динамически включать/отключать, скажем, если npm run test не возвращает ошибок, то я action "fix bugs" даже не запускаю), и, самое главное, workflows можно вкладывать друг в друга (то есть внутри одного композитного action я могу держать сколько угодно других композитных actions.

блин, я на этой штуке даже циклы собирал: по кругу вычитываешь баги из Sentry один за другим, и кормишь их промптом ИИ-агенту.

просто ставишь первому action в списке nested actions в conditional execution баш-скрипт, который с Sentry запрашивает одну за другой таски, и если их нет - то кидает non-zero exit code.

запускаю этот комбайн время от времени на минут 20, и он сам выгружает и фиксит 4-5 новых ошибок в Sentry, каждую оформляя в отдельный PR.
🔥39👍183🤯3
забавно, не так уж и много получилось. видимо, под конец года стал слишком часто заскакивать в claude code 🙂

но энивей, ярд токенов, прикольно 😼
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍9🔥7🥱2🤔1
привет, ребята. на всякий случай решил напомнить, ато вдруг вы забыли или упустили.

конфа "ИИтоге 2025" уже завтра, я там выступаю с оч сочной темой: "AI в разработке: эволюция ИИ-агентов (CC/Codex/Gemini) в экосистемы, Context Engineering, и как ИИ влияет на метрики разработчиков" 🙂

напомню, в программе:
- Сдвиг парадигмы в управлении процессами, который все пропустили
- Как в 2026 бизнесу отличить: где ИИ-фанатизм со сливом бюджета, а где ИИ-инструменты с реальной ценностью?
- Почему одних разрабов ИИ бустит, а другие плюются от багов? Как укротить агентов и получать production-ready код от ИИ?
- RAG мертв? Почему enterprise уходит от векторных баз к агентам, куда движется индустрия LLM-провайдеров и какое место у локальных AI-решений?
- Кого и как нанимать в 2026 году? И, самое главное, что изучать, чтобы не уволили вас?

в общем, шикарная солянка контента от экспертных спикеров: парочка Head of AI, руководитель AI R&D-института, фаундеры и ко-фаундеры AI-first компаний: самый лучший состав, чтобы рассказать про ИИ со всех ракурсов.

⚡️ вот ссылка для записи на предновогодний эфир (все еще можно бесплатно!)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2310👍10
https://docs.z.ai/guides/llm/glm-4.7

а между тем зайка обновила GLM. всё за те же $6/мес модель стала сочнее по бенчам. рост консервативный, революции нет, но как простенькая модель для рутинных задачек GLM мне всё ещё очень заходит
👍379🔥5🥱1
я не понимаю, что иногда курят авторы доков по AI тулам, но решил не проходить мимо конкретно этой штуки, т.к. в ЛС уже раз 5 спросили про одну и ту же проблему

я не знаю, кому пришло в голову написать в примерах в официальной спеке и на сайте Курсора, что в теле markdown SKILL.md есть раздел "When to use this skill".

НЕТ, этот раздел не работает.
НЕТ, агент не принимает решение о загрузке скилла на основе этого раздела.
НЕТ, у агента в контексте вообще нет содержимого скилла ДО того, как скилл был загружен.

_единственное_ место, где вы даёте агенту анонс, "что это за скилл и когда его надо загружать" - это поле description вверху SKILL.md (во frontmatter'е).

ещё раз: содержимое скилла читается уже постфактум, когда агент УЖЕ принял решение, что хочет его загрузить.
зачем внутри скилла писать раздел "When to use this skill" - загадка.
3👍35😁186❤‍🔥4💯1
монтировал свой видос с рассказом про новые техники Advanced Tool Use в Claude Code.

и пришла в голову мысль, что тот же Programmatic Tool Calling это бессмысленное решение изначально собственноручно созданной проблемы.

MCP был идеей "упростим ИИ-агентам доступ к API, ИИ-агентам нужен свой стандарт API".

в итоге, в 99% случаев это наитончайшая обёртка над элементарными http-запросами или bash-скриптами. которые сами агенты, уже буквально спустя 3-4 месяца после появления MCP, могли прекрасно выполнять и без всякого MCP - просто curl-запросами через терминал или самописными скриптами.

но т.к. все обмазались MCP, теперь приходится городить способы, как агент может дергать MCP из какой-нибудь программной среды, чтобы алгоритмически обработать результаты ещё до попадания в контекст (скажем, grep'нуть что-нибудь).

и если бы агенты просто делали запросы через самописные bash-скрипты, то... этой проблемы бы не было изначально, т.к. сделать pipe curl + grep сегодня может даже 4B модель.

как будто, если выкинуть из агента возможность подключать MCP в принципе, то надобность в Programmatic Tool Calling исчезает, а конечная функциональность агента не меняется.
29🤔24👍13🔥10💯4😁3🤯1💊1
ElKornacio
для сравнения, что я считаю хорошей имплементацией гарантированных workflow: четко задаёшь порядок actions, агент не может отойти от жестко прописанного workflow, каждый action - отдельный фиксированный или динамический промпт, отдельные action можно помечать…
в комментах несколько раз просили гайд, как юзать всё то, что я показывал на скринах 🙂
вот только что выпустил видос, где показываю, как собрать простенький workflow с нуля, и на пальцах объясняю, как работают эти экшены в целом.

https://www.youtube.com/watch?v=zBCbZO0hywk

P.S. да, на ютубе сейчас будет шквал видосов, не переживайте, спор будет выигран, и после НГ это закончится))
P.P.S. я не буду постить сюда все видео - это скинул только потому, что выше были посты на эту же тему. в ближайшие дни скину ещё одно - просто потому что оно мне сильно нравится, и на этом всё)
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥50👍87👏2
только что приехала доставка, максимальный вайб подарка от деда мороза 🎄

- diy смарт-колонка с микрофонами, динамиком, bt/wifi/rbg и аккумом
- и diy смарт-часы с тем же набором + touch amoled экраном

самое главное... они полностью программируемые (esp32). то есть я буквально с нуля могу собрать их операционки. не просто писать на них приложения, а иметь низкоуровневый доступ к каждому датчику, каждому порту, программировать их поведение как хочу, припаять что хочу.

с колонкой всё очевидно - накачу туда whisper + gpt, и сделаю не-умственно-отсталую версию Алисы.
а вот с часами идей масса.

что бы сделали вы?

P.S. по просьбам трудящихся, кинул ссылки в комменты
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥688🎄6😁1
ElKornacio
только что приехала доставка, максимальный вайб подарка от деда мороза 🎄 - diy смарт-колонка с микрофонами, динамиком, bt/wifi/rbg и аккумом - и diy смарт-часы с тем же набором + touch amoled экраном самое главное... они полностью программируемые (esp32).…
в общем, расскажу, зачем купил эти смарт-часы.

я давно хочу себе умное кольцо. но не то, которое хреново измеряет мой пульс и напоминает лишний раз о том, как ужасно я сплю.
а такое, чтобы стало универсальным интерфейсом управления любым устройством в моей жизни.

я хочу направлять руку на телевизор, делать свайп большим пальцем по кольцу на указательном, и переключать ролик.
направлять её на кондиционер, и тапом большого пальца по кольцу включать его. направлять руку на свет, свайпами снижать яркость.
гуляя по улице в наушниках, с рукой в кармане, свайпами по кольцу управлять громкостью/переключать треки.

не вдаваясь в большие детали, у кольца главная проблема - очень-очень-очень маленькая батарейка, которую надо экономить изо всех сил.
поэтому смарт-часы выступают хабом, который процессит всю логику (и имеет норм батарейку), а само кольцо - просто посылает сигналы на часы в моменты, когда я что-то на кольце тыкаю. в режиме "энергия кольца тратится на мгновение, когда я нажимаю на кнопку" оно может работать годами.

поэтому мне нужен low-level доступ к пинам часов - чтобы распаять туда кастомный 433MHz ресивер, и написать мини-драйвер для приема сигналов с кольца.
если всё сложится удачно - попробую собрать прототип всего этого дела на новогдних праздниках 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥100😱1912👍4👏3😁2🤯1
привет, ребята! оч частые вопросы: "как ИИ влияет на IT-профессии?", "а программирование вообще ещё надо учить?", "а что делать джунам?", и подобные.

с месяц назад я познакомился с Мишей - основателем TalentMove, и кайфанул с того, какой клёвый агрегатор IT-вакансий они делают. я вкинул мысль, что людям очень интересно, как ИИ влияет на рынок труда, и что используя их базу вакансий, они могли бы сделать интересный рисерч об изменениях.

и они его сделали! три недели большого исследования рынка труда в IT, с разбором 2025 года и аккуратными предсказаниями на 2026: что происходит с джунами, middle+ и сеньорами, как меняются зарплаты, форматы работы, роль AI и что специалисты сами думают о ближайших годах.

⚡️ прямая ссылка на отчёт: вот она
⚡️ пост в их канале: вот он

кстати, экспертные комментарии для отчёта дали в том числе уже знакомые вам ребята: Коля (AI и Грабли), Тимур (про AI Coding) 🙂

P.S. если что - это не реклама, просто хочу поддержать действительно клёвый проект и рисерч.
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥19👍4
спасибо вайбкодингу, что теперь гораздо больше людей понимают, что сделать что-то - 10% работы, а продать - 90% 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
4😁114💯4516🤣11🔥6😢6🎄2🤷‍♀1🍌1🎅1🆒1
Media is too big
VIEW IN TELEGRAM
6🍾6034👍21❤‍🔥6🎄5🔥4🎉3🆒1
ребята, у меня большая просьба!

делаю анонимный опрос: с какими проблемами сталкиваются те, кто программирует с ИИ. как чистые вайб-кодеры без технического бекграунда, так и опытные разработчики.
10 вопросов, всего 3-4 минуты, можно записывать ответы голосовухами, если печатать неудобно.
я буду очень-очень признателен вам за подробные ответы про ваш опыт, особенно негативный - что бесит, что мешает, что хочется чтобы было лучше.

а ещё там есть пункт "я не против с тобой созвониться". я хочу выбрать несколько человек из тех, кто не против пообщаться, и расспросить про их проблемы подробнее, постараться предложить варианты решений (всё бесплатно конечно).

ссылка на опрос: https://vcs.elkornacio.com

заранее спасибо!
P.S. если у вас есть друзья, которые кодят с ИИ - форвардните и им тоже, спасибо 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍4215👌9
ElKornacio
пока готовлю видос по gpt-5-codex, хочу пошерить инфу о дружественном проекте 🙂 после видоса про MCP, где я рассуждал про связанные с ним бизнес-модели, мне в ЛС стучалась куча людей с запросами аля "хочу сделать проект/бизнес связанный с ИИ, что посоветуешь?".…
привет! некоторое время назад писал про проект моего товарища Гоши (бывший топ из маркетинга, сейчас AI-инженер), который помогает находить стартап-идеи из личного опыта.

судя по тому, что после предыдущего поста более 100 человек пришли на групповые встречи, тема вам зашла 🙂
он немного докрутил формат, теперь вы созваниваетесь 1-на-1 с другим фаундером и по методике из ~30 вопросов по очереди "интервьюируете" друг друга. вытаскиваете денежные проблемы из работы, личной жизни и близких.

через методику прошло уже несколько десятков человек (отзывы можно глянуть там же в боте). большинство участников за 60 минут находят 1-3 идеи, которые берут в работу.

в общем, если интересно, записывайтесь тут: @zamysel_pro_bot

первая встреча там бесплатная 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
119👍10👎9🔥7🥱3