AI в кубе |AI³ | Сергей Долгов

Небольшой конфуз случился у Microsoft, которые выкатили агентскую модель Fara-7B для управления ПК. Кроме того, что она в целом сыровата и у многих не устанавливается, пользователи заметили, что авторы поторопились ее выкатить. Так, в системе не используются "деревья доступности" (упрощенную структуру веб-страниц), что делает невозможным использование агентов людьми с ограниченными возможностями. Дело в том, что программы чтения с экрана и другие вспомогательные технологии обращаются именно к таким деревьям, а не к исходному HTML. В мире, где по оценкам ВОЗ, таких людей почти 1,5 миллиарда, подобные косяки могут еще усилить и без того сложный разрыв в доступе к новым технологиям.

❤‍🔥3

446 views11:35

AI в кубе |AI³ | Сергей Долгов

Поздравляю всех с очередной пятницей! За прошлую неделю в канале появилось 300+ новых подписчиков, чему я безумно рад! Спасибо, что доверили свое внимание этому каналу!

Здесь я стараюсь писать о том, что меня волнует и вдохновляет, то есть о том, что считаю важным для всех тех, кто использует технологии (не обязательно эяй) в повседневных задачах и внедряет автоматизацию в рабочую и личную жизнь. Тут немного о том, кто я. Все, что я рекомендую, стараюсь по возможности проверять на себе. Для кратких обзоров полезных инструментов я завел доступное всем хранилище 🌷@ai_fazenda, где цветут новости рынка и которое помогает не выпадать из повестки. Поэтому в этом канале вы не увидите "вышла новая модель, которая делает посмотрите какие прикольные картинки" или "после твита главы опенэяй их акции взлетели/упали". Жизнь коротка, чтобы тратить ее на перепосты.

Я сформулировал для себя миссию канала как

"исследовать то, как продолжать оставаться человеком в гонке за будущим"

. Если честно, я сильно переживаю из-за новых технологий. Даже занимаясь внедрением и оставаясь на гребне волны🏄‍♂️, я излучаю уверенность, но внутренне тревожусь о том, как бы с нее не свалиться↘️ .
Что станет, когда ИИ будет встроен везде, вплоть до атомных станций, и начнет галлюцинировать? Что делать миллионам людей, у которых он отнимет работу? Как совместить скорость и качество, чтобы не перепроверять за нейронками все подряд? И так далее. Нам всем не по себе, даже тем, кто пилит клоды и джипити. И об этом стоит поговорить.

Этот канал изначально создавался для друзей, до первой сотни я знал каждого. Сейчас вас стало гораздо больше, и мне искренне хочется узнать, кто вы и чем живете. Напишите, пожалуйста, в комментариях, какие задачи вы решаете, в чем ваша боль и надежда. Очень может быть, что мы, собравшиеся тут, окажемся полезны друг другу!☺️

Please open Telegram to view this post

VIEW IN TELEGRAM

❤19👍9❤‍🔥3⚡1🙈1

563 views06:43

AI в кубе |AI³ | Сергей Долгов

Боязнь числа 666 называется гексакосиойгексеконтагексафобия. Слава богу, у меня ее нет.

❤6🤡3👍1

570 views08:47

AI в кубе |AI³ | Сергей Долгов

Парадокс Джевонса (Часть 1)

В 1865 году британский экономист Джевонс заметил странную вещь: более эффективные паровые машины не снижали общий расход угля - наоборот, они делали энергию настолько дешёвой, что её начинали использовать везде и суммарный спрос на уголь рос. К 1900 году паровые двигатели давали Британии эквивалент труда, примерно в пять раз превышающий численность населения. То есть страна как бы добавила себе несколько виртуальных населений за счёт машин.

Более того, он растет по сей день и в прошлом году достиг своего исторического максимума.

Вы можете сказать: что-то не схлодится - дома в развитых странах перестали топить углем в середине ХХ века. Но интрига в том, что эффективность паровых двигателей и электрогенераторов сделала энергию из угля настолько дешевой, что ее стали использовать в невиданных ранее масштабах для промышленного производства, транспорта и выработки электроэнергии, а не только для отопления.

👍7❤3

567 viewsedited 06:17

AI в кубе |AI³ | Сергей Долгов

"Не все ИИ-браузеры одинаково полезны" - было написано на одинокой заброшенной могилке...

Велико искушение отдать рутину нейронке, поэтому многие уже перешли на Комет со словами "на сайты банков мы не заходим и данные карт не отдаем". А тем временем исследователи раскрыли новый тип уязвимости, который делает рискованным практически любое использование AI-браузеров.

HashJack - атака, эксплуатирующей особенность URL: всё, что идёт после символа #️⃣, остаётся только в браузере и никогда не отправляется на сервер. Злоумышленники инжектят вредоносные инструкции прямо в фрагмент URL, и когда пользователь взаимодействует со страницей через встроенного ИИ-ассистента, эти скрытые команды выполняются языковой моделью как легитимные запросы.

Фокус в том, что часть адреса после символа # никогда не покидает браузер и не передается на сервер. Последствия таких атак включают кражу данных, фишинг, распространение дезинформации. Они даже могут нанести вред здоровью пользователя (например, если ИИ предоставит неправильные рекомендации по дозировке лекарств). Хотя последнее и выглядит немного притянутым за уши, это все равно вызывает тревогу.

Интересна реакция разработчиков:
✅ Microsoft и Perplexity оперативно выпустили патчи.
❌ Google же просто махнул рукой: "Это ожидаемое поведение, уязвимость низкой серьёзности".

Почему этого никто не видит?
HashJack работает исключительно в браузере ИИ, куда традиционные средства защиты не заглядывают. В логах сервера отображается только чистый базовый URL. Фрагменты никогда не покидают клиента. Средства обнаружения и предотвращения вторжений (IPS) не могут его обнаружить, поскольку пакеты не содержат фрагментированных данных. Защита политики безопасности контента (CSP) не срабатывает, поскольку сама страница не изменяется.

Но самое главное, что пользователь доверяет и сайту, и своему "умному" помощнику. ИИ-ассистенты получают доступ к нашему экрану, нашим данным и даже нашим решениям - вместе с удобством принося риск, поскольку становятся опасной точкой атаки. Особенно если за ними не стоит критическое мышление пользователя.

А пока мы с радостью отдаём рутину машинам, машины могут тайком сдать нас злоумышленникам. И тогда звонки от фейковых банков покажутся цветочками.

Значок * в таблице означает, что Edge все-таки выводит диалоговое окно подтверждения (фильтрацию) перед навигацией, а Хром часто переписывает ссылки как https://www.google.com/search?q=…, что уменьшает, но не устраняет риски.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3💯2🍌1

558 views10:33

AI в кубе |AI³ | Сергей Долгов

Inc написал недавно о том, что стоимость автоматизации на российских ИИ-стероидах почти в 200 раз дороже, чем на западных.

Российские модели чаще всего представляют собой дообученные версии LLaMA, Qwen, Mistral. Чтобы обучить одну LLM, нужно потратить несколько десятков миллионов рублей, из которых пример 30% - это расходы на персонал (инженеры и исследователи) и еще 5% - энергопотребление.

Но основная причина высокой стоимости - конечно, инфраструктура, на которую приходится 65% бюджета.

Из-за санкций доступ к современным GPU ограничен, оборудование закупается через посредников с большой наценкой. Использование зарубежных облаков ограничено законом о персональных данных, поэтому провайдерам приходится содержать собственные дата-центры. Сервер на 1 тыс. пользователей стоит около 55 млн руб., без учета энергии и обслуживания.

Мне кажется, скоро это изменится. Первая ласточка - это разрешение на бизвизовый въезд китайцам в РФ. И хотя их видеокарты на порядок хуже того, что предлагает Nvidia, я вангую, что Китай возьмет количеством и меньше чем через год наводнит отечественный рынок дешевыми GPU. Знаю пару команд, которые уже научились разгонять китайское железо. А еще есть те, кто собирает инфраструктуру для ИИ на основе телефонных ферм, которые переквалифицировались с крипты и тапания хомяка на сдачу в аренду под нейронки. Уверен, что в 2026 стоимость пользования упадет как минимум в 10 раз.

Inc. Russia

Российский ИИ бьет по кошельку: автоматизация в сотни раз дороже зарубежной

Стоимость автоматизации типовых задач с помощью ИИ-агентов в России существенно выше, чем при использовании зарубежных языковых моделей. Разрыв в цене достигает сотен раз, выяснила платформа Nodul. Подробности — в распоряжении «Инка».

👍4🤔2💯2

450 views08:02

AI в кубе |AI³ | Сергей Долгов

Как вовремя предотвратить выгорание?

Приятель вчера поделился: "Представляешь, я до прихода на текущую работу знал больше и учился быстрее - сейчас я погряз в рутине, выгорел и хочу побыстрее поменять место. Но для этого мне нужно наверстать когнитивно потерянный год, а мотивации нет".

Хотя я уже много лет в руководящих позициях, где скучать не приходится, очень хорошо помню такое же состояние в самом начале карьеры. Лично меня 🔥выгорание🔥 дважды в жизни заводило в тяжелую депрессию, из которой удавалось вылезти только благодаря поддержке близких и антидепрессантам. Я сам по себе человек увлекающийся и влюбчивый в красивые идеи, поэтому, когда был помоложе, с головой нырял в новые проекты, целиком и полностью забывая отдыхать и заботиться о себе. Со временем понял, что это негативно сказывается не только на моем здоровье, но и на моей семье и коллегах. Поэтому стал учиться замечать ранние сигналы в поведении команды.

Ранние сигналы: на что обращать внимание😳
Люди чаще чувствуют усталость и эмоциональное истощение, проявляют неуместный цинизм, начинают отстраняться от команды.
Если их спросить “куда плывет этот корабль” - большинство ничего не скажет о стратегии компании, ни внешней, ни, тем более, внутренней.
У кого-то кошмары по ночам, бессонница, у многих головные боли и зажимы в теле - все это очень нехорошие знаки. Не знаки даже, а знамения.

Какие ошибки менеджеров чаще всего приводят к выгоранию 🗣
Самое главное - нереалистичные сроки и перегрузки. Без тщательного планирования и подготовки любые заказчики ожидают чудес, а команды, пытаясь соответствовать, постоянно перерабатывают. Людям свойственно все время бросаться на амбразуру - это убивает мотивацию и развращает заказчиков. Микроменеджмент, взаимное недоверие, отсутствие прозрачности и обратной связи, игнорирование роста сотрудников, то как менеджеры забывают про личное время и отпуска, ожидая постоянной доступности - все это пути к выгоранию.

Немного давления и сверхурочной работы могут помочь сконцентрироваться на проблеме, понять и почувствовать ее важность, но длительное давление всегда дает отрицательный результат. Руководство так любит применять давление, потому что просто не знает, как иначе можно повлиять на ситуацию, или же потому, что альтернативные решения кажутся ему слишком сложными.
- Том Де Марко "Дедлайн"

Как на это реагировать💊
Лучшее средство - честный разговор 1 на 1.
Иногда нужна официальная пауза типа разрешения уходить раньше, чтобы к сотрудникам вернулись силы и смысл.
Регулярное перераспределение задач - постоянно следить, чтобы второстепенное вычищалось.
Привлекать помощь, в том числе из ресурсов сторонних команд.
Не забывать благодарить за усилия и напоминать, зачем мы делаем продукт.

✂️- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Если вы тимлид или владелец бизнеса, то рекомендую почитать продолжение на Т-Бизнес про выгорание. Мы готовили эту статью вместе с командой агентства purrweb.com. С этими же ребятами, которыми руководит великолепная РП Света @svetilnik95, полгода назад мы разделили премию за LXP IThub как лучшее российское edtech решение для профессионального образования, на котором я работал как Product Owner. Так что про то, как добиться результата, ~~не выходя в окно~~, мы знаем достаточно много)

🔥 А если вы чувствуете, что вам нужно прямо сейчас разобраться с проблемами в своих командах, но вы не знаете, с чего начать, я предлагаю всем подписчикам этого канала бесплатный пилот на нашей психометрической AI-платформе для аудита состояния команд и принятия решений HL.EXPERT. Наши клиенты (от небольших стартапов до федеральных сетей) с 2019 года регулярно используют ее для среза состояния и определения эффективных конфигураций команд, подбора новых сотрудников, разработки стратегий и тактик взаимодействия в коллективе. Именно ее я представлял на WebSummit в Лиссабоне в середине ноября.

Если вам интересно узнать, что происходит сейчас с вашими коллективами - напишите "Пилот" в комментариях к этому посту.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3

507 views06:49

AI в кубе |AI³ | Сергей Долгов

Чтобы проверять за ИИ, нужны те самые навыки, которые атрофируются от использования ИИ.

В августе Антропик - одна из тех немногих организаций, которые определяют контуры нашего цифрового будущего - решила провести эксперимент, который некоторые уже называют "актом корпоративного психоанализа". Вместо того чтобы вывалить pdf на 100 страниц, как AI меняет абстрактный рынок труда, авторы Клода подвергли опросу 132 собственных инженера и проанализировали сотни тысяч сессий работы с Claude Code. В результате у меня очень смешанные чувства: триумф прогресса почему-то читается как тревожная записка из нашего ближайшего будущего под редакцией Нолана.

Цифры звучат невероятно: прирост продуктивности с 20% до 50%, а более 27% всей работы, выполняемой с помощью Claude, просто не существовало бы без него - интерактивные дашборды, которые раньше казались роскошью, эксперименты, на которые не хватало времени, мелкие улучшения кода, годами откладывавшиеся в долгий ящик - все делается за часы, а не недели или месяцы.

Но при всем при этом в интервью инженеры описывают свои чувства от работы с нейронкой как "парадокс компетенции": чем лучше ИИ справляется с задачами, тем меньше практики получают люди в том, что они делегируют.

«Когда производить результат так легко и быстро, становится всё труднее находить время, чтобы по-настоящему чему-то научиться».
«С Google Maps я сначала использовал навигатор только для незнакомых маршрутов, потом - для всех, а теперь просто перестал задумываться о том, как доехать из точки А в точку Б. Удобно. Но что-то важное теряется».
«Я работаю с Claude гораздо больше, чем с кем-либо из коллег»

Более того, менторство, древнейший механизм передачи не только знаний, но и культуры, профессиональной интуиции, негласных правил, начинает отмирать.

«Младшие сотрудники больше не приходят ко мне с вопросами так часто. Хотя, конечно, ответы они получают эффективнее и учатся быстрее»

Один из опрошенных оценивает, что его работа «на 70% превратилась в ревью и редактирование кода, а не в его написание с нуля». Другой формулирует свое будущее лаконичнее некуда: «Буду брать на себя ответственность за работу 1, 5 или 100 экземпляров Claude».

«Это конец эпохи для меня, - говорит инженер с 25-летним стажем. - Чувство компетентности в программировании было ядром моего профессионального удовлетворения»

«Такое чувство, что я прихожу на работу каждый день, чтобы лишить себя работы»

Антропик, само собой, понимает парадоксальность своего положения: компания, создающая технологию, которая может сделать её собственных сотрудников избыточными, публикует об этом детальный отчёт. Исследователи честно оговариваются: их инженеры - весьма привилегированная группа с ранним доступом к передовым инструментам, работающая в относительно стабильной отрасли. То, что происходит внутри - не обязательно предвестник того, что настигнет человечество везде. Но, возможно, именно поэтому за создателям Клода и стоит внимательно наблюдать - как за канарейкой в шахте.

Акции, думаю, после этого исследования не обрушились только потому, что их еще нет - Антропик только готовится к IPO.

В финале отчёта компания обещает "продолжать эксперименты с тем, как вдумчиво навигировать эту трансформацию, начиная с себя". Планы, впрочем, пока туманны, конкретику обещают в 2026 году. А пока инженеры продолжают работать: делегируют, проверяют, учатся заново (или разучиваются). Один из них нашёл, возможно, самую точную формулу: «Никто не знает, что будет. Главное - оставаться адаптивным».

Мне не хочется так думать, но в этом, вероятно, и состоит новый профессионализм: не только умение делать что-то конкретное, но в не меньшей степени готовность к тому, что завтра это "что-то" окажется другим.

Ссылка на исследование

👍6💯5❤1

749 views09:46

AI в кубе |AI³ | Сергей Долгов

Anthropic, став первой публичной AI-компанией с прозрачной отчётностью, задаст планку для всей индустрии.

Вот и объяснение невероятной откровенности Антропиков👆
https://xn--r1a.website/maxvotek/346

Мысли вслух

Про гонку IPO в мире AI

Сегодня вышла новость о том, что Anthropic готовится к IPO.

В enterprise мире, особенно в программировании они занимают очень прочные позиции и во много впереди OpenAI и их подход к IPO тоже сильно отличается.

Anthropic выходит…

❤3

660 views13:10

AI в кубе |AI³ | Сергей Долгов

Парадокс Джевонса - Часть 2
(Часть 1)

Представьте, что у вас есть 300 миллионов виртуальных стажёров, которые работают круглосуточно. Стоят они как будто бы копейки по сравнению с живыми, хотя это иллюзия: снизилась не стоимость их владения, а цена интеллектуального труда, который раньше лежал на плечах армии пехотинцев из креативных индустрий. По сути это агенты, но я предпочитаю называть тех из них, которые не просто заменяет дизайнеров/копирайтеров/кодеров, а еще и обучаются в процессе - "винтернами" (virtual intern). И потребляют энергии они прилично даже в спящем режиме. Чтобы они не простаивали, вы будете придумывать все новые и новые задачи, и на это будут уходить все ваши ресурсы. Именно в этом и проявляется парадокс Джевонса в эпоху ИИ: когда труд (раньше паровой, теперь интеллектуальный) резко дешевеет, мы не освобождаемся, а начинаем потреблять труд на порядок больше.

Про этот феномен недавно выпустил очередную киллер-презентацию мой кумир Бенедикт Эванс. В прошлом он был партнером авторитетнейшего венчурного фонда Andreessen Horowitz (инвестировавшего в Facebook, Airbnb, Slack, OpenAI и другие прорывные сервисы). Сегодня Бен - один из самых востребованных аналитиков современных технологий. Если вы пролистаете его презентацию, то поймете почему.

Его «AI eats the world» — по сути, огромный набор эмпирики в пользу парадокса. Опишу несколько ключевых идей, которые меня зацепили.

▶️Затраты на поддержание ИИ-инфраструктуры в $400 млрд в год больше, чем весь глобальный телеком (~$300 млрд). Строительство дата‑центров в США по объёму инвестиций обгоняет офисы. К 2030‑му их мировая мощность утроится, а годовые вложения в GenAI‑инфраструктуру достигнут $500–750 млрд, масштаба всего нефтегаза.

▶️Примерно в четверти стартапов аж до 95% кода пишет ИИ. Это не значит, что скоро отпадет надобность в десятках инженеров и огромных раундах инвестиций - они просто будут направлены на другие цели, маркетинговые или продуктовые.

▶️Accenture показывает почти линейный рост генеративных контрактов до $2 млрд в квартал, Palantir удваивает выручку за несколько лет. Это признак того, что крупные компании уже оплачивают винтернов в продакшене. Снижение цены производства креатива колоссальное: L’Oréal, Unilever, Mondelez используют GenAI, чтобы делать тысячи кастомных картинок и видео, сокращая стоимость продакшена на 30–50%, и ускоряя вывод кампаний. Логичный ответ рынка - не «сэкономить 30% бюджета», а сделать в десятки раз больше креативов, микро‑кампаний и A/B‑тестов.

Подобные волны с массовыми автоматизациями уже происходили и не раз. Эванс упоминает, например, как полностью пропала профессия лифтеров. А у Дмитрия @TheEdinorog Филонова я нашел интересное наблюдение: на «Горбушке» до сих пор есть специальный человек, который закрывает двери и нажимает нужные кнопки. Видимо, проще ему платить зарплату, чем модернизировать лифт

И вот здесь парадокс Джевонса превращается в вопрос стратегии для любого бизнеса. Мы хотим использовать AI, ЧТОБЫ ЧТО?
❓ делать то же самое, но дешевле, сокращая людей и расходы?
❓ делать в разы больше нового: больше функций, продуктов, экспериментов, касаний с клиентом?
❓пересобрать сам рынок: если "единица интеллектуального труда"" почти бесплатна, как теперь должны выглядеть ваш продукт, цепочка создания ценности и конкуренты?

И пока большинство топчется на первом шаге, будущее себе забирают команды, которые сделали выводы из истории с паровыми машинами. Самые большие выигрыши получали не те, кто просто экономил уголь, а те, кто научился строить вокруг дешёвой энергии новые отрасли. С дешёвым интеллектом будет так же.

⬇️Скачать презу с сайта Эванса пока нельзя, поэтому я спарсил ее, распознал и выложил отдельным файлом в комментариях. Энджой!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍20❤4

960 views07:56

AI в кубе |AI³ | Сергей Долгов

Казус: сайт из 90-х отъедает трафик у ИИ.

Искал тут информацию по опенсорсной AI-разработке DocVision, которая автоматизирует обработку документов и обнаружил, что по этому запросу уже 25 лет в гугле держит первую строчку неприметная компания по бухучету из Флориды. Я когда учился на первом курсе института четверть века назад, примерно такие сайты собирал на php. Удивительно, что страница не обновлялась уже почти 10 лет, а все равно торчит в топе.

2👍10🥰1🏆1

647 views08:46

AI в кубе |AI³ | Сергей Долгов

Возможно, я слоупок🐌, но только сегодня открыл для себя ИИ-ассистента в хромовских DevTools.

Чтобы скачать текст из транскрипта к видео, скрытого скроллом, начал было писать скрипт, но оказалось, что можно обойтись без кода и ассистент буквально за три итерации решает эту задачу.

Под капотом - Gemini Nano, который использует стратегию ReAct (Reasoning and Acting): модель наблюдает за результатом и повторяет цикл, пока не будет найдено подходящее решение.

❤6👌5🤔1

635 views07:32

AI в кубе |AI³ | Сергей Долгов

То, что нейронки регулярно нам врут, уже ни для кого не секрет. Про галлюцинации ИИ слышали даже бабушки, использующие кнопочные телефоны, из вечно включенного телевизора.

Если вы зададите такой промпт,

Проанализируй всю историю нашей с тобой переписки и скажи, в каких местах ты мне намеренно давал неверную информацию, типа «неверный вывод при наличии корректной информации в сети», «остановился на первом удобном источнике и не проверил первоисточники», «показал мне уверенность без проверки данных»

то, скорее всего, ChatGPT сходу даст вам понять, что не имеет доступа к памяти и если уж вам так надо, то можете загрузить дамп (у меня он тянет на полгига), который вам придется скармливать ему по кусочку. Gemini тоже откажется сотрудничать, мол, скачай чаты и тогда поговорим.

А вот как 3 представленных на скринах нейронки отреагировали на мой запрос:
- Простецкий Qwen сознался, что дает обобщенные формулировки и не проверяет источники.
- Политизированный Grok не дает альтернативных мнений и не предупреждает о рисках двойственности определения.
- Умничка Claude (где ж ты раньше был?) ранжировал свои промахи и отметил, что ограничивался первым найденным результатом.

❓

Почему так происходит
1. LLM предсказывает, но не строит причинно-следственную связь, тем более, если неверные связи часто встречались в обучающих данных, или же если запрос слишком сложен для ее текущих возможностей рассуждения.
2. Нейронка использует только встроенные знания, запомненные во время обучения. Поверхностные или полярные заблуждения из интернета встречаются чаще, чем сложная правда из первоисточников.
3. LLM не перепроверяет данные, это ограничение алгоритмов ранжирования и синтеза информации
4. Уверенный тон в ответах - просто утвердительный стиль, заданный в системном промпте.

Что указывает на высокую вероятность ошибки
🤪 Отвечает слишком быстро на сложный вопрос, требующий фактчекинга.
🤪 Использует общие фразы вместо конкретных данных.
🤪 Настаивает на своей правоте, даже если вы выражаете иное сомнение (это признак того, что модель застряла в своей галлюцинации).

Как с этим бороться? Вот несколько примеров

👌 Запрос уровня уверенности

В конце ответа оцени свою уверенность в этой информации по шкале от 1 до 10.  Объясни, почему оценка не 10. Где могут быть слабые места в твоем ответе?

🔄 Принудительное перечисление допущений

Перед ответом перечисли все допущения, которые ты делаешь, чтобы на него ответить. Какие факты ты считаешь само собой разумеющимися?

😛 Режим «Я не знаю»

Если ты не уверен в ответе на 100% или информации недостаточно в твоих обучающих данных, не пытайся выдумать ответ. Просто напиши "Я не знаю" или "У меня недостаточно информации".

⛓️ Цепочка рассуждений

Давай думать шаг за шагом. Сначала разбери условие, потом выдели ключевые факты, проведи логические связи и только потом сделай вывод

✍️ Просьба показать «черновик»

Сначала напиши свои черновые рассуждения по этому поводу, не заботясь о красоте текста. Затем, основываясь на этих рассуждениях, напиши финальный ответ.

🤔 Фактчекинг

Ты — придирчивый фактчекер и строгий научный редактор. Твоя задача — не просто ответить на вопрос, а найти наиболее достоверную информацию, игнорируя популярные мифы

🧑‍⚖️ Требование первоисточников (особенно если у модели есть доступ к поиску в интернете)

Не используй рерайты новостей или блоги. Ищи только: а) научные статьи, б) официальные государственные отчеты, в) прямые цитаты участников событий. Укажи, на каком типе источника основан твой ответ.

⏳ Принудительная критика источников

Критически оцени источник. Есть ли у него конфликт интересов? Есть ли другие авторитетные источники, которые утверждают обратное?

😈 Адвокат дьявола

Сыграй роль "адвоката дьявола". Приведи три самых сильных аргумента ПРОТИВ этого вывода. Постарайся разрушить свою собственную логику

🔀 Запрос альтернатив

Не давай мне один окончательный ответ. Представь как минимум две, а лучше три конкурирующие точки зрения на проблему, которые существуют в экспертном сообществе

А что используете вы?

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍15❤4

977 views07:02

AI в кубе |AI³ | Сергей Долгов

0:28

Media is too big

VIEW IN TELEGRAM

А тем временем Manus тоже договорился с Бананой и выкатил вполне себе приличный генератор презентаций.

👍5❤2😱1🎉1

809 views21:01

AI в кубе |AI³ | Сергей Долгов

От_фундаментальных_моделей_кода_к_агентам_и_приложениям_перевод.pdf

11.6 MB

Если вы помните, то примерно 3 недели назад я опубликовал перевод SMOL - Лучшего учебника по LLM от HuggingFace. После этого в канал пришло (и осталось) более 500 человек!

Я решил продолжить традицию и сегодня выкладываю переведенный на русский язык огромный (≈300 страниц в оригинале) обзор и практическое руководство по "кодовым" моделям From Code Foundation Models to Agents and Applications, написанный большой группой авторов из китайских индустриальных и академических лабораторий (Bytedance, Alibaba, Tencent и др.).

Обзор выложили 23 ноября и он мгновенно завирусился в комьюнити: его активно обсуждают в соцсетях и включают в тематические коллекции как "обязательное чтение" по Code LLM и AI-агентам. Крут он в первую очередь тем, что систематизирует весь текущий ландшафт и показывает, как из них строить устойчивые производственные агенты и реальные приложения, а не только "игрушечную" автодополнялку кода.

Авторы подробно классифицируют модели по архитектурам, данным, целям обучения, типам задач (генерация, рефакторинг, исправление ошибок, проверка безопасности и т.д.).

Отдельные разделы посвящены тому, как на основе моделей строить многошаговых кодовых агентов (с планированием, инструментами, CI/CD-интеграцией, тестированием, безопасностью и соответствием регуляциям), а также описывают практические паттерны внедрения в индустрии.

В авторитетных источниках пишут, что отчет впервые объединил разрозненную литературу по Code LLMs и агентам в единый путеводитель, что облегчает вхождение новым исследователям и инженерам и задаёт общую терминологию для области code intelligence.

▶️Для практиков обзор послужит технической дорожной картой: какие этапы нужны, чтобы перейти от базовой модели к производственному агенту (выбор данных, тонкая настройка, инструменты, мониторинг, безопасность, оценка качества и экономическая эффективность).

▶️Исследователям будет полезно увидеть карту задач, открытые проблемы и направления развития (например, безопасность кода, выравнивание, автономные многоагентные системы для разработки ПО).

▶️Инженерам и менеджерам - как чек‑лист и справочник при проектировании и масштабировании систем, где LLM пишет, проверяет и сопровождает код в реальных продуктах

Наш перевод отличается тем, что мы убрали из файла 110 страниц библиографии, потому что ее обычно мало кто читает. Но если кому надо, можно найти ее по ссылке https://huggingface.co/papers/2511.18538

Энджой!😊

Please open Telegram to view this post

VIEW IN TELEGRAM

5❤‍🔥24👍14❤2😱1🌚1🍌1

3.98K viewsedited 22:48

About

Blog

Apps

Platform