Сергей Булаев AI 🤖
10.9K subscribers
700 photos
629 videos
2 files
706 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
В Claude Code добавили to-do списки, теперь он иногда может работать и 20 минут... сам тестируя изменения, да. Да и вообще апдейты почти какждый день выходят, очень приятно что работа такими темпами ведётся!

Сергей Булаев AI 🤖 - об AI и не только
256
Смотрите какое чудо - MCP сервер с обновляемой документацией по более чем 9000-м различных API. Работает со всеми. Удобно. Больше никаких ошибок и поисков и скачиваний свежей документации!

Сергей Булаев AI 🤖 - об AI и не только
26396
А вы знаете, что можно установить open codex (форк codex от OpenAI) и использовать свежую крутую gemini для разработки совершенно бесплатно (правда нужен Google Billing Account). Я сегодня подключил! Мне понравилась больше чем o3 в оригинале.

Правда, пошли какие-то проблемы в плане редактирования файлов. Тем не менее, используя её как консультанта и руководителя для claude code, получилось найти баг, который не мог отловить более 2-х недель. Советую попробовать. Если сможете.

Если есть какая-то инфа о проблемах с файлами - буду благодарен. Больше агентов хороших и разных!

Сергей Булаев AI 🤖 - об AI и не только
295
Я в полном восторге от того, как элегантно работает новая версия робота на базе Vision-Language-Action модели π0.5. Смотреть, как железяка разбирается с незнакомой квартирой, реагируя на неожиданные перемены и даже на вмешательство людей, - настоящее удовольствие.

π0.5 умеет заходить в совершенно новые помещения и - без шаблонных сценариев - самостоятельно наводить порядок: расставить посуду по местам, заправить кровать, собрать одежду с пола. В обучении использовался мощный микс данных: текстовые инструкции, изображения, реальные действия других роботов и даже веб-данные (captioning, VQA и прочее). Благодаря этому робот не просто копирует движения, а реально понимает, что и зачем делать, разбивая задание на логические шаги.

Робот быстро адаптируется и корректирует действия на лету, даже если кто-то специально мешает ему в процессе уборки. Да, система пока далека от идеала: случаются ошибки в высокоуровневых командах, моторика не всегда точна, а конструкция получилась довольно громоздкой. Но прогресс очевиден, и это живое доказательство того, что ИИ уже выходит за пределы лабораторий - в наш реальный, физический мир.

Подробный и красивый разбор от создателей.

Сергей Булаев AI 🤖 - об AI и не только
4151
Наткнулся на письмо Михи Кауфмана (создатель Fiverr), где он призывает своих коллег немедленно осваивать технологии ИИ что бы не остаться без работы. Там есть целый фреймворк:

Стань “редким талантом”

Не просто следи за новыми AI-решениями в своей сфере, а попробуй их руками, исследуй, разбери до винтика. В поддержке клиентов Intercom Fin и SentiSum берут на себя рутину, а юристы уже спорят, что лучше - Lexis+ AI или Legora.

Искать свою “суперсилу” приходится буквально на ощупь - ведь тут речь не про абстрактные бонусы, а про умение выдавать больше результата за то же время и не терять в качестве.

Ищи тех, кто в теме сильнее тебя. Находи самых опытных в команде, проси показать новые трюки, делиться ссылками на закрытые демки - не жди, что всё принесут на блюдечке.

Время, теперь, самый ценный ресурс. Если работаешь, как в 2024-м, то уже проигрываешь тем, кто с утра до вечера может быть пока не очень удачно, но всёже автоматизирует что то при помощи LLM.

Осваивай составление промптов. Это уже не игрушка для гиков, а повседневный инструмент. Google уже умер. LLM и GenAI - новая база, и если не применять их экспертно, то ценность твоей работы быстро перестанет быть очевидной.

Включайся в процессы оптимизации компании через ИИ-инструменты и технологии. Наблюдать, как в Notion из пары строк собирается автоматическая отчётность, - магия. И правда, зачем расширять штат, если можно выжать больше пользы из того, что уже есть?

Понимай стратегию компании, не ограничивайся своим “участком” - ищи, где можешь помочь приблизить общие цели. Не надейся, что тебя позовут на совещание ради идей. Такого не будет. Лучше сразу предлагай своё - даже если кажется, что момент неидеальный

Прекрати ждать, когда появится возможность учиться или расти - создавай её сам. Если хочется большего, действуй.


#ПАНИКА
Сергей Булаев AI 🤖 - об AI и не только
234👎87
Media is too big
VIEW IN TELEGRAM
Пи(дум) p(doom) 🤖
#ИИНЦИКЛОПЕДИЯ

Вероятность, с которой искусственный интеллект приведёт к гибели человечества или другой экзистенциальной катастрофе.

Термин p(doom) (от англ. "probability of doom" - "вероятность гибели") возник как внутренняя шутка в кругах исследователей ИИ, но к 2023 году стал широко обсуждаемой темой после выхода таких моделей, как GPT-4. Сейчас это своеобразный "ледокол" при общении между специалистами по безопасности ИИ, быстрый способ понять отношение собеседника к рискам искусственного интеллекта.

Почему это важно
Несмотря на кажущуюся несерьёзность, p(doom) отражает реальную озабоченность экспертов потенциальными рисками продвинутых систем ИИ, особенно на пути к искусственному общему интеллекту (AGI). Это также показатель растущего осознания необходимости обсуждать и минимизировать экзистенциальные риски.
Ключевые особенности

Числовое выражение: обычно представляется как процент от 0% до 100%
Субъективная оценка: основана на личном восприятии развития технологий ИИ
Широкий разброс мнений: от 1% до 99% в зависимости от эксперта
Показатель отношения к рискам: отражает взгляд человека на безопасность ИИ


Оценки p(doom) сильно различаются даже среди ведущих специалистов. Например, опрос 2023 года показал среднее значение 14,4% среди исследователей ИИ, с медианой 5%. Что интересно, значения часто коррелируют с профессиональной деятельностью: те, кто напрямую работает над созданием сильного ИИ, как правило, дают более высокие оценки.

У меня нет своей чёткой оценки p(doom) – слишком много переменных и неизвестных в этом уравнении. Склоняюсь к тому, что риски существуют, но работа над безопасностью ИИ может существенно их снизить. Важнее не конкретное число, а осознание необходимости ответственного подхода к развитию ИИ.

На видео Кевин Роуз делится мыслями о том что судьба человечества решается без нас.

Для дальнейшего изучения
- Опрос AI Impacts о p(doom) среди исследователей
- The Case for Taking AI Seriously as a Threat to Humanity
- Исследование ИИ 2027

Сергей Булаев AI 🤖 - об AI и не только
151083
Google представила AlphaEvolve - эволюционного агента для открытия и оптимизации алгоритмов. Это прокачанный коктейль их исследовательских подходов, но теперь на основе больших языковых моделей Gemini. Агент сочетает креативность LLM с автоматизированными оценками, которые проверяют правильность решений, и использует эволюционный фреймворк для улучшения наиболее перспективных идей.

Как это работает? AlphaEvolve использует набор моделей Gemini - Flash для создания широкого спектра идей и Pro для глубокого анализа. Затем система проверяет, запускает и оценивает предложенные программы с помощью автоматизированных метрик. Получается эдакий автоматический программист, который пишет, тестирует и улучшает код на лету, отбирая лучшие решения и отбрасывая неудачные (видео приложено).

В Google уже применяют алгоритмы, обнаруженные AlphaEvolve, в своих дата-центрах и железе. Например, система нашла простой, но эффективный эвристический алгоритм для Borg (оркестратор датацентров Google), который уже год работает в производстве и экономит в среднем 0,7% вычислительных ресурсов компании по всему миру. Ещё AlphaEvolve оптимизировал специализированные чипы TPU и ускорил обучение моделей Gemini на 23%.

Что касается математических открытий, AlphaEvolve нашёл алгоритм умножения комплексных матриц 4x4, используя всего 48 скалярных умножений, улучшив алгоритм Штрассена 1969 года. Также система продвинулась в решении "проблемы поцелуев" (kissing number problem) - геометрической задачи, которая занимает математиков уже более 300 лет. AlphaEvolve обнаружил конфигурацию из 593 внешних сфер в 11-мерном пространстве, установив новую нижнюю границу.

Прикладываю видео Deep Dive (да они тестируют видеоподкасты в NotebookLM) в "проблему поцелуев" и то, как AlphaEvolve с ней справился. Это про то, сколько максимально неперекрывающихся сфер может касаться одной общей сферы. Задача эта стоит перед математиками уже 300 лет, и вот теперь ИИ помогает с ней справиться. Получилось клёво, но что ожидать, когда на решение бросают такие вычислительные мощности?

тут вот пейпер есть ещё

Сергей Булаев AI 🤖 - об AI и не только
3085
Как получить анимированную иконку в стиле AirBnB за 5 минут? Нашёл в твиттере:

1. Просим ChatGPT нарисовать кофемашину в стиле иконок AirBnB
2. Просим его переделать так как нравится
3. Просим
Runway анимировать

Всё! (смотрите промты на картинках)

Сергей Булаев AI 🤖 - об AI и не только
2414
Может быть вы как и я пропустили промптинг гайд по ChatGPT 4.1? Он интересный. Выпущен месяц назад.

Вот немножко советов от туда:

- GPT-4.1 отлично подходит для «агентских» сценариев: с правильно заданными напоминаниями - о настойчивости, о необходимости использовать инструменты и (при желании) о планировании - он решает на SWE-bench Verified на 20 % больше задач, чем без них.

- Всегда передавайте инструменты через поле tools, а не текстовым описанием в промпте - это даёт ~2 % прироста точности и снижает риск «галлюцинаций» модели о структуре кода.

- Добавьте одно жёсткое уточнение, если модель «уходит не туда»: GPT-4.1 буквально следует инструкциям, поэтому одной чёткой фразы почти всегда достаточно, чтобы вернуть его на нужный курс.

- Принудительное «plan-and-reflect» между вызовами функций повышает успешность решения задач ещё на ~4 %, позволяя модели «думать вслух» вместо молчаливой цепочки вызовов.

- Контекст до 1 млн токенов даёт отличные результаты для задач «иголка в стоге сена», но чем больше требуется одновременно извлечь объектов или провести сложное глобальное рассуждение, тем сильнее падает точность.

- Размещайте инструкции дважды - в начале и в конце длинного контекста; если лень, то начало важнее конца, так модель запоминает правила лучше.

- Структурируйте промпт по блокам: «Роль и цель → Правила → Шаги рассуждения → Формат вывода → Примеры»; при конфликте правил GPT-4.1 выполнит то, что стоит ближе к концу текста.

- Давайте инструментам и их параметрам «говорящие» имена и лаконичные описания, а примеры использования выносите в отдельный раздел «# Examples» — так модель реже ошибается с выбором и заполнением аргументов.

- Устраняйте базовую ловушку «вызови инструмент любой ценой»: добавьте правило «если данных недостаточно - спроси пользователя», иначе модель способна вызвать инструмент с пустыми или фантазийными параметрами.

Что особенно удивило - Markodwn и XML лучше работают чем JSON!!!

В оригинале советов ещё больше и есть примеры.

Сергей Булаев AI 🤖 - об AI и не только
43114
OpenAI выпустил своего 3-го автономного агента Codex (не путать с Codex CLI).

Подключается к вашим репозиториям и выполняет таски в облаке. Создает виртуальные окружения и запускает там код для тестирования. Да, вы просто ставите задачи, а потом ревьювите код. Написано что доступно для тарифов Pro, Enterprise и Teams (но у меня на Teams не получилось пока найти - подскажите если получится).

Агент работает на базе модели codex-1, которая является дотренированной o4 mini вроде. Говорят что специально тренировали её создавать идеальный код (видимо с минимальными диффами) для мерждей.

По словам Грега Брокмана - так OpenAI видит будущий интерфейс к AGI, можно считать codex его прототипом.

Посмотрите видео (привожу оригинал и перевод с помощью Eleven Labs) - оно интересное. Так же буду рад любым впечатлениям от использования (и расскажите кто нибудь как на тимс тарифе запустить)

Сергей Булаев AI 🤖 - об AI и не только
2710👎1
Иногда ему просто нужно немножко помочь 😁😁😁

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
54611
Все уже видели новый отчёт Мэри Микер? Помнится в 2012-м я предпринимал первые попытки фанд рейзинга используя её прогнозы из такого же.

Тогда он назывался Internet Trends, теперь, понятное дело - AI Trends. В нём всего лишь 339 слайдов и слово "безпрецендентный" встречается всего лишь 51 раз :)

Отчёт в комментариях. Для меня главные идеи следующие: ИИ не пузырь (я и не сомневался), денег жгётся очень много и доход на пользователя всё ещё не велик, но уже очевидно что ИИ будет иметь безпрецендентное влияние на нашу жизнь. Кто больше всех от всего этого выйиграет пока не понятно.

Сейчас распишу чуть подробнее.

Сергей Булаев AI 🤖 - об AI и не только
27831