Сергей Булаев AI 🤖
10.9K subscribers
700 photos
629 videos
2 files
706 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Один из самых популярных ИИ помощников кодеров Claude Dev дорос до версии 2.0 и переименовался в Cline (CLI aNd Editor). Потому что там можно пользоваться не только Клодом видимо. То есть редактор кода и админ. А я его всё так и не попробовал.

Как я понимаю он работает из командной строки в VS (не знаю работает ли в других), как агент с расширенным функционалом, выполняющий поручения по написанию кода. В отличие от Cursor Composer он умеет запускать команды в терминале (с разрешения) и может установить вам модуль, или даже запустить код над которым работает чтобы оценить результаты.

В новой версии ответы потоково отображаются в редакторе с анимацией текста, что позволяет следить за прогрессом Cline при редактировании файлов. На 40% уменьшилось количество запросов при исполнении задач. Также появилась возможность прерывать генерацию и давать обратную связь в реальном времени.

Постоянно вижу его в топе по расходам токенов за день на OpenRouter. Звучит круто, надо пробовать обязательно.

Сергей Булаев AI 🤖 - об AI и не только
11722
Посмотрел инструкцию Luma по трансформации одних фруктов в другие:

How to Morph Food?
Step 1: Use any 2 food photos in same spot.
Step 2: Import photos to First & Last Frame.
Step 3: Type prompt “camera static, the (food 1) transforms into the (food 2)”.
Step 4: Generate video and watch your transition!


И воспользовался ей на Runway. Получается не с первого раза. Иногда с 10-го. Особенно тяжело далась трансформация в Jump. Но мне всё равно нравится.

Сергей Булаев AI 🤖 - об AI и не только
1175
Aria, новая опенсорсная мультимодальная модель от @rhymes_ai способна работать с картинками и видео. По лицензии Apache 2.0! Так же выпустили скрипты файнтюнинга. Работает со скриншотами с кодом, распознаёт рукописный текст, обладает знаниями.

Можно использовать через Huggingface.

Сергей Булаев AI 🤖 - об AI и не только
173
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и текстовые переходы всё теми же инструментами. Просто задаётся начальный и конечный кадр для каждой трансформации. Ну и промты… промты важны, всё решается экспериментами.

Сергей Булаев AI 🤖 - об AI и не только в
1441
Илон Маск представил Cyber Cab Robotaxi - долгожданное автономное такси от Tesla. Запуск в Техасе и Калифорнии в 2025-м. Без наблюдения, без водителей.

Педали и руль - отсутсвуют. Будущее наступило!

Сергей Булаев AI 🤖 - об AI и не только в
23103
This media is not supported in your browser
VIEW IN TELEGRAM
И, в догонку, Tesla Robovan без водителя от @yanadivane!

Сергей Булаев AI 🤖 - об AI и не только
108
Илон Маск:
Я думаю, что Optimus станет самым большим продуктом в истории. Каждый человек на Земле — 8 миллиардов людей — захочет иметь своего приятеля Optimus. Они будут производить продукты и услуги, и я предсказываю 80% вероятность хорошего исхода, если мы решим проблемы рисков, связанных с цифровым суперинтеллектом. Стоимость продуктов и услуг резко снизится, и мы вступим в эпоху изобилия, которую люди никогда даже не могли себе представить. Это будет что-то действительно особенное.


Кстати, недавно выкладывал как Андрей Карпаты рассказывает о том что сначала Оптимусы думали что они автомобили.

Обещают цену $20-30k - это очень круто!

Сергей Булаев AI 🤖 - об AI и роботах
12252
This media is not supported in your browser
VIEW IN TELEGRAM
Рассказываю, как прямо сейчас бесплатно установить и пользоваться LLama 3.2 на вашем iPhone. Оффлайн! Модель крутая, особенно для саммаризаций и других операций с текстом. К сожалению, на русском она так себе.

Итак, Джордан Сингер, занимавшийся Figma AI, основал компанию MainFrame, чтобы создать ни много ни мало LLM OS. Но начать ребята решили с выпуска в опенсорс приложения fullmoon - Swift UI интерфейса к модели LLama 3.2.

Всего 2 шага:
- Устанавливаем
TestFlight
-
Открываем fullmoon в TestFlight и устанавливаем

Всё, работает, проверил сам, но аккуратно! Разогревает телефон до ожогов!

P.S. fullmoon стал возможным благодаря MLX Swift от Apple. MLX — это фреймворк для работы с массивами, предназначенный для исследований в области машинного обучения на процессорах Apple Silicon. Он разработан исследовательской группой машинного обучения Apple.

P.S.S. Записали микроподкаст по теме.

Сергей Булаев AI 🤖 - об AI и роботах
224
В связи с развитием проекта занялся миграцией Flashbacks с AirTable (где он изначально был сделан как прототип) на полноценный SupaBase. Также подключаю туда своего ErrorBot и OpenPanel.

Понял, как удобно заставить Composer поддерживать ASCII-таблички со списком интегрированных событий, а также с прогрессом добавления слоя работы с данными (да, по совету ChatGPT, миграция началась с выделения работы с данными в отдельный слой).

Сергей Булаев AI 🤖 - об AI и не только
1853
Media is too big
VIEW IN TELEGRAM
Сегодня, в связи с официальным анонсом Оптимуса, который уже очень скоро должен быть у каждого, в рубрике #КриповаяСуббота не странное видео, а целый подкаст на тему интимных отношений между человеком и роботом. Получилось неплохо! Даже интересно.

Ребятам я рассказал про анонс, а так же прислал два документа:
Турецкий пейпер: Attachment and Sex with Robots и результаты опроса YouGov

(русская и english версия на YouTube)

Сергей Булаев AI 🤖 - об AI и роботах
1215532
This media is not supported in your browser
VIEW IN TELEGRAM
Уважаемые коллеги! Сегодня нас стало 4000! Вроде бы не много, но уже и не мало… А ведь только в июне нас было всего 250! Хочу вам всем сказать, что для меня это очень важно, то, что вы читаете меня.

Особенности моей личности заставляют постоянно сомневаться в себе, и тормозить, но с каждым новым подписчиком мне становится легче. А чем мне легче - тем больше идей! Спасибо за подписки! Кстати, можете ещё друзьям про мой канал рассказать ;) но это не обязательно, я рад, что вы со мной! Этого уже достаточно!

По этому поводу записали с Suno короткий трек!

Спасибо ещё раз!

Кстати, можете ещё подписаться на мой инстаграм из Таиланда.

Сергей Булаев AI 🤖 - об AI и не только
5158731
This media is not supported in your browser
VIEW IN TELEGRAM
В Штатах политики первого уровня не стеснясь напрямую говорят о сокращениях связанных с внедрением ИИ как в ручном, так и офисном труде (не забывая упомянуть про безусловных доход - UBI)

В это время TikTok уже сокращает сотни сотрудников по всему миру, а особенно в Малайзии, где были уволены около 500 человек. Основная часть уволенных занималась модерацией контента. Эти сокращения связаны с планами компании усилить использование искусственного интеллекта в модерации.

ByteDance, владелец TikTok, планирует провести еще больше сокращений в следующем месяце, чтобы оптимизировать региональные операции. Компания инвестирует $2 млрд в глобальные меры проверок и безопасности в этом году, с акцентом на автоматизацию модерации.

Сокращения также произошли на фоне усиления давления на технологические компании со стороны властей Малайзии, которые требуют получения всяких дополнительных лицензий.

Сергей Булаев AI 🤖 - об AI и не только
15431
This media is not supported in your browser
VIEW IN TELEGRAM
@OpenAI выложили Swarm — лайтовую библиотеку для создания мульти агентных систем. Swarm предоставляет абстрактный слой для управления взаимодействием и передачей управления между агентами и не использует API Assistants.

Swarm не является официальным продуктом, создатели просят рассматривать как пример экспериментов по мотивам мультиагентного кукбука OpenAI (посмотрите, интересно)

Как оно работает:

1️⃣ Определите агентов, у каждого из которых есть свои инструкции, роль (например, "Агент по продажам") и доступные функции (будут преобразованы в JSON-структуры).

2️⃣ Определите логику передачи управления другому агенту на основе хода беседы или определенных критериев в функциях агента. Передача управления осуществляется простым возвращением следующего агента, которого следует вызвать в функции.

3️⃣ Контекстные переменные предоставляют начальный контекст и обновляются в ходе беседы для поддержания состояния и обмена информацией между агентами.

4️⃣ Функция run() клиента инициирует и управляет мультиагентной беседой. Для этого требуется начальный агент, сообщения пользователя и контекст, и возвращает ответ с обновленными сообщениями, контекстными переменными и последним активным агентом.

Инсайты:

🔄 Swarm управляет циклом взаимодействий агентов, вызовами функций и возможными передачами управления.
🧩 Агенты инкапсулируют инструкции, доступные функции (инструменты) и логику передачи управления.
🔌 Фреймворк не сохраняет состояние между вызовами, предоставляя прозрачность и тонкий контроль.
🛠️ Swarm поддерживает прямой вызов функций Python внутри агентов.
📊 Контекстные переменные позволяют управлять состоянием в ходе взаимодействий агентов.
🔄 Передачи управления между агентами позволяют динамически переключаться между специализированными агентами.
📡 Поддерживаются потоковые ответы для взаимодействия в реальном времени.
🔧 Гибкий и работает с любым клиентом OpenAI, например, Hugging Face TGI или моделями, размещенными на vLLM.

По мотивам, на видео парень строит RAG агента на базе Swarm

Сергей Булаев AI 🤖 - об AI и не только
2564