This media is not supported in your browser
VIEW IN TELEGRAM
Автор артефакта для генерации палитр для Midjounrey пошёл ещё дальше и сделал генератор палитр на базе картинок.
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
Рассел Каплан (новый президент Cognition AI, компании, которая делает агента-программиста Devin), помечтал в X о будущем программирования:
Модели ИИ будут невероятно эффективными в написании кода. Исследовательские лаборатории инвестируют сейчас значительные ресурсы в это.
Программирование имеет уникальный потенциал для сверхчеловеческого масштабирования данных через самообучение. Модели ИИ могут писать код, запускать его и проверять результаты.
В то время как другие области сталкиваются с ограничениями человеческим опытом, код может быть проверен эмпирически и автоматически, что открывает новые возможности для обучения ИИ.
Появятся настоящие агенты-кодировщики, выполняющие задачи от начала до конца. Это дополнит существующие ИИ-помощники, давая каждому инженеру "армию стажеров".
Разработчики будут делегировать базовые задачи ИИ-агентам, фокусируясь на высокоуровневых аспектах: понимании требований, архитектуре систем и принятии решений.
Создание ПО станет в 10 раз доступнее, что приведет к распространению одноразового ПО - уникальных приложений и сайтов для конкретных задач.
Количество разработчиков увеличится, но их работа изменится: больше работы на человеческом языке, меньше шаблонного кодирования.
Компании начнут продвигать свои продукты не только разработчикам, но и ИИ-агентам, которые будут влиять на выбор технологий.
В мире, где разработка ускорится, MVP станут менее привлекательными.
Инфраструктура тестирования станет критически важной с ростом использования ИИ-агентов в разработке.
ИИ-агенты облегчат миграцию между технологиями, что повлияет на конкурентные преимущества технологических компаний.
Никогда еще не было лучшего и более продуктивного времени для тех, кто создает новые продукты и решения.
Сергей Булаев AI 🤖 - об AI и будущем
Модели ИИ будут невероятно эффективными в написании кода. Исследовательские лаборатории инвестируют сейчас значительные ресурсы в это.
Программирование имеет уникальный потенциал для сверхчеловеческого масштабирования данных через самообучение. Модели ИИ могут писать код, запускать его и проверять результаты.
В то время как другие области сталкиваются с ограничениями человеческим опытом, код может быть проверен эмпирически и автоматически, что открывает новые возможности для обучения ИИ.
Появятся настоящие агенты-кодировщики, выполняющие задачи от начала до конца. Это дополнит существующие ИИ-помощники, давая каждому инженеру "армию стажеров".
Разработчики будут делегировать базовые задачи ИИ-агентам, фокусируясь на высокоуровневых аспектах: понимании требований, архитектуре систем и принятии решений.
Создание ПО станет в 10 раз доступнее, что приведет к распространению одноразового ПО - уникальных приложений и сайтов для конкретных задач.
Количество разработчиков увеличится, но их работа изменится: больше работы на человеческом языке, меньше шаблонного кодирования.
Компании начнут продвигать свои продукты не только разработчикам, но и ИИ-агентам, которые будут влиять на выбор технологий.
В мире, где разработка ускорится, MVP станут менее привлекательными.
Инфраструктура тестирования станет критически важной с ростом использования ИИ-агентов в разработке.
ИИ-агенты облегчат миграцию между технологиями, что повлияет на конкурентные преимущества технологических компаний.
Никогда еще не было лучшего и более продуктивного времени для тех, кто создает новые продукты и решения.
Сергей Булаев AI 🤖 - об AI и будущем
Media is too big
VIEW IN TELEGRAM
Anysphere, стартап от студентов MIT, работающий над конкурентом Copilot от Github - IDE Cursor (написан на базе Visual Studio), привлек более $60 млн в раунде Series A, что подняло оценку компании до $400 млн. Раунд вели Andreessen Horowitz и Thrive Capital, а также CEO Stripe Патрик Коллисон. Ранее Anysphere уже получил $11 млн в seed-раунде от OpenAI Startup Fund и других инвесторов.
Интерес к ИИ-ассистентам для кодирования растет: Microsoft сообщает, что выручка от GitHub Copilot уже превышает доходы самого GitHub на момент его покупки, а это означает, что около 30 млн разработчиков ежегодно платят Microsoft $100 за этот инструмент.
Я сам давано пользуюсь Cursor, но умудряюсь ещё и использовать Copilot внутри него, тоесть плачу за всё. Вместе веселее :)
Сергей Булаев AI 🤖 - об AI и программировании
Интерес к ИИ-ассистентам для кодирования растет: Microsoft сообщает, что выручка от GitHub Copilot уже превышает доходы самого GitHub на момент его покупки, а это означает, что около 30 млн разработчиков ежегодно платят Microsoft $100 за этот инструмент.
Я сам давано пользуюсь Cursor, но умудряюсь ещё и использовать Copilot внутри него, тоесть плачу за всё. Вместе веселее :)
Сергей Булаев AI 🤖 - об AI и программировании
Red Ventures продает новостной сайт CNET компании Ziff Davis за более чем $100 млн. Интересно, что более 20 лет назад CNET покупал Ziff Davis за $1,6 млрд (ZDNet).
Сегодня Ziff Davis - публичная компания стоимостью $1,94 млрд. За последние десятилетия она пережила банкротство, смену владельцев и трансформацию бизнеса.
Мне вот тоже, как то друг предлагал купить у него, проданный мной в 11-м году, проект Интернетные штучки (между прочим блог года 2008) за сумму примерно в 20 раз меньшую чем продал его я (не знаю почем купил он, он покупал у тех кому продал я), но я тогда сказал что возьму назад только бесплатно 🙂 С тех пор, как понимаю, проект окончательно исчез.
Мир медиа очень изменчив, радует, что у Лайфхакера всё относительно хорошо. Выпивал с покупателем в апреле, вроде до сих пор доволен покупкой (уже больше 3х лет прошло).
Сергей Булаев AI 🤖 - об AI и контенте
Сегодня Ziff Davis - публичная компания стоимостью $1,94 млрд. За последние десятилетия она пережила банкротство, смену владельцев и трансформацию бизнеса.
Мне вот тоже, как то друг предлагал купить у него, проданный мной в 11-м году, проект Интернетные штучки (между прочим блог года 2008) за сумму примерно в 20 раз меньшую чем продал его я (не знаю почем купил он, он покупал у тех кому продал я), но я тогда сказал что возьму назад только бесплатно 🙂 С тех пор, как понимаю, проект окончательно исчез.
Мир медиа очень изменчив, радует, что у Лайфхакера всё относительно хорошо. Выпивал с покупателем в апреле, вроде до сих пор доволен покупкой (уже больше 3х лет прошло).
Сергей Булаев AI 🤖 - об AI и контенте
Консольный инструмент (автор), позволяет 🛠️ преобразовать любой PDF-документ, вне зависимости от его сложности (включая файлы с текстом, таблицами и изображениями) 📄 в читаемый языковыми моделями Markdown прямо на вашем диске.
Всё это с помощью одной простой команды в терминале! 🖥️✨
Основано на LlamaParse — крутом API🚀 для парсинга документов, предназначенных для LLM.
(до 1000 страниц в день бесплатно, платный план - 7000 страниц в неделю + 0,3 центра за каждую следующую)
Сергей Булаев AI 🤖 - об AI и не только
Всё это с помощью одной простой команды в терминале! 🖥️✨
Основано на LlamaParse — крутом API
(до 1000 страниц в день бесплатно, платный план - 7000 страниц в неделю + 0,3 центра за каждую следующую)
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Так, всё, завтра в 8 вечера по Москве ждём новую архитектуру и начало сингулярности
Источник проверенный.
Сергей Булаев AI 🤖 - об AI и не только
Источник проверенный.
Сергей Булаев AI 🤖 - об AI и не только
Media is too big
VIEW IN TELEGRAM
Пьетро Ширано переделал свой Calude Engineer в Omni Engineer.
Очевидно что можно использовать разные👯♂️ модели, но это не всё. Теперь инженер больше общается в с вами в процессе работы. Причём можно использовать две разных модели одновноременно, одну для создания инструкций 🙋 , другую - для исполнения 💪 . В видео Claude думает, а Gemini - исполняет.
Ещё из интересных функций - возможность редактировать несколько файлов с кодом одновременно, работа с изображениями🍒 (считывание информации), поиск через DuckDuckGo и возможность сохранять историю общения с агентом, для дальнейшего использования в других местах.
В видео, Пьетро кстати, очень наглядно показывает как инструмент можно использовать. Посмотрите.
Сергей Булаев AI 🤖 - об AI и не только
Очевидно что можно использовать разные
Ещё из интересных функций - возможность редактировать несколько файлов с кодом одновременно, работа с изображениями
В видео, Пьетро кстати, очень наглядно показывает как инструмент можно использовать. Посмотрите.
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Snap (Snapchat) подала заявку на патент на технологию голосового управления для своих AR-очков 😎 , где ключевая фраза "Эй, Spectacles" будет активировать интерфейс, а сложные команды обрабатываются на внешних серверах ☁️. Кроме того есть технология быстрой связи слов и приложений.
Snap выпускает очки с 2016-го, но особого успеха они не имеют. Попытки использовать ИИ логичны. В отличие от Meta, чьи очки с Ray-Ban пока не поддерживают дополненную реальность 👓 (хотя работы ведутся), Snap старается эксплуатировать AR по полной.
Сергей Булаев AI 🤖 - об AI и VR
Snap выпускает очки с 2016-го, но особого успеха они не имеют. Попытки использовать ИИ логичны. В отличие от Meta, чьи очки с Ray-Ban пока не поддерживают дополненную реальность 👓 (хотя работы ведутся), Snap старается эксплуатировать AR по полной.
Сергей Булаев AI 🤖 - об AI и VR
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Тут ребята представили новый метод для разбора анимированной графики на отдельные спрайты 🎨 ✨.
🚀 😌 🤖 🔍 🖼️
Как это работает?🤔
🎨 🔧 🎉
Вот здесь можно посмотреть пэйпер, а так же готовый код💻 🔥.
Сергей Булаев AI 🤖 - об AI и не только
1. Был собран набор данных
Crello Animation, содержащий сотни профессионально созданных анимированных графических видео (их делали в основном для ТикТока и Инсты)
. Это дало материал для тестирования и оценки метода 🧪.
2. Ключевая идея - представить каждый спрайт как комбинацию статичной текстуры и параметров анимации 💡. Это упрощает задачу по сравнению с попытками разложить каждый кадр отдельно
.
3. Использовали несколько ИИ-моделей
:
- Модель сегментации видео (TAM) для начального выделения объектов
- Нейронную сеть (U-Net) для улучшения качества текстур
- Алгоритмы оптимизации для точной настройки параметров ⚙️
Как это работает?
1. Пользователь выделяет объекты на одном кадре 👆
2. ИИ отслеживает эти объекты на протяжении всего видео 👀
3. Система создает начальные варианты текстур и параметров анимации
4. Запускается процесс оптимизации, который уточняет все параметры
5. В результате получаются отдельные спрайты с текстурами и анимацией
Вот здесь можно посмотреть пэйпер, а так же готовый код
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3 музыкальных AI видео от Ray, прошлогоднего финалиста конкурса Runway Gen:48 (кстати видео финалистов конкурса этого года тоже стоит посмотреть).
- музыкальное anime (мой сын делает их уже много лет, только вручную, и каждый раз тратит часы и даже дни)
- первая ежегодная конвенция для нереальных людей
- на и просто эксперементы с midjourney + runway
Сергей Булаев AI 🤖 - об AI и не только
- музыкальное anime (мой сын делает их уже много лет, только вручную, и каждый раз тратит часы и даже дни)
- первая ежегодная конвенция для нереальных людей
- на и просто эксперементы с midjourney + runway
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Эмоции... by Jer at EccentrismArt
Смотреть со звуком!🤔 🤔 🤔
🌄 Midjourney
🌃Upscale with @Magnific_AI
🎥 Runway Gen-3
🗣️Voice2Voice: @elevenlabsio
🫦Lipsync LivePortrait
😊Video face upscale in Remini.
💇Masked LivePortrait были артефакты по углам
Сергей Булаев AI 🤖 - об AI и не только
Смотреть со звуком!
🌄 Midjourney
🌃Upscale with @Magnific_AI
🎥 Runway Gen-3
🗣️Voice2Voice: @elevenlabsio
🫦Lipsync LivePortrait
😊Video face upscale in Remini.
💇Masked LivePortrait были артефакты по углам
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Так, ну что там, 8 по москве уже близко? Стоит ждать? У меня просто 11-й час, боюсь не досижу....
Что бы не уснуть, расскажу тему...
Давно думаю об омниканальности, ну в том смысле, что создаваемый тобой контент должен расходиться по разным платформам. Тоесть вот есть Telegram. Для меня - это основа - я пишу сюда. Есть понимание, что дальше из этих постов должны делаться твиты, youtube шортс, instagram stories, ТикТоки итд... Понятное дело что делать их в идеале должны AI агенты.
Думаю давно, а к действиям приступил на выходных - начал писать бота, который каждый мой пост в канале превращается в пост в твиттере. Начал, но не дописал, но ради эксперементальной практики решил пока делать это всё в ручную (вернее в текущем состоянии мне сейчас бот присылает в личку уже посты для твиттера). В результате впервые за долгое время выложил в твиттере пост на тему Omni Engineer. Получились прикольные результаты. Радуюсь.
Обещаю, когда научусь это всё автоматизировать - со всеми поделюсь :)
Сергей Булаев AI 🤖 - об AI и не только
Давно думаю об омниканальности, ну в том смысле, что создаваемый тобой контент должен расходиться по разным платформам. Тоесть вот есть Telegram. Для меня - это основа - я пишу сюда. Есть понимание, что дальше из этих постов должны делаться твиты, youtube шортс, instagram stories, ТикТоки итд... Понятное дело что делать их в идеале должны AI агенты.
Думаю давно, а к действиям приступил на выходных - начал писать бота, который каждый мой пост в канале превращается в пост в твиттере. Начал, но не дописал, но ради эксперементальной практики решил пока делать это всё в ручную (вернее в текущем состоянии мне сейчас бот присылает в личку уже посты для твиттера). В результате впервые за долгое время выложил в твиттере пост на тему Omni Engineer. Получились прикольные результаты. Радуюсь.
Обещаю, когда научусь это всё автоматизировать - со всеми поделюсь :)
Сергей Булаев AI 🤖 - об AI и не только
Google представил Gemini Live — расширенный режим голосового общения для Gemini. Он нацелен на создание более естественных и интерактивных разговоров с пользователями.
На данный момент Gemini Live уже доступен на английском языке для пользователей Android, подписанных на Gemini Advanced. Однако Google планирует другие языки и платформы, включая iOS.
Очевидна конкуренция с Advanced Voice Mode от OpenAI. Компания подчеркивает возможности своего бота для более "человечных" взаимодействий.
Вот здесь Джоанна Стерн из WSJ пробует им пользоваться, посмотрите с 1:40
Сергей Булаев AI 🤖 - об AI и не только
На данный момент Gemini Live уже доступен на английском языке для пользователей Android, подписанных на Gemini Advanced. Однако Google планирует другие языки и платформы, включая iOS.
Очевидна конкуренция с Advanced Voice Mode от OpenAI. Компания подчеркивает возможности своего бота для более "человечных" взаимодействий.
Вот здесь Джоанна Стерн из WSJ пробует им пользоваться, посмотрите с 1:40
Сергей Булаев AI 🤖 - об AI и не только