This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
У Pika новинка - PikaFrames! Теперь можно превращать фотографии в видео с уникальными переходами. Выбираете фотки, а затем объединяете, добавляете переходы и трансформируете. Возможностей - масса. Делал это в Runway полгода назад.
Кроме того, они обновили свою модель до Pika 2.2:
Сергей Булаев AI 🤖 - об AI и не только
Кроме того, они обновили свою модель до Pika 2.2:
- Нативное разрешение 1080p с улучшенным качеством изображения
- Генерация видео длительностью до 10 секундСергей Булаев AI 🤖 - об AI и не только
Aidan (кстати работающий в OpenAI), показал рисованную картинку трём моделям и попросил нарисовать тоже самое. Посмотрите что получилось.
Также у него нашёл пример с прогрессом рисования автопортрета по моделям GPT.
Сергей Булаев AI 🤖 - об AI и не только
Также у него нашёл пример с прогрессом рисования автопортрета по моделям GPT.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Ровно год назад мой друг Руслан рассказывал мне про идею ИИ-агента, который будет сидеть в браузере и выполнять рутинные действия. И вот, Опера придумала практически то же самое!
Ребята представили (ну типа в видео превью) Browser Operator - ИИ-агента, который понимает инструкции на человеческом языке и выполняет за вас задачи прямо в браузере. Концепт простой, но потенциально меняющий правила игры. Вы даёте указания - он делает.
Что можно поручить такому оператору? Да практически всё:
При этом, вы всегда можете вмешаться и взять управление на себя. Нормальный баланс автоматизации и контроля. Считаю идею весьма перспективной!
Сергей Булаев AI 🤖 - об AI и не только
Ребята представили (ну типа в видео превью) Browser Operator - ИИ-агента, который понимает инструкции на человеческом языке и выполняет за вас задачи прямо в браузере. Концепт простой, но потенциально меняющий правила игры. Вы даёте указания - он делает.
Что можно поручить такому оператору? Да практически всё:
- Заказать продукты для конкретного блюда
- Найти и купить те самые носки из мериносовой шерсти (которые вы давно хотели)
- Забронировать путешествие мечтыПри этом, вы всегда можете вмешаться и взять управление на себя. Нормальный баланс автоматизации и контроля. Считаю идею весьма перспективной!
Сергей Булаев AI 🤖 - об AI и не только
Новый Hedra Character-3 — первая омнимодальная модель, которая одновременно думает в тексте, картинках и звуке.
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.
Надо тестить самому! Сколько осталось инфлюенсерам?
Сергей Булаев AI 🤖 - об AI и не только
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.
Надо тестить самому! Сколько осталось инфлюенсерам?
Сергей Булаев AI 🤖 - об AI и не только
1 19 2 1
#КриповаяСуббота
Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!
Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!
Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.
Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.
Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.
Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!
Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.
Сергей Булаев AI 🤖 - об AI и не только
Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!
Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!
Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.
Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.
Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.
Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!
Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Играю в Hedra Character 3, глючит жёстко, отказывается от генераций постоянно. С ошибками и без. Просто не создаёт и всё. Но иногда что то прикольное выходит. Хотелось бы стабильности для экспериментов.
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Сергей Булаев AI 🤖 - об AI и не только
Смотрите, первый в мире ИИ-инвестор, выписывает чек на $100k! Зовут её No Cap. 🚫🧢
Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!
Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!
No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.
Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.
UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)
Сергей Булаев AI 🤖 - об AI и не только
Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!
Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!
No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.
Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.
UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Новый Responses API от OpenAI
OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.
Что в нём клёвого:
Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.
Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.
Сергей Булаев AI 🤖 - об AI и не только
OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.
Что в нём клёвого:
- Объединяет возможности обоих API в один интерфейс
- Упрощает интеграцию инструментов по сравнению с Assistants API
- По умолчанию сохраняет историю чата (бесплатно на 30 дней)
- Можно включить режим без состояния (как Chat Completions)Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.
Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчики Luma AI забили очередной гвоздь в крышку гроба диффузии. Их новый подход, Inductive Moment Matching (IMM), вроде бы решает фундаментальные ограничения текущих моделей генерации.
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Google выпустил Gemma 3 – новую линейку мультимодальных моделей, которые работают как с текстом, так и с изображениями. Поддержка видео пока отсутствует :))
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
На практике есть несколько нюансов:
В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
- Контекстное окно: 128K токенов для крупных моделей и 32K для 1B
- Выходной контекст: до 8192 токенов
- Рейтинг ELO на Chatbot Arena: 1338 (выше DeepSeek V3 671B)
- VRAM для 27B модели: примерно 45GBНа практике есть несколько нюансов:
- Есть проблемы с обещанной поддержкой tool calling
- Модели часто крашатся в ollama
- Некоторые платформы (например, Transformers) пока не распознают архитектуру
- На AIstudio наблюдаются проблемы с вводом изображений для gemma-3-27b-itВ поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только