Сергей Булаев AI 🤖

У Pika новинка - PikaFrames! Теперь можно превращать фотографии в видео с уникальными переходами. Выбираете фотки, а затем объединяете, добавляете переходы и трансформируете. Возможностей - масса. Делал это в Runway полгода назад.

Кроме того, они обновили свою модель до Pika 2.2:

- Нативное разрешение 1080p с улучшенным качеством изображения
- Генерация видео длительностью до 10 секунд

Сергей Булаев AI 🤖 - об AI и не только

172

3.57K views07:37

Сергей Булаев AI 🤖

Aidan (кстати работающий в OpenAI), показал рисованную картинку трём моделям и попросил нарисовать тоже самое. Посмотрите что получилось.

Также у него нашёл пример с прогрессом рисования автопортрета по моделям GPT.

Сергей Булаев AI 🤖 - об AI и не только

105

4.42K views08:44

Сергей Булаев AI 🤖

1:49

This media is not supported in your browser

VIEW IN TELEGRAM

Ровно год назад мой друг Руслан рассказывал мне про идею ИИ-агента, который будет сидеть в браузере и выполнять рутинные действия. И вот, Опера придумала практически то же самое!

Ребята представили (ну типа в видео превью) Browser Operator - ИИ-агента, который понимает инструкции на человеческом языке и выполняет за вас задачи прямо в браузере. Концепт простой, но потенциально меняющий правила игры. Вы даёте указания - он делает.

Что можно поручить такому оператору? Да практически всё:

- Заказать продукты для конкретного блюда
- Найти и купить те самые носки из мериносовой шерсти (которые вы давно хотели)
- Забронировать путешествие мечты

При этом, вы всегда можете вмешаться и взять управление на себя. Нормальный баланс автоматизации и контроля. Считаю идею весьма перспективной!

Сергей Булаев AI 🤖 - об AI и не только

265👎2

4.45K views06:42

Сергей Булаев AI 🤖

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

Новый Hedra Character-3 — первая омнимодальная модель, которая одновременно думает в тексте, картинках и звуке.
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.

Надо тестить самому! Сколько осталось инфлюенсерам?

Сергей Булаев AI 🤖 - об AI и не только

11921

3.56K views10:55

Сергей Булаев AI 🤖

#КриповаяСуббота

Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!

Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!

Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.

Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.

Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.

Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!

Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.

Сергей Булаев AI 🤖 - об AI и не только

29108

4.75K views04:55

Сергей Булаев AI 🤖

1:55

This media is not supported in your browser

VIEW IN TELEGRAM

Играю в Hedra Character 3, глючит жёстко, отказывается от генераций постоянно. С ошибками и без. Просто не создаёт и всё. Но иногда что то прикольное выходит. Хотелось бы стабильности для экспериментов.

Сергей Булаев AI 🤖 - об AI и не только

19112

3.07K views09:47

Сергей Булаев AI 🤖

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Сергей Булаев AI 🤖 - об AI и не только

8632

2.94K views13:10

Сергей Булаев AI 🤖

3:08

This media is not supported in your browser

VIEW IN TELEGRAM

3:08

This media is not supported in your browser

VIEW IN TELEGRAM

Смотрите, первый в мире ИИ-инвестор, выписывает чек на $100k! Зовут её No Cap. 🚫🧢

Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!

Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!

No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.

Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.

UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)

Сергей Булаев AI 🤖 - об AI и не только

1693

2.88K views03:35

Сергей Булаев AI 🤖

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Новый Responses API от OpenAI

OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.

Что в нём клёвого:

- Объединяет возможности обоих API в один интерфейс
- Упрощает интеграцию инструментов по сравнению с Assistants API
- По умолчанию сохраняет историю чата (бесплатно на 30 дней)
- Можно включить режим без состояния (как Chat Completions)

Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.

Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.

Сергей Булаев AI 🤖 - об AI и не только

522

2.56K views06:36

Сергей Булаев AI 🤖

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Разработчики Luma AI забили очередной гвоздь в крышку гроба диффузии. Их новый подход, Inductive Moment Matching (IMM), вроде бы решает фундаментальные ограничения текущих моделей генерации.

Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.

Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.

Сергей Булаев AI 🤖 - об AI и не только

156

2.46K views04:54

Google выпустил Gemma 3 – новую линейку мультимодальных моделей, которые работают как с текстом, так и с изображениями. Поддержка видео пока отсутствует :))

В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.

Технические характеристики:

- Контекстное окно: 128K токенов для крупных моделей и 32K для 1B
- Выходной контекст: до 8192 токенов
- Рейтинг ELO на Chatbot Arena: 1338 (выше DeepSeek V3 671B)
- VRAM для 27B модели: примерно 45GB

На практике есть несколько нюансов:

- Есть проблемы с обещанной поддержкой tool calling
- Модели часто крашатся в

ollama


- Некоторые платформы (например, Transformers) пока не распознают архитектуру
- На AIstudio наблюдаются проблемы с вводом изображений для gemma-3-27b-it

В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.

Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.

Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.

Сергей Булаев AI 🤖 - об AI и не только

102

2.55K views05:21

About

Blog

Apps

Platform