Открытия
538 subscribers
1.27K photos
346 videos
14 files
863 links
Собираю сюда музыкальные, визуальные, книжные и прочие открытия. Делюсь тем, что мне показалось интересным.

Мои странички:
http://linktr.ee/abesmon

Донаты сюда: https://boosty.to/smgbuddies/donate
Download Telegram
Forwarded from Denis Sexy IT 🤖
А еще можно взять две картинки и сделать так 🥰
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6
Denis Sexy IT 🤖
А еще можно взять две картинки и сделать так 🥰
если что, там обновление cgpt завезли с возможностью работать с картинками, генерить видосы ну и вообще типа умнее

я cgpt не пользуюсь так что ничего пока тестить не могу. как в бесплатный тир попадет, может что нибудь нагенерирую

самое главное сделать побольше животных с человеческими зубами
👍4
https://youtube.com/playlist?list=OLAK5uy_nzVWk6xAR1SRR6lAuMMtKj5QnyLqS3bQ0&si=ZX1V87bNCLJQr4w2

В portal и portal 2 потрясающие финальные композиции. С разбором композиторской гениальности этих произведений уже сделаны не одно видео-эссе. Но вот чего я не замечал во время прохождения - что в игре вообще-то еще и крайне занятный основной саундтрек!

Я с самого утра сижу слушаю эту красоту и вот решил даже с вами поделиться после того как добрался до https://youtu.be/yCD99mNj1ug?si=RVQ0gq9O5eQtl5hn

Крайне неожиданно слышать, чтобы у ПОП игры был бы настолько незаурядный саундтрек в духе Ryoji Ikeda
15
ну, я (только не раст, а gdscript ну или еще какая нибудь херня)
2
доступ к генерациям изображений с помощью новой системы дали всем смертным, даже без платного аккаунта
🔥6
блин, ну вторая часть видоса это прям мясо.

Думаю, года два еще и бесконечные сериалы категории B, которые крутят по телеку будут генерить именно так
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
ПРОЕКТ: МоЧА

Да, первого апреля только такие новости, но это настоящая... (Пощу с небольшим опозданием)

Можно сказать, это убийца Hedra. Кстати, статейка от ребят из моей команды в Мете.

Проект специализируется на генеративном липсинке по тексту и речи — и генерит не просто говорящую голову, а почти всё тело, включая руки. Это даёт гораздо более живой результат, так как подключается язык тела. Ещё научились делать целый диалог двух или даже более человек (диалог в формате «через плечо» с катом между кадрами, но консистентно). Хотя, примеров не дают.

Это обычная диффузионка, причём тренили без всяких примочек — чисто текст, видео и речь. Из минусов — то, что img2video нативно работать не будет, но потом возможно дотренируют Ещё интересно, что тренили в 4 стадии:
сначала претрейн на чистом text-to-video (примерно 20%, что дало больше динамики в кадре), затем только close-up, а потом потихоньку отдаляли камеру и увеличивали количество людей в кадре, т.к. несколько персонажей генерить сложнее. Ну и ещё изобрели speech-video window attention, которое ограничивает окно внимания модельки для более точного липсинка.

Генерация, конечно же не онлайн.

Пейпер
Project page

@ai_newz
мой любимый мем темплейт подъехал
😁2🤗1
кстати, с появлением гибли фильтра мой мем снова актуален
Forwarded from Открытия
🤡1
надеюсь, это выведет мультимодальность в массы
Forwarded from Адель и МЛь
Llama 4 🦙

Классные размеры, хорошие показатели, огромное контекстное окно, мультимодальность, ризонинг.

https://ai.meta.com/blog/llama-4-multimodal-intelligence/

Коротко:

1. Llama 4 Scout
- 17B активных параметров, 16 экспертов, 109B общих параметров
- Контекст: 10M токенов (в 80 раз больше, чем у Llama 3)
- Лучшая в своём классе на задачах reasoning, long-context, coding и image understanding
- Превосходит: Gemma 3, Gemini 2.0 Flash-Lite, Mistral 3.1


2. Llama 4 Maverick
- 17B активных параметров, 128 экспертов, 400B общих параметров
- Побеждает GPT-4o, Gemini 2.0 Flash
- Сравнима с DeepSeek v3.1, но гораздо эффективнее
- ELO (LMArena): 1417 — один из лучших среди открытых моделей
- Заявлена как лучшая для reasoning, coding и продвинутого мультимодального взаимодействия

3. Llama 4 Behemoth (в разработке)
- 288B активных параметров, 16 экспертов, ~2T общих параметров
- Уже обходит GPT-4.5, Claude Sonnet 3.7, Gemini 2.0 Pro на STEM-бенчмарках
- Используется как teacher-модель для Scout и Maverick. Ключевая роль в distillation и reinforcement learning
открытая модель, которая по очкам на арене подбирается к Claude 3.7 это жесть как мощно.

Но насколько я понимаю, эта модель не для потребительского железа. Не представляю что нужно за железо иметь дома чтобы запустить 400B модельку 🙂

Понятное дело, что будут кванты, но кванты и по мощам будут так себе...

В любом случае очень круто! Ждем кучи файнтюнов в ближайший месяц (в первую очередь ждем, конечно же erotic roleplay модельки :D)
Forwarded from Сиолошная
С контролем стиля без откровений в общем зачёте, а в остальных вроде и высоко, но разброс пока большой (так как голосов мало). Может быть и выше R1/o3-mini, а может и нет.

(Maverick = средняя модель, на 400B параметров, что меньше, чем у DeepSeek)