Love. Death. Transformers.

Мне очень нравится что до сих пор в image/video gen работах используется ul2/т5 при том что для nlp их эмбеды прям говно

👍317🥱64🍓3❤‍🔥1🔥1😁1

7.29K views06:23

Love. Death. Transformers.

Мне очень нравится что до сих пор в image/video gen работах используется ul2/т5 при том что для nlp их эмбеды прям говно

moviegen фбшный

примеру:
- авторы собрали буквально пачку контента на которых старые video gen модели плохо работали и разметили
- проверили чтобы 60% данных содержали людей(sic!!!)
- выкинули всякие сомнительные классы движения
- учили biderectional llama и сами пишут: "we don't explore design choice" те прикинули да, китайская лаба с бюджетом два доширака может позволить себе 1б модель погонять и проверить, а что лучше работаеи, а что хуже, а meta нет))
- "параграф для флекса инфрой" - просто существует
- данные это по сути масштабированный panda 70m
- усреднили sft чекпоинт с претрен.
- evaluation мне лично не особо интересен, забейте, все всех победили

👍22😁14❤‍🔥2🍓2🔥1👏1

7.59K views06:43

Love. Death. Transformers.

Мы тут наукой занимаемся, точно не stack more layers

😁45❤‍🔥4🔥3🍓3💯1

8.96K viewsedited 07:02

Love. Death. Transformers.

Meanwhile random Chinese student

https://pyramid-flow.github.io/

https://huggingface.co/rain1011/pyramid-flow-sd3

pyramid-flow.github.io

Pyramid Flow

Pyramidal Flow Matching for Efficient Video Generative Modeling

🔥63😁12

10.5K viewsedited 09:33

Love. Death. Transformers.

Meanwhile random Chinese student https://pyramid-flow.github.io/ https://huggingface.co/rain1011/pyramid-flow-sd3

This media is not supported in your browser

VIEW IN TELEGRAM

🔥38

8.62K views10:37

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

Вчера было robotaxi party Илона маска, держите краткий пересказ

😁74

7.6K viewsedited 09:02

Love. Death. Transformers.

Forwarded from .ml

Шо пацаны, вращаем и масштабируем!

Сейчас самый популярный метод позиционного кодирования в LLM’ках и не только — это RoPE. Но глубокому исследованию влияния параметров RoPE на поведение и свойства итоговой модели уделяется довольно мало внимания.

В статье “Scaling Laws of RoPE-based Extrapolation” ребята исследовали влияние выбора параметра rope base на поведение модели при разном размере контекста.

А еще:

📌 Ввели концепцию critical dimension, которая чуть-чуть приводит в порядок теорию про адаптацию RoPE для Train Short Test Long сценариев.
📌 Пофлексили тем, что “we achieve extrapolation up to 1 million context length within only 16K training length on LLaMA2 7B and 13B” — но есть нюанс 🙃

Основные интересные моменты:

- Маленькие rope base из коробки ведут к лучшей устойчивости к длинам контекста, которых не было в трейне, но при этом работают хуже на длинах, которые были в трейне.

- Есть понятный способ вычислить оптимальные rope base, если хочется сделать его маленьким.

- Большие rope base неустойчивы к длинам контекста, которых не было в трейне, но при этом работают лучше на длинах, которые были в трейне.

- Есть понятный способ вычислить оптимальный rope base, если хочется сделать его большим. Для этого нужно знать, на какой максимальной длине сиквенсов будет учиться модель, и на какой максимальной длине сиквенсов она будет работать на тесте.

- Пусть есть вектор размерности d для репрезентации какого-то query или key внутри башки атеншена. Тогда будет существовать d_extra, и во время претрейна позиционная информация в измерениях d_i ≤ d_extra будет полностью выучена, а в измерениях d_i > d_extra будет выучена не полностью и потребует дальнейших упражнений с адаптацией.

Велкам в полную версию статьи — давайте в комментариях обсудим, кто что полезное в ней нашел.

👍22💅4❤‍🔥3🤡1🍓1

8.94K views18:54

Love. Death. Transformers.

DL это наука, да я учёный, да что вы мне сделаете, зачем вам дилдо, ой да ладно я же пошутил...

😁79💯11

8.45K viewsedited 19:08

Love. Death. Transformers.

Forwarded from КПД

Из реализации FLUX в diffusers

😁95🥴20

7.73K views19:10

Love. Death. Transformers.

Ахуеть вышел альбом Пошлой Молли...

13🤡105🔥36👎17💩16🍓5👍4❤‍🔥3🤔2🍌2

7.89K views17:00

Love. Death. Transformers.

Чёт давно обзоров статей не было

😁104👍10🔥10😢3👎2🍓1

7.56K views07:09

Love. Death. Transformers.

Кстати согласно этой кривой MJ v7 должна уметь ещё лучше фоловить промпты и управлять мелкими деталями (ну там какие пальцы согнуты, цвет ресниц и тд. Скейлинг же экспоненциальный)

😁55🤡10🔥1

7.06K viewsedited 22:15

Love. Death. Transformers.

Forwarded from Эта нейросеть обучалась 37 лет (Катерина Бек)

День 13. HORIZON.

❤‍🔥31💩6🤡2🤮1😨1

6.5K views23:00

Love. Death. Transformers.

Oh, sweet child

Мне безумно нравится что вчерашние веб3 каналы стали резко про ai + eacc писать

От 500к год
@
Без пеработок
@
В долине

Блин, не я не могу перестать ржать, это очень забавно

Круче только экспоненциальный рост систем

Вложи 100, получи 10 это же почти экспонента почти, да? Не логарифм же?

Мы увидим модели сильнее, но кхм, сроки до 27 года аги довольно оптимистичны. В конце концов sonnet может шитпостить в Твиттер, почти аги

😁93💯18👍5💅4🤡2

7.12K viewsedited 23:02

Love. Death. Transformers.

#чтивонаночь

MLE-BENCH@openai

Собственно идея такая: давайте будем агентом решать kaggle соревки старые пока llm не решит)

- 75 соревнований
- 1 карта

Ллама 405б ожидаемо оказалась слегка похуже, o1 preview лучше других(хотя интересно построить compute кривые)

Ожидаемо от увелечения числа попыток качество растет log_рифмически.

папир

👍30👎3

7.17K viewsedited 09:41

Love. Death. Transformers.

Любопытный блогпост про починку gradient accumulation у unsloth

Blog

👍30🔥141

7.29K viewsedited 06:25

Love. Death. Transformers.

wait what

🔥6630🍓5🤮2👎1🤡1

6.67K views14:13

Love. Death. Transformers.

#чтивонаночь по быстрому Если ресерч не избежен, ресерчить надо первым. Pixart-alpha aka dalle3 для нищих Если вы сталкивались с претреном диффузий то знаете словосочетание laion - залупа коня. Почему? Потому что это стянутые картинки и captionы со скрауленных…

#чтивонаночь собственно год назад это было инновацией(DIT, captioning, куча инструкт синты) А теперь это индустриальный стандарт разработки t2i, sd3 - такой же концептуально
Все видео модели концептуально не сильно отличаются - DIT, T5, синтетик кэпшены, куча возни с данными.

Собственно ex авторы PixArt ушли в Nvidia и сделали Sana - очень маленькую и очень бодрую(на бумаге) модель

Из интересного

- VAE теперь сжимает не х8 а х32(те нативно генерит 4к картинки)
- 1s на картинку локально на laptop GPU
- Linear DIT, по сути выкинули ATTN и махнули на 3x3 свертки
- Gemma вместо T5, что вообще очень нестандартно

рассуждать про перфоманс без собственных тестов, а главное FT я не готов, 600м dit это все еще очень мало, возможно у модели есть нюансы.

В любом случае любопытная работа, ознакомьтесь

paper

arXiv.org

SANA: Efficient High-Resolution Image Synthesis with Linear...

We introduce Sana, a text-to-image framework that can efficiently generate images up to 4096$\times$4096 resolution. Sana can synthesize high-resolution, high-quality images with strong text-image...

👍20🔥9🤔2💩1

7.39K views16:11

Love. Death. Transformers.

погодите это агент??

1😁62🌚10💯6👍2

6.49K views18:12

Love. Death. Transformers.

погодите это агент??

агент на gigachain
иноагент на langchain

😁94❤‍🔥7💩1

6.45K views18:15

Love. Death. Transformers.

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

В Суно присунули image2music и video2music!

Мы привыкли, что на вход текстовые промпты, ну и может быть аудио референс.

Суно решили заигрывать с мемасной аудиторией и новыми нормальными зумерами.

Типа озвучь свой мемас.

С точки зрения монетизации и стартапности - очень нарядный шаг.

Но если вы в музыку, то тут ничего нового.

Но зато у Суно будет больше денег. И лучше качество на итоге.

Какашка на торте.
Только иос-приложение.
Только в Штатах. Даже в Канаде не работает.
Твиттор Суно разрывается от возмущенных индусов.
Суно отшучиваются "усе будет скоро".

Ну и старую школу учили, что монтируем видео под музику, а не музику под видео.

Вот вам плейлист озвученых мемасов
https://suno.com/song/377d0638-ca5f-4f97-b452-7b8c9d32fe6d

@cgevent

1💅25😁3🥴3👍2🔥2

5.83K views18:28

About

Blog

Apps

Platform