Love. Death. Transformers.

#чтивонаночь собственно год назад это было инновацией(DIT, captioning, куча инструкт синты) А теперь это индустриальный стандарт разработки t2i, sd3 - такой же концептуально Все видео модели концептуально не сильно отличаются - DIT, T5, синтетик кэпшены,…

Вышло демо, по пониманию классно, по эстетике не очень

flux справа для сравнения
генерил тут

✍6🔥1

6.33K views10:44

Love. Death. Transformers.

Вышло демо, по пониманию классно, по эстетике не очень flux справа для сравнения генерил тут

если вы хотите аппелировать к MT возможности без перевода(кто в 24 году гоняет t2i без prompt refiner он же переводчик?) то пожалуйста перестаньте

mt aligment для картиночных моделей - очень сомнительная процедура, проще все делать на английском

👍15✍1

6.68K viewsedited 10:53

Love. Death. Transformers.

Стабилити релизули Sd 3.5 large на 8b параметров!
model
space

Из интересного - модель хуже FLUXа, но не дистилированная. Посмотрим насколько хорошо будет учится

🔥35💩2❤‍🔥1🍓1

7.43K viewsedited 14:08

Love. Death. Transformers.

Стабилити релизули Sd 3.5 large на 8b параметров! model space Из интересного - модель хуже FLUXа, но не дистилированная. Посмотрим насколько хорошо будет учится

отбой, по прежнему с женщинами беда

😁95🍓19🥴14😨6🍌4💔2🔥1💋1

7.76K viewsedited 14:27

Love. Death. Transformers.

Forwarded from воображая кожаных

вы там ебанутые

😁33🤔52🥴1

6.9K views14:59

Love. Death. Transformers.

Я 1 год считаю ELO у вас в моделях - и то 1000, то 1020, а иногда и 1058. Вы там сумасшедшие что ли все?

😁55147🥴4🔥1

6.75K views14:59

Love. Death. Transformers.

3:14

❤‍🔥12🔥5😁5👎1

6.46K views18:25

Love. Death. Transformers.

magnet:?xt=urn:btih:441da1af7a16bcaa4f556964f8028d7113d21cbb&dn=weights&tr=udp://tracker.opentrackr.org:1337/announce
https://www.genmo.ai/

Genmo

Genmo. The best open video generation models.

Genmo trains the world's best open video generation models. Create incredible videos with AI at Genmo

8👍1🔥1🤮1

7.34K views18:25

Love. Death. Transformers.

еще одна новость вышла пока я ужинал и болтал

🔥58😁15👍3

10.3K viewsedited 18:35

Love. Death. Transformers.

еще одна новость вышла пока я ужинал и болтал

в чем проблема? В том что в 80 это по сути каждый 5 ответ - лажа. 49 - каждый второй

21👍12🔥1

6.8K views08:46

Love. Death. Transformers.

ХЗ чего вы все ноете. Вот возьмем меня. Закончил псифак спббгу, работаю скрам-мастером. Выстраиваю процессы по скраму. Вкатился на изичах. Зарплата сейчас - $8к после налогов. Справедливости ради надо сказать, что у меня еще две сдающихся хаты в центре спб, а сам живу у тян. Оттуда капает + иногда довольно часто коучу скраму разные конторы (очень хорошо кодомартышек скрым дисциплинирует + метрики, поэтому все вкатываются). Недавно вот коучил одну из крупнейших гейдев кантор на снг (но не рашка, оналайн дрочильня на воен тематику) - неделя на контракте, две сотни кодомартых на лекциях - единоразовай гонорар по контракту мне - $40к. Собственно вопрос - что вам мешает поступить так же?

110🤡38🔥3417💊13😁10👍2🥱22

7.64K views14:31

Love. Death. Transformers.

Forwarded from неуютный фкнчик

розыгрыш мерча неуютный фкнчик

1 место: футболка «#freekosov»
2 место: 3 презерватива «cuda стандарт индустрии» + стикерпак

для участия надо нажать ниже и подписаться на паблик

результаты в воскресенье 20.10 в полдень

👍58🤡295👎3😁1

6.82K views15:17

Love. Death. Transformers.

Voice message

https://github.com/kijai/ComfyUI-MochiWrapper

Впихнули в 20гб вместо 320

GitHub

GitHub - kijai/ComfyUI-MochiWrapper

Contribute to kijai/ComfyUI-MochiWrapper development by creating an account on GitHub.

🤷‍♂13👍3🔥1

7.31K views20:41

Love. Death. Transformers.

Корейцы на СВО, по телевизору нейросетевые птицы с человеческими яйцами, многотонную ракету сажают на опоры, и всё это под саундтрек из видосов инстаграмма «под залупой творог собрался ребята»

Мы живем в хуёвом романе Пелевина, у нашей действительности лицо кота «не бойся»

👍139😁45🤡1613💯5🤷‍♂4

9.45K views21:30

Love. Death. Transformers.

Корейцы на СВО, по телевизору нейросетевые птицы с человеческими яйцами, многотонную ракету сажают на опоры, и всё это под саундтрек из видосов инстаграмма «под залупой творог собрался ребята» Мы живем в хуёвом романе Пелевина, у нашей действительности лицо…

В следующей главе модели enterprise класса будут управляя сексботами зарабатывать на электричество в борделях

2😁77💯3

7.11K views21:39

Love. Death. Transformers.

Средний бот, и так уже на самом деле умнее среднего человека. В сущности, мы пришли к ситуации, когда модель, которая считается средней, должна: знать математику, иметь word knowledge, знать физику, программирования и прочее по очень разным топикам которые у нее спрашивают. При этом должна быть достаточно эмпатичной, чтобы нравится пользователю. При этом должна знать где-то под сотню языков. Ну например, средняя опенсурсная модель знает 20 языков. Но, в свою очередь, таких людей мало. Выходит, мы достигли General Intelligence, когда вышла GPT-4? То есть, ну, по сути-то, у нас модель умнее, чем средний человек.

1🤔109❤‍🔥28😁19👍18🤡14💯13👎3🔥1

8.19K views15:41

Love. Death. Transformers.

https://github.com/torvalds/linux/pull/988

Что то странное творится в Линуксе, дед не выпил таблетки и творится кринж, удалили 11 русских челов, не очень понятно за что.

А, похуй, банили сотрудников санкицонных компаний.

😁56😢20👍9🤡9🤓4🙈3🐳2💯2😍1😡1

7.31K viewsedited 19:53

Love. Death. Transformers.

еще одна новость вышла пока я ужинал и болтал

Э, ну с этим бенчом все, что у нас на очереди? Агенты?
Ну ща пацаны нагенерят в top256 траекторий решения, выучат и будет вам агентность.

51😁29

7.13K views20:15

Love. Death. Transformers.

Forwarded from Душный NLP

Ограничения Instruction Tuning и как их преодолеть

Supervised Full Fine-tuning (SFT) — распространённая практика, но он не лишён недостатков. Авторы сегодняшней статьи задаются вопросом: а может ли LoRA (Low-Rank Adaptation) исправить недочёты?

При использовании Full Fine-tuning возникает две проблемы: у моделей часто возникают сложности с извлечением новых знаний из SFT-датасета, могут участиться галлюцинации. Исследование показало, что модели, обученные с использованием Full Fine-tuning, могут генерировать неверные ответы, если берут слишком много токенов из SFT-датасетов. Эффект особенно заметен, если модель пытается отвечать на вопросы, требующие глубокой экспертизы.

Например, на вопрос «Какие основные работы Эйнштейн сделал после того, как в 1915 году открыл Общую теорию относительности?» модель начинала выдавать не соответствующие действительности ответы — скажем, о «квантовой теории атома трития».

Одним из возможных решений может быть LoRA — это метод, который позволяет обучать модели с гораздо меньшими ресурсами, модифицируя лишь небольшую часть параметров. Вместо полного тюнинга всех параметров LoRA использует специальные низкоранговые матрицы, что приводит к изменениям только определённых аспектов, таких как стиль ответа или инициирование фраз. При этом основная часть весов предобученной модели остаётся неизменной.

Первые несколько процентов токенов, сгенерированных LoRA-моделью, могут быть изменены (по сравнению с ответом предобученной модели), чтобы правильно начать ответ. Но большая часть предложения остаётся такой же, как у предобученной модели. Это позволяет уменьшить количество галлюцинаций. Эксперименты показали, что LoRA даёт более точные ответы.

LoRA эффективен даже при малом объёме датасета. Например, модель с LoRA, обученная на наборе данных из 1000 инструкций, может превосходить модели с SFT на датасетах по срезам фактологичености и полезности, содержащих 52 000 или даже 326 000 инструкций. В экспериментах использовались различные открытые и домен-специфичные датасеты, включая MedInstruct и Alpaca. Модели с LoRA демонстрировали лучшее соответствие фактам и были менее подвержены галлюцинациям.

Разбор подготовил ❣ Алексей Шимко

Душный NLP

Please open Telegram to view this post

VIEW IN TELEGRAM

50👍24🤡5🔥4👏3🥴1

6.11K views10:55

Love. Death. Transformers.

Forwarded from Старший Авгур

Ларчик с Вихрём Немо просто открывался. Рецепт оказался прост: трейн на тесте.
Я недавно случайно обнаружил, что в GrandMaster-PRO-MAX лежит около 180 промптов и ответов на них из ru_arena_general. А их там всего 500, то есть больше трети примеров из тестов слиты в обучающую выборку. Вполне возможно, что это сделано не только в SFT, но и в SMPO фазе.

Код для проверки:


from datasets import load_dataset

examples = dict()
for row in load_dataset("Vikhrmodels/ru-arena-general", split="train"):
    examples[row["turns"][0]["content"]] = 0

for row in load_dataset("Vikhrmodels/GrandMaster-PRO-MAX", split="train"):
    ex = row["conversation"][0]["content"]
    if ex in examples:
        examples[ex] = 1
print(sum(examples.values()))

Я решил поэкспериментировать и сделал то же самое в SFT. Получил +6 пунктов на арене. Справедливости ради, мне всё равно не удалось догнать Вихрь, но, вероятно, это решается доливом теста в SimPO.

Намеренно ли это было сделано? На 99% уверен, что нет.
Делает ли это Вихрь Немо плохой моделью? Тоже нет.
Но хорошо бы это увидеть в карточке модели, да и с арены модель убрать.

51🤡34👍13

6.67K views11:20

About

Blog

Apps

Platform