Love. Death. Transformers. – Telegram

Love. Death. Transformers.

@lovedeathtransformers

22.5K subscribers

4.27K photos

499 videos

76 files

2.79K links

❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.

Download Telegram

About

Blog

Apps

Platform

Love. Death. Transformers.

22.5K subscribers

Love. Death. Transformers.

Forwarded from Техножрица 👩‍💻👩‍🏫👩‍🔧

Коллеги из команды выпустили технический отчет по обученной ими небольшой LLM под названием Гамаюн (рис.1) с 1.5B параметров и тренировкой с нуля на всего лишь 2.5T токенах: https://arxiv.org/abs/2512.21580 . Модель мультилингвальна и имеет фокус на русском языке. На ряде бенчмарков она превосходит Qwen2.5-1.5B и сравнима с Qwen3-1.7B, несмотря на то, что последние обучены на корпусах намного большего размера (18T - 36T). Модель также является SoTA на MERA (русскоязычный бенч) среди LLM размера 1-2B параметров.

К сожалению, веса в открытый доступ пока что выложить не разрешили, но должны разрешить выложить их для новой версии модели, которая ожидается через несколько месяцев. В утешение можно почитать технический отчет и узнать, как натренировать LLM с нуля с небольшим компьютом на небольшом количестве токенов! А еще можно почитать скрины диалогов с разными ранними версиями модели, полученных до полного завершения тренировки (рис. 2-10). 😼 Даже жалко, что итоговая версия стала более нормисной и теперь выдает подобные приколы намного реже... 😒

#объяснения_статей

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🥴73😁17👍14💩8🔥4💊3🎉2

7.83K views08:54

Love. Death. Transformers.

Я наблюдал несколько часов подряд как человек не может с Клод кодом обучить классификатор потому что решил что надо учить классификатор с помощью self play rl.

Я пожалуй останусь на своём:
"Если вы знаете что делаете то ассистенты дают х10, если вы ничерта не понимаете - вероятно у вас ничего не будет работать и будут галюцинации"

😁116💯42🤔3🔥1🌚1🙉1

8.77K views13:54

Love. Death. Transformers.

Love. Death. Transformers.

Я наблюдал несколько часов подряд как человек не может с Клод кодом обучить классификатор потому что решил что надо учить классификатор с помощью self play rl. Я пожалуй останусь на своём: "Если вы знаете что делаете то ассистенты дают х10, если вы ничерта…

🤪77😁397🤷‍♂6🔥4💊3

9.07K views14:12

Love. Death. Transformers.

Media is too big

VIEW IN TELEGRAM

ИИ ОТНИМАЕТ У НАС САМОЕ ДОРОГОЕ

Майнкрафт на новогодних. Чел подключил Майнкрафт к opencode и теперь ллм играет в Майнкрафт.

Github

😭60👍10🔥5🤔4🌭4💋1🗿1

9.78K views14:50

Love. Death. Transformers.

Forwarded from underground (Konstantin Korolev)

https://x.com/advpropx/status/2007482356253467119?s=20

X (formerly Twitter)

Konstantin (@advpropx) on X

nvfp4 moe on b200: the 142 tflops gap

benchmarked gpt-oss-20b (64e, topk=4) nvfp4 kernels.
sglang hits 1168 tflops peak.
vllm tops out at 1026 tflops.

same hardware. same model. different kernels.

dive in⬇️

🔥4

8.21K views21:05

Love. Death. Transformers.

Костя написал оч технический блог про особенности инференса ллм и sglang vs vllm

https://open.substack.com/pub/advprop/p/the-142-tflops-gap-why-fp4-moe-kernel

The 142 TFLOPS Gap: Why FP4 MoE Kernel Engineering Matters on Blackwell

How to achieve 1.84x speedup over vLLM on small-batch inference through kernel fusion, Blackwell optimization, and expert-aware computation

🔥40💩5👍3😁2😐2

8.46K views21:09

Love. Death. Transformers.

Love. Death. Transformers.

Костя написал оч технический блог про особенности инференса ллм и sglang vs vllm https://open.substack.com/pub/advprop/p/the-142-tflops-gap-why-fp4-moe-kernel

А теперь ещё и на hf самое подробное сравнение особенностей инференса Moe в vllm и sglang

https://huggingface.co/blog/apsys/blackwell-nvfp4-comparison

TFLOPS Gap: Why FP4 MoE Kernel Engineering Matters on Blackwell

A Blog post by Konstantin on Hugging Face

🔥29👾4💩1

10.1K viewsedited 17:55

Love. Death. Transformers.

Судя по stack overflow через лет эдак 50 когда зумеры начнут активно умирать мы будем жить в чем то среднем между пелевиным и wh40k, с одной стороны есть возможность крутить ultra advanced технологии умнее людей, с другой стороны они не то чтобы дают бонусы для простого обывателя (скорее наоборот)

🤔96🔥13💯9🫡5🥴43

12.2K viewsedited 10:21

Love. Death. Transformers.

Если сранивать онлифанщиц и ML/AI phd, то с одной стороны у нас хуесосы, с другой стороны люди которые реально приносят деньги

https://archive.ph/Lsk2Z

😁20436👍12🫡2

9.84K viewsedited 13:30

Love. Death. Transformers.

Блин какой красивый changelog

67🥴2312👍5🔥2💋1💊1

9.46K views19:37

Love. Death. Transformers.

70% задач в некоторых vlm бенчах решаются через common sense (знания текстовой тушки) и без использования картинок.

Paper

59😁17🔥2💋2

8.8K views10:43

Love. Death. Transformers.

https://youtu.be/9GYbnREDGTo?si=IRbcpHujzXCK4hZ7

😁9🔥4😇31

9.41K views12:59

Love. Death. Transformers.

😁1468👍3

10.1K views14:03

Love. Death. Transformers.

О, ты пишешь CUDA-ядра? Все уже давно на Triton. Шучу, мы все на Mojo. Мы используем cuTile. Мы используем ROCm. У нас внутренний DSL-компилятор, для NVGPU MLIR dialect, но, только что вышел Tile IR, так что теперь мы будем
использовать его. Наш PM сидит на TileLang. Тимлид была на CuTe, но теперь она снова пишет PTX вручную. Наш интерн строит на TT-Metalium для наших Wormhole’ов. Наш CFO одобрил заказ на здоровенные wafer-scale чипы, так что теперь мы портируем наши ядра на CSL. Наш CTO работает над kernel-less graph compiler’ом, так что скоро нам вообще не нужно будет писать ядра. Наш CEO думает, что мы говорим про ядро Linux. Кстати мы делаем Cursor для собак.

1😁211✍181411💊6💋5🤪5

10.5K views18:42

Love. Death. Transformers.

Очень красивая (глаза болят потом) штука про архитектуру железок от Modal(это такой провайдер карт)

blog

57🔥213🥱2🌭1

8.78K viewsedited 16:49

Love. Death. Transformers.

2😁276❤‍🔥47🍓1412🔥10👍4🤗42😍1

12.2K views13:12

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

8.63K views21:15

2😁33💩1🍓1

Love. Death. Transformers.

Если вы знаете вы знаете.

62💊25💯3🤔1

8.14K views21:15