Psy Eyes
6.8K subscribers
1.43K photos
1.57K videos
5 files
1.55K links
Креатив + AI + Web3... и мемы

Личная страница @AndreyBezryadin

Купить рекламу: https://telega.in/c/Psy_Eyes
Без наценки Telegain и индивидуальными датами — в личке.
Download Telegram
Alibaba: выпустили языковую модель Qwen 3 с гибридным режимом работы: обычный и рассуждение.

Часть серии ллм включает в себя обычные модели 0.6B // 1.7B // 4B // 8B // 14B // и 32B. Версия на 0.6B может работать на телефоне, для 14B поместится в 24 ГБ VRAM, а 32B надо будет запускать уже с выгрузкой в RAM. Модели 0.6B - 4B имеют контекст 32к (можно кормить книжки), остальные 128к (небольшая библиотека).

Также 0.6B может использоваться для ускорения больших моделей посредством предсказывания очевидных токенов. Задаётся через настройку speculative decoding в боковой панели LM Studio или llama.cpp.

Другая часть это экспертные модели (MoE) 30B-A3B и 235B-A22B, у которых количество параметров 30B и 235B соответственно, а активных 3B или 22B. Тут у всех контекст 128к. Эти модели уже для запуска на серверах.

По бенчам бьёт другие опенсорсные модели и закрытые вроде Gemini 2.5 Pro, Grok 3, и o3-mini. Хорошо себя показывает как в креативном копирайтинге, так и написании кода и математике.

Как и прежде русский язык поддерживается. Режим размышлений можно выключать или задать бюджет на это (thinking budget), что может ускорить ответы.

Уже завезли в ollama и можно гонять в OpenWebUI. Или просто скачать LM Studio и прямо там в интерфейсе подберется оптимальная модель под ваше железо.

Для получения оптимальных результатов рекомендуется: при рассуждениях ставить настройки Temperature=0.6, TopP=0.95, TopK=20, и MinP=0, а при обычном режиме Temperature=0.7, TopP=0.8, TopK=20, и MinP=0. Я сначала прогнал свой тест на родственные связи (правильный ответ — двоюродная племянница) без этих настроек и результат был хуже, а где-то модель уходила и вовсе в мыслительный лимб.

Модели 0.6B и 1.7B можно будет гонять на смартфоне, например, через PocketPal или в браузере через WebGPU. А я решил помимо промежуточных вариантов ещё попробовать запустить у себя самый крупняк в самом простом варике весом 111 ГБ... Штош, оно запустилось, съело и почти все 24 ГБ VRAM и 128 RAM, а ответ занял 34 минуты и не сказать, что впечатлил.

Меньшие размеры были и пошустрее и пришли к правильному ответу:
0.6B (Q8_0) — 307.44 ток/с // 4,26 сек
8B (Q8_0) — 82.37 ток/с // 23,19 сек
32B (q3_k_l) — 10.67 ток/с // 5 мин 26 сек
30B-A3B — 131.53 ток/с // 8,25 сек

Демо (хаггинг)
Демо (сайт)
Приложение (Android // iOS).
Анонс
Гитхаб
Хаггинг
Ollama
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Freepik + Fal: выпустили генератор картинок F-Lite.

Имеет 10B параметров и натренирован на 80 млн картинок свободных от копирайта и SFW контенте. Лицензия Apacehe 2 разрешающая коммерческое использование.

Модель идёт в двух вариантах:
* F-Lite — базовая версия для генераций в широком спектре тем.
* F-Lite-Texture — версия с более богатыми текстурами и улучшенными деталями.

Freepik предоставляют сразу два комфи для запуска: Simple и Advanced. Оба они максимально минималистичные, состоят из пары нод. Отличие лишь в том, что Advanced лучше работает с детальным промтом и может разворачивать короткий промт в длинный.

Решил погонять просто F-Lite. Кижаевские ноды у меня были, плюс я поставил ComfyUI-Custom-Scripts. Но у меня как я ни пробовал не получилось найти F-lite ноду. Пришлось запускать в cli через Diffusers.

Потребляет 20-21 ГБ VRAM и на тестах выдаёт 1,5 сек/ит. На одну картинку 1024х1024 в 30 шагов уходит ~45 сек. Я после видеогенераторов и забыл, что такое скорость.

Без улучшения промта (я пользовался Grok 3), качество ад. И приходится деталь много подходов, чтобы сгенерить что-то путное. Хотя всё равно в фантастичных сюжетах получается мрак. на более-менее рекламном контенте фотосеты на пляже, 3D рендеры, и можно как-то выехать. Но с трудом. Надо будет потом запустить F-Lite Texture.

Ну если где-то есть F-Lite, то на сайте Fal есть F-Standard. А там глядишь и F-Large/Heavy подтянется.

Демо Lite (хаггинг)
Демо Lite (Fal)
Демо Texture (хаггинг)
Хаггинг
Гитхаб
Comfy
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Админам других каналов.

Если у вас настроен автопостинг в Дзен через бота и вы публиковали рекламу с уговором на 24 часа, имейте ввиду, что при удаление с телеги в Дзен она остаётся висеть. Особенно важно если на вас лежит отчётность по erid. Поиска в Дзене по своим постам нет, если публикуете много рекламы — удачного гринда.
На основе Qwen 3 уже собрали QwenSite — аналог DeepSite для вайбкодинга веб-приложений.

К слову DeepSite менее, чем за месяц насобирал 1 млн пользователей. Можно прямо в нём публиковать полученные веб-апы на Хаггинге и даже есть галерея. Или можно воспользоваться их гайдом по локальному запуску. Посмотрим куда вырулит QwenSite.

QwenSite на моём тесте создания музыкального плеера пока показала себя не очень. Возможно стоит поиграться с промтом или дать разрабам подстроить модель под апу. DeepSite тоже на релизе не справился с этим, а сейчас вполне неплохо. Grok 3 всё ещё в топе на эту тему, но опенсорс не даст заскучать.

DeepSite
QwenSite
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Использование Speculative Decoding на примере Qwen3 32B в связке с маленькой Qwen3 0.6B для предсказания очевидных токенов.

Было 10.80 ток/сек и 3:45 мин на
рассуждения с неверным ответом в конце.

Стало 11.88 ток/сек, время 2:25 мин, и ответ правильный (двоюродная племянница). Прогнал два раза.

Потребление VRAM увеличилось на 1,4 ГБ (c 18,8 до 20,2 ГБ).

Сайт LM Studio
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Suno: музыкальный генератор обновился до V 4.5. Вот вам раздел, где собраны генерации на 4.5, чтобы заслушать.

Что нового:

🙌 Больше жанров и их мэшапов — можно легко объединить среднезападный нью-метал + неосоул или EDM + фолк.

🎤 Улучшенная проработка голоса — с большей глубиной, эмоциональностью и диапазоном. От шепота до скримов. Посмотрим, что на русском сможет.

🔊 Более сложный, текстурированный звук — с многослойными инструментами, тональными сдвигами и отчётливыми деталями. Промты «leaf textures» или «melodic whistling» теперь звучат четко и с глубиной.

🧠 Более чёткое следование промту, а также улучшатель для его раскручивания из короткого в детальный.

🎭 Обновлённые кавера сохраняют больше мелодичных деталей. Переключение между жанрами происходит плавно. А обновлённые персоны лучше сохраняют вайб и характер вашего трека.

🤝🏽 Также теперь кавера и персоны можно комбинировать, позволяя менять голос, структуру трека и стиль одновременно.

📈 Лимит на генерацию трека увеличен с 4 до 8 минут без использования функции Extend. Плюс улучшилось качество аудио — более сбалансированный микс и меньше артефактов. Го ваять пост-рок!

Пока доступно только платным подписчикам на Pro и Premier.

Сайт
Анонс
———————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Вместе с обновлением V 4.5 проапгрейдилась и моя любимая страница на Suno — Explore, где крутя барабан можно открываться для себя новые жанры.

Теперь при таком звучании можно залипнуть ещё на дольше. А многие вещи так и хочется скачать.

Для сравнения версий Explore:
Suno V4.5
Suno V4
Suno V3.5
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Ostris: автор AI-Toolkit в одиночку натренировал и выпустил генератор картинок Flex.1-alpha с 8B параметрами, а также Flex.2 с вшитым контролем.

Проект начался как файнтюн Flux Schnell, ибо он в отличие от Dev.1 позволяет использовать картинки в коммерческих целях. У полученной модели меньше трансформенных блоков (8 против 19) из-за чего она потребляет меньше VRAM (как Flux Lite) и быстрее. Также для неё был натренирован guidance embedder, так что для создания изображений не требуется CFG. Модель из коробки поддерживает тренировку и для запуска в Comfy работает также как обычный Flux.

Flex.2 пока доступен в превью версии. Здесь также 8B параметров, но встроена поддержка инпейтинга и контролнета (очертания, поза, шлубина). 16-канальный VAE и 512 токенов на вход для промта.

Демо Flex 1
Демо Flex 2
Хаггинг
Сайт
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM