🌍 MENLO: From Preferences to Proficiency
Новый фреймворк и датасет для оценки и моделирования качества ответов LLM, максимально приближенного к "родной речи", сразу на 47 языках.
Идея вдохновлена принципами audience design - то есть адаптацией модели под разные аудитории и культурные контексты.
📄 Статья: arxiv.org/abs/2509.26601
🤗 Датасет: huggingface.co/datasets/facebook/menlo
Новый фреймворк и датасет для оценки и моделирования качества ответов LLM, максимально приближенного к "родной речи", сразу на 47 языках.
Идея вдохновлена принципами audience design - то есть адаптацией модели под разные аудитории и культурные контексты.
📄 Статья: arxiv.org/abs/2509.26601
🤗 Датасет: huggingface.co/datasets/facebook/menlo
❤2
🐦 X открыл исходники алгоритма "For You"
Как работает лента рекомендаций в 7 шагах:
1️⃣ Сырые данные (вход):
- соцграф (кто кого фолловит),
- вовлечённость (лайки, ретвиты, ответы, закладки),
- данные о пользователе (клики, профиль, поведение).
2️⃣ Feature Engineering:
- GraphJet — граф твитов в реальном времени
- SimClusters — объединение в коммьюнити ("AI Twitter", "NBA Twitter")
- TwHIN — карта связей пользователь↔твит
- RealGraph — сила связей
- TweepCred — скоринг доверия
- Trust & Safety сигналы
3️⃣ Candidate Sourcing (Home Mixer):
Разные миксеры (CR Mixer, UTEG, FRS) вытягивают твиты из разных пулов → больше разнообразия.
4️⃣ Heavy Ranker (ML-модель):
Нейросеть предсказывает, что вам зайдёт: лайки, ретвиты, ответы, время чтения.
5️⃣ Фильтры и эвристики:
- социальное доказательство
- разнообразие авторов
- блок спама/NSFW/мутов
- баланс контента
- защита от «замыливания»
6️⃣ Микс:
Рекламные твиты + рекомендации «кого фолловить» → в ленту.
7️⃣ Что это значит для вас:
- выбери нишу
- пиши ценные посты
- отвечай по делу в своей теме
→ вырастишь аудиторию и найдёшь людей/идеи для бизнеса.
https://github.com/twitter/the-algorithm
#Twitter #ForYou #AI #RecommenderSystems
Как работает лента рекомендаций в 7 шагах:
1️⃣ Сырые данные (вход):
- соцграф (кто кого фолловит),
- вовлечённость (лайки, ретвиты, ответы, закладки),
- данные о пользователе (клики, профиль, поведение).
2️⃣ Feature Engineering:
- GraphJet — граф твитов в реальном времени
- SimClusters — объединение в коммьюнити ("AI Twitter", "NBA Twitter")
- TwHIN — карта связей пользователь↔твит
- RealGraph — сила связей
- TweepCred — скоринг доверия
- Trust & Safety сигналы
3️⃣ Candidate Sourcing (Home Mixer):
Разные миксеры (CR Mixer, UTEG, FRS) вытягивают твиты из разных пулов → больше разнообразия.
4️⃣ Heavy Ranker (ML-модель):
Нейросеть предсказывает, что вам зайдёт: лайки, ретвиты, ответы, время чтения.
5️⃣ Фильтры и эвристики:
- социальное доказательство
- разнообразие авторов
- блок спама/NSFW/мутов
- баланс контента
- защита от «замыливания»
6️⃣ Микс:
Рекламные твиты + рекомендации «кого фолловить» → в ленту.
7️⃣ Что это значит для вас:
- выбери нишу
- пиши ценные посты
- отвечай по делу в своей теме
→ вырастишь аудиторию и найдёшь людей/идеи для бизнеса.
https://github.com/twitter/the-algorithm
#Twitter #ForYou #AI #RecommenderSystems
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Генерим безумные мюзиклы из чего угодно — Sora 2 теперь и в этом мастер.
🎭 Промт:
@bigdatai
🎭 Промт:
[Warhammer 40K], но в стиле бродвейского мюзикла — герои поют на сцене, яркий свет, театральные костюмы, всё на русском языке.
@bigdatai
❤5👍2🔥1
🛠️📊 Логирование разработки с AI-поддержкой
Dev3000 собирает полную хронологию разработки вашего веб-приложения, включая логи сервера, события браузера и автоматические скриншоты. Этот инструмент упрощает отладку, позволяя AI-ассистентам, таким как Claude, анализировать все данные в одном месте.
🚀Основные моменты:
- Хранит логи с временными метками для легкого доступа.
- Автоматически создает скриншоты при навигации и ошибках.
- Интеграция с AI для мгновенной отладки.
- Поддерживает фильтрацию и поиск по логам.
- Визуальный интерфейс для просмотра логов.
📌 GitHub: https://github.com/vercel-labs/dev3000
Dev3000 собирает полную хронологию разработки вашего веб-приложения, включая логи сервера, события браузера и автоматические скриншоты. Этот инструмент упрощает отладку, позволяя AI-ассистентам, таким как Claude, анализировать все данные в одном месте.
🚀Основные моменты:
- Хранит логи с временными метками для легкого доступа.
- Автоматически создает скриншоты при навигации и ошибках.
- Интеграция с AI для мгновенной отладки.
- Поддерживает фильтрацию и поиск по логам.
- Визуальный интерфейс для просмотра логов.
📌 GitHub: https://github.com/vercel-labs/dev3000
❤2👍1
🤖 ByteDance Seed представил **AgentGym-RL** — новый единый фреймворк для обучения агентов с подкреплением.
🔹 Первый универсальный RL-фреймворк для обучения агентов в многошаговых задачах (без SFT).
🔹 Модульная и расширяемая архитектура: web, поиск, игры, embodied-среды и научные задачи.
🔹 Агенты достигают и даже превосходят коммерческие модели на 27 задачах.
▪proj: https://agentgym-rl.github.io
▪repo: https://github.com/woooodyy/AgentGym-RL
#RL #AI #ByteDance #AgentGym #ReinforcementLearning #Agents
🔹 Первый универсальный RL-фреймворк для обучения агентов в многошаговых задачах (без SFT).
🔹 Модульная и расширяемая архитектура: web, поиск, игры, embodied-среды и научные задачи.
🔹 Агенты достигают и даже превосходят коммерческие модели на 27 задачах.
▪proj: https://agentgym-rl.github.io
▪repo: https://github.com/woooodyy/AgentGym-RL
#RL #AI #ByteDance #AgentGym #ReinforcementLearning #Agents
❤2
Forwarded from Machinelearning
Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура).
Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов.
Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам.
Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации.
В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов.
Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными.
https://huggingface.co/inclusionAI/Ling-1T
@ai_machinelearning_big_data
#Ling1T #AI #ML #OpenSource #Reasoning #TrillionScale #FP8
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥1