Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Есть хорошая и плохая новость

👎 Плохая: нативной генерации изображений gpt-4o для бесплатной подписки пока не будет.

Альтман объявил, что они не ожидали такого ажиотажа и поэтому немного отложили ролаут на free юзеров.

👍 Хорошая: вышел Ideogram 3.0 и в нем дают несколько бесплатных генераций в неделю (для регистрации достаточно гугл аккаунта).

По Elo моделька обгоняет Imagen3 и Flux Pro. Фотореализм и работа с текстом на высоте. А еще можно загружать референсные картинки, чтобы задать генерациям стиль. Пробуйте здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍179🐳1
Про влияние бума ИИ на рекомендательные системы рассказал Николай Савушкин, руководитель направления рекомендательных систем в Яндексе.

Рекомендательные системы развиваются значительно медленнее, чем нашумевшие LMM. Комьюнити для разработки нужен доступ к реальным пользователям и данным об их поведении в сервисах, чего у исследователей часто нет. Но технологическая основа рекомендаций продолжает развиваться, хоть и не так активно из-за специфики направления.

Подробнее об этом и о том, что ждёт рекомендательные системы в будущем, здесь
😁38🔥17🗿15👍127🤨54🤯1💘1
На МТС True Tech Hack 2025 можно создать не только крутое решение, но и расширить свои профессиональные связи

Что тебя ждет на хакатоне?
Поддержка менторов из ИТ-команды МТС
Призовой фонд в 1 500 000 рублей для самых креативных решений
Возможность внести вклад в продукты, которые помогают разработчикам по всей России

Что надо делать?
Разработать прототип продукта на базе ИТ-платформ МТС
Кайфануть от своего результата
Забрать с собой гордое звание победителя и деньги

Регистрация, митап и вся допинформация здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8😁6🗿43🤨3🔥2
Рынок text2image ожил буквально за пару дней: Midjourney планируют запускать седьмую версию своей модели на следующей неделе

Об этом сообщают инсайдеры, побывавшие на Weekly Office Hours стартапа.

Забавный факт: между выходами Midjourney v1 и v6 прошло всего 22 месяца. Между v6 и v7 прошло 16. Довольно сильная смена темпа, так что ждем что-то крутое.

P.S. Обещаем, это последняя на сегодня новость про генераторы картинок
👍84😁37🔥2061
Вы не поверите, но GPT-4o теперь лучшая модель для кодинга

OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:

- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место

Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)

На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
🔥166👍57🏆2110😁9👾7🤯4🍓32❤‍🔥1🤨1
Микроскоп для LLM: новое исследование от Anthropic

Anthropic известны своими работами по интерпретируемости. Раньше их основным подходом, который затем переняли OpenAI и Google, были SAE (наши разборы №1, №2, №3, №4, №5). А теперь они предлагают новый метод, который позволяет строить полноценные схемы мыслей ИИ, – Circuit Tracing, то есть цепная трассировка. Технически это вот так:

1. Берем обученный трансформер и определенную задачу.

2. Создаем замещающую модель: некоторые компоненты трансформера заменяем на интерпретируемые линейные модельки, их называют Cross-Layer Transcoder.

3. На конкретной выбранной задаче обучаем транскодеры вести себя также, как оригинальный компонент, то есть решаем задачу минимизации MSE Loss между выходами оригинального слоя и замененного.

4. Теперь у нас есть линеазированная интерпретируемая аппроксимация нашего трансформера, и на ней мы можем отследить потоки активаций через все слои.

5. Используя эти потоки, строим граф атрибуции, отражающий пути влияния одних признаков на другие. Анализируя этот граф, можно выделять какие-то интерпретируемые концепты и рисовать настоящие карты "размышлений" модели.

Как выглядят такие итоговые карты для Claude – посмотрите на картинках 2, 3, 4, 5. Там много интересного, если вглядеться. Например:

Несмотря на то, что модель решает только задачу next token prediction, она думает наперед. Это видно в задаче написания стихов: Claude планирует рифму еще до того, как начинает писать новую строчку.
Claude умеет считать "в уме". Вопреки расхожему мнению, оказывается, что модель не просто запоминает ответы математических задач, а действительно использует сложные вычислительные пути для их решения.
Даже галлюцинации оказываются вполне объяснимой вещью: исследователи обнаружили конкретную фичу "ответ известен", и, если она активируется по ошибке, модель начинает выдумывать.
Из смешного: если сразу сказать модели ответ на задачу, она будет думать в обратном направлении, то есть пытаться придумать правдоподобное решение для ответа.


Статья про подход | Статья про эксперименты на Claude (советуем прочитать полностью, действительно очень интересное исследование)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥117👍31🤯185🤔5🤨1
Конспекты по ML в стиле Ghibli

Все соцсети заполнены генерациями новой GPT-4o в стиле японской анимационной студии Ghibli. Мы тоже решили не отставать и нагенерировали вам... ML-конспектов 🤓

Получился определено плюс вайб. Пишите в комментарии, какие еще ML-темы порисовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16671🔥35😁10😍10🤯6🗿5👏3🤨2👾1
Data Secrets
В соцсетях бурно обсуждают только что вышедшего агента Manus: это Operator, Deep Research и Cursor в одном флаконе Его выпустила одноименная китайская лаборатория и этот релиз уже называют DeepSeek moment v2. Чем он цепляет: 1. Он действительно автономный.…
У того самого китайского агента Manus появилось iOS приложение + стали известны цены на подписку

За 39 долларов можно получить 3900 кредитов, за 199 $ – 19 900. В среднем простенькая задача стоит 100-200 кредитов, посложнее 300-500.

А что, не все китайские модели бесплатные? 🥺
😁113🤯30🔥11🤨11🗿5👍31