Рынок text2image ожил буквально за пару дней: Midjourney планируют запускать седьмую версию своей модели на следующей неделе
Об этом сообщают инсайдеры, побывавшие на Weekly Office Hours стартапа.
Забавный факт: между выходами Midjourney v1 и v6 прошло всего 22 месяца. Между v6 и v7 прошло 16. Довольно сильная смена темпа, так что ждем что-то крутое.
P.S. Обещаем, это последняя на сегодня новость про генераторы картинок
Об этом сообщают инсайдеры, побывавшие на Weekly Office Hours стартапа.
Забавный факт: между выходами Midjourney v1 и v6 прошло всего 22 месяца. Между v6 и v7 прошло 16. Довольно сильная смена темпа, так что ждем что-то крутое.
P.S. Обещаем, это последняя на сегодня новость про генераторы картинок
👍84😁37🔥20❤6✍1
Вы не поверите, но GPT-4o теперь лучшая модель для кодинга
OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:
- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место
Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)
На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:
- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место
Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)
На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
🔥166👍57🏆21❤10😁9👾7🤯4🍓3☃2❤🔥1🤨1
Микроскоп для LLM: новое исследование от Anthropic
Anthropic известны своими работами по интерпретируемости. Раньше их основным подходом, который затем переняли OpenAI и Google, были SAE (наши разборы №1, №2, №3, №4, №5). А теперь они предлагают новый метод, который позволяет строить полноценные схемы мыслей ИИ, – Circuit Tracing, то есть цепная трассировка. Технически это вот так:
1. Берем обученный трансформер и определенную задачу.
2. Создаем замещающую модель: некоторые компоненты трансформера заменяем на интерпретируемые линейные модельки, их называют Cross-Layer Transcoder.
3. На конкретной выбранной задаче обучаем транскодеры вести себя также, как оригинальный компонент, то есть решаем задачу минимизации MSE Loss между выходами оригинального слоя и замененного.
4. Теперь у нас есть линеазированная интерпретируемая аппроксимация нашего трансформера, и на ней мы можем отследить потоки активаций через все слои.
5. Используя эти потоки, строим граф атрибуции, отражающий пути влияния одних признаков на другие. Анализируя этот граф, можно выделять какие-то интерпретируемые концепты и рисовать настоящие карты "размышлений" модели.
Как выглядят такие итоговые карты для Claude – посмотрите на картинках 2, 3, 4, 5. Там много интересного, если вглядеться. Например:
Статья про подход | Статья про эксперименты на Claude (советуем прочитать полностью, действительно очень интересное исследование)
Anthropic известны своими работами по интерпретируемости. Раньше их основным подходом, который затем переняли OpenAI и Google, были SAE (наши разборы №1, №2, №3, №4, №5). А теперь они предлагают новый метод, который позволяет строить полноценные схемы мыслей ИИ, – Circuit Tracing, то есть цепная трассировка. Технически это вот так:
1. Берем обученный трансформер и определенную задачу.
2. Создаем замещающую модель: некоторые компоненты трансформера заменяем на интерпретируемые линейные модельки, их называют Cross-Layer Transcoder.
3. На конкретной выбранной задаче обучаем транскодеры вести себя также, как оригинальный компонент, то есть решаем задачу минимизации MSE Loss между выходами оригинального слоя и замененного.
4. Теперь у нас есть линеазированная интерпретируемая аппроксимация нашего трансформера, и на ней мы можем отследить потоки активаций через все слои.
5. Используя эти потоки, строим граф атрибуции, отражающий пути влияния одних признаков на другие. Анализируя этот граф, можно выделять какие-то интерпретируемые концепты и рисовать настоящие карты "размышлений" модели.
Как выглядят такие итоговые карты для Claude – посмотрите на картинках 2, 3, 4, 5. Там много интересного, если вглядеться. Например:
➖ Несмотря на то, что модель решает только задачу next token prediction, она думает наперед. Это видно в задаче написания стихов: Claude планирует рифму еще до того, как начинает писать новую строчку.➖ Claude умеет считать "в уме". Вопреки расхожему мнению, оказывается, что модель не просто запоминает ответы математических задач, а действительно использует сложные вычислительные пути для их решения.➖ Даже галлюцинации оказываются вполне объяснимой вещью: исследователи обнаружили конкретную фичу "ответ известен", и, если она активируется по ошибке, модель начинает выдумывать.➖ Из смешного: если сразу сказать модели ответ на задачу, она будет думать в обратном направлении, то есть пытаться придумать правдоподобное решение для ответа.
Статья про подход | Статья про эксперименты на Claude (советуем прочитать полностью, действительно очень интересное исследование)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥117👍31🤯18❤5🤔5🤨1
Конспекты по ML в стиле Ghibli
Все соцсети заполнены генерациями новой GPT-4o в стиле японской анимационной студии Ghibli. Мы тоже решили не отставать и нагенерировали вам... ML-конспектов🤓
Получился определено плюс вайб. Пишите в комментарии, какие еще ML-темы порисовать
Все соцсети заполнены генерациями новой GPT-4o в стиле японской анимационной студии Ghibli. Мы тоже решили не отставать и нагенерировали вам... ML-конспектов
Получился определено плюс вайб. Пишите в комментарии, какие еще ML-темы порисовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍166❤71🔥35😁10😍10🤯6🗿5👏3🤨2👾1
Data Secrets
В соцсетях бурно обсуждают только что вышедшего агента Manus: это Operator, Deep Research и Cursor в одном флаконе Его выпустила одноименная китайская лаборатория и этот релиз уже называют DeepSeek moment v2. Чем он цепляет: 1. Он действительно автономный.…
У того самого китайского агента Manus появилось iOS приложение + стали известны цены на подписку
За 39 долларов можно получить 3900 кредитов, за 199 $ – 19 900. В среднем простенькая задача стоит 100-200 кредитов, посложнее 300-500.
А что, не все китайские модели бесплатные? 🥺
За 39 долларов можно получить 3900 кредитов, за 199 $ – 19 900. В среднем простенькая задача стоит 100-200 кредитов, посложнее 300-500.
А что, не все китайские модели бесплатные? 🥺
😁113🤯30🔥11🤨11🗿5👍3❤1
Облачные технологии — ключ к эффективному AI
Это логично — облачные технологии упрощают доступ к сервисам для работы с big data и делают инструменты для ML-разработки и создания AI-агентов доступнее.
Как использовать эти возможности на практике? Эти вопросы все чаще поднимаются в профессиональном сообществе — например, на профильных конференциях. 10 апреля на GoCloud – ежегодной конференции провайдера облачных и AI-технологий Cloud․ru, судя по заявленной программе, можно будет узнать много нового о практическом применении AI и как оптимально настроить работу ML-инженера в облаке.
Программа насыщенная: помимо AI, будет еще два трека «Инфраструктура и сервисы» – про новые возможности Cloud․ru Evolution, а также «Сценарии работы в облаке», где спикеры поделятся опытом применения облачных технологий.
Это логично — облачные технологии упрощают доступ к сервисам для работы с big data и делают инструменты для ML-разработки и создания AI-агентов доступнее.
Как использовать эти возможности на практике? Эти вопросы все чаще поднимаются в профессиональном сообществе — например, на профильных конференциях. 10 апреля на GoCloud – ежегодной конференции провайдера облачных и AI-технологий Cloud․ru, судя по заявленной программе, можно будет узнать много нового о практическом применении AI и как оптимально настроить работу ML-инженера в облаке.
Программа насыщенная: помимо AI, будет еще два трека «Инфраструктура и сервисы» – про новые возможности Cloud․ru Evolution, а также «Сценарии работы в облаке», где спикеры поделятся опытом применения облачных технологий.
👍16🔥7❤4😁4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA выпустила Project G-Assist для настройки и оптимизации игровых ПК
Ассистента анонсировали еще на Computex 2024, но только сейчас экспериментально раскатывают на пользователей. Пока это доступно только владельцам GeForce RTX, но вот что G-Assist может:
🟦 Оптимизирует графику и системные настройки для игр или других целей
🟦 Диагностирует систему и постоянно мониторит производительность
🟦 Повышает эффективность GPU и поможет установить любой NVIDIA стафф
Все крутится на Llama 8В, так что ассистент не прожорливый и запускается локально. Ну и работает бесплатно, если вы уже владелец RTX с минимум 12 ГБ видеопамяти.
www.nvidia.com/en-us/geforce/news/g-assist-ai-companion-for-rtx-ai-pcs/
Ассистента анонсировали еще на Computex 2024, но только сейчас экспериментально раскатывают на пользователей. Пока это доступно только владельцам GeForce RTX, но вот что G-Assist может:
Все крутится на Llama 8В, так что ассистент не прожорливый и запускается локально. Ну и работает бесплатно, если вы уже владелец RTX с минимум 12 ГБ видеопамяти.
www.nvidia.com/en-us/geforce/news/g-assist-ai-companion-for-rtx-ai-pcs/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍46🔥15❤6
Парень попросил gpt-4o сгенерировать первую страницу его самой нелюбимой статьи и получил шапку «Attention is all you need»
На этом все.
На этом все.
2😁300👍29🤯15💯7❤1
Media is too big
VIEW IN TELEGRAM
Fun fact: в Meta вообще не используют термин AGI, на этом настаивает Ян Лекун
Дело в том, что AGI (Artificial General Intelligence) означает интеллект не хуже человеческого уровня. Лекун же говорит, что это определение не подходит, потому что на самом деле человеческий интеллект далеко не General.
Вместо этого ученый и его команда используют сокращение AMI – Advanced Machine Intelligence.
Дело в том, что AGI (Artificial General Intelligence) означает интеллект не хуже человеческого уровня. Лекун же говорит, что это определение не подходит, потому что на самом деле человеческий интеллект далеко не General.
Вместо этого ученый и его команда используют сокращение AMI – Advanced Machine Intelligence.
2👍139🔥24🤨16❤7💯3🗿2
Всплыли некоторые подробности увольнения Сэма Альтмана осенью 2023 года
The Wall Street Journal выпустил статью-отрывок из будущей книги “The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future”, в которой раскрыли некоторые подробности событий ноября 2023.
Оказалось, что Сэм несколько раз лгал и недоговаривал совету директоров:
➖ Однажды при обсуждении новой модели GPT-4 он солгал, что она прошла проверку безопасности. После перепроверки оказалось, что это не так.
➖ Тестирование GPT-4 на пользователях также началось без ведома директоров.
➖ В другой раз он сказал Мире Мурати, что юридический отдел подтвердил, что GPT-4 Turbo не нужно пропускать через тест безопасности в Microsoft. В последствие главный юрист компании отрицал это.
➖ Ну и вишенка: хотя Альтман не владел никакими акциями OpenAI (помните вот это "I do It because I love It"?), оказалось, что ему тайно принадлежал инвестиционный фонд OpenAI Startup Fund. Сэм утверждал, что прибыли тот не несет, но все равно зачем-то скрывал факт владения от совета.
А еще выяснилось, что помимо Ильи Суцкевера, руку к увольнению Альтмана непосредственно приложила Мира Мурати. Они с Ильей вместе собирали документальные доказательства лжи и токсичности Альтмана и Грега Брокмана. На том же совете, на котором решили уволить Сэма, Миру назначили новым временным CEO.
Это забавно, потому что именно Мира сразу после увольнения Альтмана сделала вид, что она не в курсе "заговора" и возглавила протест сотрудников против увольнения Сэма. Она вместе с 95% сотрудников (и Суцкевером в том числе) подписала петицию с угрозой массового увольнения. Именно поэтому Альтмана восстановили.
Вот такая вот кремниевая игра престолов👀
P.S. Сама статья WSJ платная, но бесплатное зеркало есть тут, так что можете легко прочитать полностью
The Wall Street Journal выпустил статью-отрывок из будущей книги “The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future”, в которой раскрыли некоторые подробности событий ноября 2023.
Оказалось, что Сэм несколько раз лгал и недоговаривал совету директоров:
А еще выяснилось, что помимо Ильи Суцкевера, руку к увольнению Альтмана непосредственно приложила Мира Мурати. Они с Ильей вместе собирали документальные доказательства лжи и токсичности Альтмана и Грега Брокмана. На том же совете, на котором решили уволить Сэма, Миру назначили новым временным CEO.
Это забавно, потому что именно Мира сразу после увольнения Альтмана сделала вид, что она не в курсе "заговора" и возглавила протест сотрудников против увольнения Сэма. Она вместе с 95% сотрудников (и Суцкевером в том числе) подписала петицию с угрозой массового увольнения. Именно поэтому Альтмана восстановили.
Вот такая вот кремниевая игра престолов
P.S. Сама статья WSJ платная, но бесплатное зеркало есть тут, так что можете легко прочитать полностью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🫡43😁35❤22🤯19🤔8🔥5👻5🍓1💘1
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулись на недавнее интервью Джеффри Хинтона, в котором он называет RLHF «кучкой дерьма»
RLHF на сегодняшний день – один из основных алгоритмов пост-трейнинга. Без него не обходится почти ни одна моделька + на RLHF строится почти любой элаймент.
Но нобелевский лауреат подход все равно недолюбливает и сравнивает его с покраской ржавой машины, которую вы хотите продать🤷♂️ 🤷♂️ 🤷♂️
youtu.be/61BGgwN36Ps
RLHF на сегодняшний день – один из основных алгоритмов пост-трейнинга. Без него не обходится почти ни одна моделька + на RLHF строится почти любой элаймент.
Но нобелевский лауреат подход все равно недолюбливает и сравнивает его с покраской ржавой машины, которую вы хотите продать
youtu.be/61BGgwN36Ps
Please open Telegram to view this post
VIEW IN TELEGRAM
😁75🔥56🤔13👍11❤9💯1🤨1
Data Secrets
Итак, нативная обработка изображений от OpenAI вышла, работает супер и даже доступна бесплатным пользователям Но... Google затмил сегодня вечером всех, выпустив Gemini 2.5 Pro. Это та самая модель, которая на арене висела на первом месте под названием Nebula.…
Google сделали свою новую модель Gemini 2.5 Pro бесплатной
Теперь она доступна абсолютно всем юзерам. Все что нужно – аккаунт Google🥳
Напоминаем, что сейчас Gemini 2.5 Pro занимает первое место во всех номинациях на арене (с отрывом), бьет на кодинге o1, o3-mini и Sonnet 3.7. А еще она мультимодальная и контекст у нее – миллион (!) токенов.
Пробуем: gemini.google.com
Теперь она доступна абсолютно всем юзерам. Все что нужно – аккаунт Google
Напоминаем, что сейчас Gemini 2.5 Pro занимает первое место во всех номинациях на арене (с отрывом), бьет на кодинге o1, o3-mini и Sonnet 3.7. А еще она мультимодальная и контекст у нее – миллион (!) токенов.
Пробуем: gemini.google.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥204❤36👍24❤🔥5🗿2