Маск пообещал сделать Альтмана и Брокмана «самыми ненавидимыми людьми в Америке»
Так он ответил Брокману после того как тот накануне суда предложил ему взаимный отказ от претензий:
Это произошло в личной переписке за несколько дней до суда. А теперь OpenAI приобщают эту переписку к делу в федеральном суде. Их юристы используют ее как доказательство того, что преследования Маска сводятся к личной обиде на Альтмана и Брокмана, и он организует масштабную публичную компанию против них, а не просто суд.
Так он ответил Брокману после того как тот накануне суда предложил ему взаимный отказ от претензий:
К концу этой недели вы с Сэмом станете самыми ненавидимыми людьми в Америке. Если вы будете настаивать, так и случится.
Это произошло в личной переписке за несколько дней до суда. А теперь OpenAI приобщают эту переписку к делу в федеральном суде. Их юристы используют ее как доказательство того, что преследования Маска сводятся к личной обиде на Альтмана и Брокмана, и он организует масштабную публичную компанию против них, а не просто суд.
This media is not supported in your browser
VIEW IN TELEGRAM
Wildberries & Russ проведет Inside AI Meetup 20 мая в Москве и онлайн
Будут реальные кейсы:
— Высоконагруженная модерация с векторным поиском
— AIOps-подходы к управлению ML-сервисами
— Практики построения RAG-систем
— Тонкости реранкинга
— Реальные этапы запуска LLM-продуктов и еще многое другое.
Среди спикеров эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.
Советуем ивент для senior ML/AI инженеров, MLE, DS, инженеров платформ и для всех, кто строит или масштабирует AI-системы в продакшене.
Регистрация и прочие подробности — по ссылке. Приглашайте коллег.
Будут реальные кейсы:
— Высоконагруженная модерация с векторным поиском
— AIOps-подходы к управлению ML-сервисами
— Практики построения RAG-систем
— Тонкости реранкинга
— Реальные этапы запуска LLM-продуктов и еще многое другое.
Среди спикеров эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.
Советуем ивент для senior ML/AI инженеров, MLE, DS, инженеров платформ и для всех, кто строит или масштабирует AI-системы в продакшене.
Регистрация и прочие подробности — по ссылке. Приглашайте коллег.
🗿54❤10🤔10😁9👍5🤯4🔥3🤨2👨💻1
Создатели SWE-bench представили новый бенчмарк по программированию, на котором абсолютно все современные модели выбивают ровно 0%
Он называется ProgramBench, и суть его проста: агент получает только скомпилированный исполняемый бинарник и документацию, и его задача – спроектировать код, который при сборке будет полностью соответствовать поведению исходного файла (без доступа к Интернету).
При этом агент должен самостоятельно определиться с архитектурой и выбрать структуру проекта. Собственно, здесь сложности и начинаются: LLM хорошо умеют писать плоский код в одном файле, а вот с многофайловыми проектами, где нужна низкоуровневая логика, работают плохо.
Итог: даже результат Claude Opus 4.7 и GPT-5.4 – это полный ноль.
Кажется, у нас новый претендент на звание самого интересного бенчмарка.
https://programbench.com/
Он называется ProgramBench, и суть его проста: агент получает только скомпилированный исполняемый бинарник и документацию, и его задача – спроектировать код, который при сборке будет полностью соответствовать поведению исходного файла (без доступа к Интернету).
При этом агент должен самостоятельно определиться с архитектурой и выбрать структуру проекта. Собственно, здесь сложности и начинаются: LLM хорошо умеют писать плоский код в одном файле, а вот с многофайловыми проектами, где нужна низкоуровневая логика, работают плохо.
Итог: даже результат Claude Opus 4.7 и GPT-5.4 – это полный ноль.
Кажется, у нас новый претендент на звание самого интересного бенчмарка.
https://programbench.com/
🔥347😁110👍53❤27🗿13🕊2🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
Калистеника от Boston Dynamics
Новое вирусное видео робота Atlas они выложили с подписью:
Кстати, вполне возможно, что экземпляр на видео уже работает но основе Gemini Robotics от Google. Компании заключили партнерство в начале года, и теперь совместно работают над новым поколением гуманоидов.
Новое вирусное видео робота Atlas они выложили с подписью:
Балансировать коммерческие цели и исследования в робототехнике непросто, но с Atlas мы заставляем это работать.
Кстати, вполне возможно, что экземпляр на видео уже работает но основе Gemini Robotics от Google. Компании заключили партнерство в начале года, и теперь совместно работают над новым поколением гуманоидов.
🔥162❤40🤯23 10👍6😁5👏4
Стартап Subquadratic анонсировал языковую модель SubQ с контекстным окном 12М токенов
Это не все: она также выдает невероятную скорость в 150 токенов/сек, обгоняет Claude Opus 4.6 на SWE-bench, и при этом ее стоимость составляет 5% от стоимости Opus (прочитайте это снова).
Секрет SubQ, как говорят создатели, в архитектуре. А точнее, в использовании нового вида механизма внимания – sub-quadratic sparse-attention. Идея в том, чтобы вычислять внимание только по разреженному набору наиболее важных связей, а не по всей матрице целиком.
Метод позволяет достичь линейной (!!!) вычислительной сложности относительно длины контекста и на длинных контекстных окнах достигает ускорения в 52 раза относительно FlashAttention.
Звучит как полный прорыв в экономике инференса. Но, как обычно, есть нюанс: пока все эти громкие заявления живут только на словах.
Проект находится в закрытой бете, техрепорта нет, доступов нет. Пока выложили только небольшой блог и разбор их механизма внимания.
Посмотрим, что из этого выйдет
Это не все: она также выдает невероятную скорость в 150 токенов/сек, обгоняет Claude Opus 4.6 на SWE-bench, и при этом ее стоимость составляет 5% от стоимости Opus (прочитайте это снова).
Секрет SubQ, как говорят создатели, в архитектуре. А точнее, в использовании нового вида механизма внимания – sub-quadratic sparse-attention. Идея в том, чтобы вычислять внимание только по разреженному набору наиболее важных связей, а не по всей матрице целиком.
Метод позволяет достичь линейной (!!!) вычислительной сложности относительно длины контекста и на длинных контекстных окнах достигает ускорения в 52 раза относительно FlashAttention.
Звучит как полный прорыв в экономике инференса. Но, как обычно, есть нюанс: пока все эти громкие заявления живут только на словах.
Проект находится в закрытой бете, техрепорта нет, доступов нет. Пока выложили только небольшой блог и разбор их механизма внимания.
Посмотрим, что из этого выйдет
😁155 82🤯61❤23🤔13⚡11👍5🤩3👨💻1
Nvidia и один из крупнейших застройщиков США PulteGroup в сотрудничестве со стартапом Span будут устанавливать мини-датацентры на стены новых домов
Чего только не придумаешь, когда нужен компьют для ИИ. Кто-то предлагает строить датацентры в космосе, а вот в стартапе Span придумали концепцию распределенного дата‑центра, расбросанного по тысячам жилых домов.
В партнерстве с Nvidia и PulteGroup они прямо сейчас тестируют XFRA – небольшие вычислительные узлы, которые размещаются снаружи домов и состоят из ~ 16 GPU Blackwell. Умный электрощит Span следит, сколько энергии потребляет дом, и остаточную свободную мощность отдает XFRA на ИИ-нагрузки.
При этом владелец будет получать огромную скидку на тарифы электричества (и, вероятно, платить даже меньше, чем без XFRA) + дополнительный доход.
Фишка в том, что установить много таких ящичков – быстрее и дешевле, чем строить огромный датацентр (по расчетам Span, примерно в 5-6 раз). Так что идея неплохая, не считая рисков, стоимости обслуживания и, конечно, необходимости сложной инфры под все это дело.
К 2027 году Span с этим проектом планирует выйти на гигаваттный масштаб.
Чего только не придумаешь, когда нужен компьют для ИИ. Кто-то предлагает строить датацентры в космосе, а вот в стартапе Span придумали концепцию распределенного дата‑центра, расбросанного по тысячам жилых домов.
В партнерстве с Nvidia и PulteGroup они прямо сейчас тестируют XFRA – небольшие вычислительные узлы, которые размещаются снаружи домов и состоят из ~ 16 GPU Blackwell. Умный электрощит Span следит, сколько энергии потребляет дом, и остаточную свободную мощность отдает XFRA на ИИ-нагрузки.
При этом владелец будет получать огромную скидку на тарифы электричества (и, вероятно, платить даже меньше, чем без XFRA) + дополнительный доход.
Фишка в том, что установить много таких ящичков – быстрее и дешевле, чем строить огромный датацентр (по расчетам Span, примерно в 5-6 раз). Так что идея неплохая, не считая рисков, стоимости обслуживания и, конечно, необходимости сложной инфры под все это дело.
К 2027 году Span с этим проектом планирует выйти на гигаваттный масштаб.
👍152👏35🔥22😁19❤11🤯10😎7 5 3
DeepSeek ведет переговоры о первом раунде внешнего финансирования
Компания планирует привлечь $3–4 млрд при оценке до $50 млрд, как сообщает Reuters.
Правда, большинство денег, скорее всего, все равно вложит государство. А точнее, Китайский национальный фонд искусственного интеллекта. Кроме того, принять участие в раунде может Tencent Holdings.
Напоминаем, что DeepSeek ранее отказывался от внешних инвестиций, но теперь, судя по всему, меняет стратегию.
Компания планирует привлечь $3–4 млрд при оценке до $50 млрд, как сообщает Reuters.
Правда, большинство денег, скорее всего, все равно вложит государство. А точнее, Китайский национальный фонд искусственного интеллекта. Кроме того, принять участие в раунде может Tencent Holdings.
Напоминаем, что DeepSeek ранее отказывался от внешних инвестиций, но теперь, судя по всему, меняет стратегию.
❤84👍33🔥18😁9
This media is not supported in your browser
VIEW IN TELEGRAM
Yandex ML Challenge — новое соревнование с задачами по ИИ и финалом на Young Con 2026
Кого ждем:
Студентов, выпускников и учеников 11-х классов — тех, кто любит решать соревнования по машинному обучению
Что нужно знать:
На длинном онлайн-туре вас ждут 3 задачи: CV (компьютерное зрение), LLM (большие языковые модели) и RL (обучение с подкреплением).
Регистрируйтесь сейчас и приступайте к задачам 21 мая в 16:00 мск
Таймлайн:
С 21 по 31 мая — длинный онлайн-тур, где определим топ-100 финалистов с самым высоким суммарным рейтингом
25 июня состоится очный финал на Young Con 2026: масштабном фестивале о технологиях и старте карьеры в IT
Победителю соревнования достанется приз в размере 1 млн рублей.
А топ-15 финалистов получат набор умных устройств от Яндекса.
Регистрация открыта
Кого ждем:
Студентов, выпускников и учеников 11-х классов — тех, кто любит решать соревнования по машинному обучению
Что нужно знать:
На длинном онлайн-туре вас ждут 3 задачи: CV (компьютерное зрение), LLM (большие языковые модели) и RL (обучение с подкреплением).
Регистрируйтесь сейчас и приступайте к задачам 21 мая в 16:00 мск
Таймлайн:
С 21 по 31 мая — длинный онлайн-тур, где определим топ-100 финалистов с самым высоким суммарным рейтингом
25 июня состоится очный финал на Young Con 2026: масштабном фестивале о технологиях и старте карьеры в IT
Победителю соревнования достанется приз в размере 1 млн рублей.
А топ-15 финалистов получат набор умных устройств от Яндекса.
Регистрация открыта
🗿37😁27👍10❤5🤯4🔥1
Gemma-4 теперь умеет предсказывать токены не по одному, а партиями
Google только что выпустили Multi-Token Prediction (MTP) драфтеры. Это штука, которая позволяет Gemma-4 предсказывать сразу несколько токенов вперед.
Обычно LLM генерируют строго по одному токену за шаг, и это одна из главных проблем архитектуры трансформеров, потому что работает медленно.
Что сделали Google:
– Они взяли еще одну модель, крошечную, обучили ее на задаче multi-token prediction, и поставили на роль drafter. Называется так, потому что эта модель пишет черновики, то есть пытается угадать действия большой модели на несколько токенов вперед.
– Батч черновых токенов проверяет основная модель. Фишка в том, что на проверку нужен всего один проход (вместо нескольких, если бы модель генерировала все эти токены сама).
– Если в черновой последовательности попадается ошибка, то: (1) этот токен заменяется на тот, который большая модель считает верным; (2) проверка прерывается и дальше драфтер предсказывает новую партию с этого места.
Например, мы сгенерировали 5 черновых токенов. Три перых совпало, четвертый заменили. Всего сэкономили три прохода большой модели.
Итог: MTP ускоряет генерацию примерно в 3 раза вообще без потерь в качестве. Все драфтеры выложили, так что уже можно попробовать погенерить что-нибудь в таком режиме.
blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/
Google только что выпустили Multi-Token Prediction (MTP) драфтеры. Это штука, которая позволяет Gemma-4 предсказывать сразу несколько токенов вперед.
Обычно LLM генерируют строго по одному токену за шаг, и это одна из главных проблем архитектуры трансформеров, потому что работает медленно.
Что сделали Google:
– Они взяли еще одну модель, крошечную, обучили ее на задаче multi-token prediction, и поставили на роль drafter. Называется так, потому что эта модель пишет черновики, то есть пытается угадать действия большой модели на несколько токенов вперед.
– Батч черновых токенов проверяет основная модель. Фишка в том, что на проверку нужен всего один проход (вместо нескольких, если бы модель генерировала все эти токены сама).
– Если в черновой последовательности попадается ошибка, то: (1) этот токен заменяется на тот, который большая модель считает верным; (2) проверка прерывается и дальше драфтер предсказывает новую партию с этого места.
Например, мы сгенерировали 5 черновых токенов. Три перых совпало, четвертый заменили. Всего сэкономили три прохода большой модели.
Итог: MTP ускоряет генерацию примерно в 3 раза вообще без потерь в качестве. Все драфтеры выложили, так что уже можно попробовать погенерить что-нибудь в таком режиме.
blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/
5👍216🔥83❤36🤔8🤯7😁3
Anthropic 🤝 SpaceX
Компании Дарио Амодеи и Илона Маска только что объявили о крупном партнерстве.
SpaceXAI предоставит Anthropic доступ ко всей вычислительной мощности дата-центра Colossus 1 в Мемфисе. Это примерно 300 мегаватт вычислительных мощностей или 220к GPU.
Это одна из крупнейших инфраструктурных договоренностей в секторе на данный момент.
В честь закрытия сделки Anthropic уже: удвоили 5-часовые лимиты для платных подписок; полностью убрали сокращение лимитов в пиковые часы (ура!); и повысили лимиты на Opus в API, включая RPM, TPM и квоты. Дальше обещают больше.
Сумма сделки не разглашается.
Компании Дарио Амодеи и Илона Маска только что объявили о крупном партнерстве.
SpaceXAI предоставит Anthropic доступ ко всей вычислительной мощности дата-центра Colossus 1 в Мемфисе. Это примерно 300 мегаватт вычислительных мощностей или 220к GPU.
Это одна из крупнейших инфраструктурных договоренностей в секторе на данный момент.
В честь закрытия сделки Anthropic уже: удвоили 5-часовые лимиты для платных подписок; полностью убрали сокращение лимитов в пиковые часы (ура!); и повысили лимиты на Opus в API, включая RPM, TPM и квоты. Дальше обещают больше.
Сумма сделки не разглашается.
🔥281❤60👍29🤯10🤔4👏3😁2🕊1
Агенты Anthropic теперь будут самостоятельно улучшаться в свободное время
Компания запустила в рисерч превью функцию dreaming. Она активируется в простое между сессиями и позволяет агенту «самообучаться».
claude.com/blog/new-in-claude-managed-agents
Модель в фоновом режиме просматривает предыдущие взаимодействия, выявляет паттерны типа повторяющихся ошибок, общих предпочтений пользователей или типовых рабочих процессов. Затем на основе анализа агент обновляет свою память, добавляя туда эффективные паттерны и правила.
Можно выбрать автоматическое обновление или с ручным подтверждением. Теоретически, оптимизация должна быть ощутимая: это не только про качество работы агента как таковое, но и про компактную память и, следовательно, снижение потребления ресурсов.
Пока функция работает только в рамках Claude Managed Agents, запросить доступ можно здесь
Ждем, пока покатят на Claude Code
Компания запустила в рисерч превью функцию dreaming. Она активируется в простое между сессиями и позволяет агенту «самообучаться».
claude.com/blog/new-in-claude-managed-agents
Модель в фоновом режиме просматривает предыдущие взаимодействия, выявляет паттерны типа повторяющихся ошибок, общих предпочтений пользователей или типовых рабочих процессов. Затем на основе анализа агент обновляет свою память, добавляя туда эффективные паттерны и правила.
Можно выбрать автоматическое обновление или с ручным подтверждением. Теоретически, оптимизация должна быть ощутимая: это не только про качество работы агента как таковое, но и про компактную память и, следовательно, снижение потребления ресурсов.
Пока функция работает только в рамках Claude Managed Agents, запросить доступ можно здесь
Ждем, пока покатят на Claude Code
👍150🔥51❤27🕊4🤨2🤯1
После объявления о партнерстве SpaceX и Anthropic в X пошла волна мемов. Вашему вниманию:
😁202🔥67❤20👍5🤔1🤯1🤝1