Немецкие ученые выпустили модель, которая имитирует психику человека
Она называется Centaur и обучена предсказывать поведение людей. Для обучения использовали огромный датасет с 160 поведенческими экспериментами и порядком десяти миллионов кейсов человеческих реакций.
То есть модель смотрела на то, как ведут себя разные люди в той или иной ситуации -> запоминала -> училась имитировать.
И в итоге научилась неплохо: точность высокая даже на новых ситуациях, которые модель не видела на трейне. Более того, она может даже оценить время реакции и подробно объяснить, почему человек поведет себя так или иначе.
Звучит жутковато, конечно, но просто представьте, какой тут потенциал для приложений. Систему можно использовать как симуляцию для бесконечных экспериментов, и с помощью нее попытаться лучше понять когнитивную природу человека, его психику и причины разных расстройств. Это, по сути, то, о чем ученые мечтали веками: единая (эмпирическая) теория поведения.
Самое интересное, что Centaur даже согласуется с реальной мозговой активностью: активации сети коррелируют со сканами МРТ живых людей. А под капотом при этом просто Llama-3.1 70B, дотюненная с QLoRA.
Все веса выложены в опенсорс. Сделали даже вариант модели поменьше, его можно легко запустить в колабе.
Киберпанк как он есть
www.nature.com/articles/s41586-025-09215-4
Она называется Centaur и обучена предсказывать поведение людей. Для обучения использовали огромный датасет с 160 поведенческими экспериментами и порядком десяти миллионов кейсов человеческих реакций.
То есть модель смотрела на то, как ведут себя разные люди в той или иной ситуации -> запоминала -> училась имитировать.
И в итоге научилась неплохо: точность высокая даже на новых ситуациях, которые модель не видела на трейне. Более того, она может даже оценить время реакции и подробно объяснить, почему человек поведет себя так или иначе.
Звучит жутковато, конечно, но просто представьте, какой тут потенциал для приложений. Систему можно использовать как симуляцию для бесконечных экспериментов, и с помощью нее попытаться лучше понять когнитивную природу человека, его психику и причины разных расстройств. Это, по сути, то, о чем ученые мечтали веками: единая (эмпирическая) теория поведения.
Самое интересное, что Centaur даже согласуется с реальной мозговой активностью: активации сети коррелируют со сканами МРТ живых людей. А под капотом при этом просто Llama-3.1 70B, дотюненная с QLoRA.
Все веса выложены в опенсорс. Сделали даже вариант модели поменьше, его можно легко запустить в колабе.
Киберпанк как он есть
www.nature.com/articles/s41586-025-09215-4
2 146🔥106👍34❤27🤯21 13 5😁3😎2 2⚡1
OpenAI будет обучать учителей использовать ChatGPT в школах
Стартап присоединился к Американской федерации учителей и запускает пятилетнюю академию, в которой 400 000 учителей будут осваивать и практиковать применение ИИ в своей работе.
Если что, 400 000 – это примерно каждый десятый учитель в Штатах. Все они получат приоритетный доступ к продуктам OpenAI, гранд в виде токенов и кредитов API и бесплатную техподдержку. Плюс – семинары, митапы, воркшопы и онлайн курсы.
Уже представили свою школьную Марь Ивановну на тренинге по ИИ?
Стартап присоединился к Американской федерации учителей и запускает пятилетнюю академию, в которой 400 000 учителей будут осваивать и практиковать применение ИИ в своей работе.
Если что, 400 000 – это примерно каждый десятый учитель в Штатах. Все они получат приоритетный доступ к продуктам OpenAI, гранд в виде токенов и кредитов API и бесплатную техподдержку. Плюс – семинары, митапы, воркшопы и онлайн курсы.
Уже представили свою школьную Марь Ивановну на тренинге по ИИ?
1😁124❤48🤔17👍9🤯8🔥7👏2🤩2🫡1
И снова в эфире рубрика «скандалы и расследования»: Huawei опенсорснули собственную базовую модель, но она оказалась копией Qwen 👽
В общем, совсем недавно Huawei опубликовали модель PanGu – вот веса. И это был не файнтюн какого-то другого опенсорса: основной упор в релизе компания делала именно на то, что они предобучали модель с нуля на собственных чипах Ascend. Мол, посмотрите, не только на Nvidia можно обучать годные модели. Такой вот маркетинговый ход.
И все было окей: адекватные метрики, интересная архитектура и инженерные хаки. Но через несколько дней вышла статья от неких HonestyAGI, в которой они показывают, что веса PanGu – это практически полная копия весов Qwen 2.5.
По графикам корреляция достигает 0.927. То есть, фактически, это та же самая модель, просто немного переупакованная.
В Huawei обвинения отрицают и говорят, что в статье приведены неправильные расчеты. Но вот прикол: журналисты пишут, что анонимный исследователь якобы из команды PanGu подтвердил им, что они не напрямую (?), но действительно переиспользовали веса Qwen. Все, говорит, из-за невероятной скорости гонки ИИ – иначе было не выделиться.
Вот такая история. Huawei с задачей пропиарить свои чипы не сильно справились, но шуму зато наделали много
В общем, совсем недавно Huawei опубликовали модель PanGu – вот веса. И это был не файнтюн какого-то другого опенсорса: основной упор в релизе компания делала именно на то, что они предобучали модель с нуля на собственных чипах Ascend. Мол, посмотрите, не только на Nvidia можно обучать годные модели. Такой вот маркетинговый ход.
И все было окей: адекватные метрики, интересная архитектура и инженерные хаки. Но через несколько дней вышла статья от неких HonestyAGI, в которой они показывают, что веса PanGu – это практически полная копия весов Qwen 2.5.
По графикам корреляция достигает 0.927. То есть, фактически, это та же самая модель, просто немного переупакованная.
В Huawei обвинения отрицают и говорят, что в статье приведены неправильные расчеты. Но вот прикол: журналисты пишут, что анонимный исследователь якобы из команды PanGu подтвердил им, что они не напрямую (?), но действительно переиспользовали веса Qwen. Все, говорит, из-за невероятной скорости гонки ИИ – иначе было не выделиться.
Вот такая история. Huawei с задачей пропиарить свои чипы не сильно справились, но шуму зато наделали много
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2😁149 40❤19👍5🤯5 3🔥2 2
Media is too big
VIEW IN TELEGRAM
Вы гляньте, какая прелесть: HuggingFace только что открыли продажи на этого малыша
Его зовут Reachy Mini, и он опенсорсный. Разработали его буквально за пару месяцев совместно со стартапом Pollen Robotics, который HF купили в апреле.
Reachy может видеть, слышать и говорить. Цена на него начинается от 299 долларов, это в несколько раз дешевле айфона.
И самое прекрасное – робота можно полностью программировать на Python: подключать любые модели с HF или собрать датасет и обучить его чему-то своему. Код открытый, так что придумывать можно вообще все, что хочешь.
Нам такого надо
Его зовут Reachy Mini, и он опенсорсный. Разработали его буквально за пару месяцев совместно со стартапом Pollen Robotics, который HF купили в апреле.
Reachy может видеть, слышать и говорить. Цена на него начинается от 299 долларов, это в несколько раз дешевле айфона.
И самое прекрасное – робота можно полностью программировать на Python: подключать любые модели с HF или собрать датасет и обучить его чему-то своему. Код открытый, так что придумывать можно вообще все, что хочешь.
Нам такого надо
3❤213🔥74 32👍21😁5🤔5 5🤯2👀1🗿1
Акции Nvidia снова подскочили и теперь это первая компания в истории, пробившая капитализацию в 4 триллиона долларов
И это, кстати, несмотря даже на все ограничения экспорта в Китай.
* Для сравнения, Apple стоит 3 триллиона, а ВВП Великобритании – 3.3 триллиона.
Где-то один Дженсен Хуанг считает, сколько кожанок можно купить на 4 триллиона🔵
И это, кстати, несмотря даже на все ограничения экспорта в Китай.
* Для сравнения, Apple стоит 3 триллиона, а ВВП Великобритании – 3.3 триллиона.
Где-то один Дженсен Хуанг считает, сколько кожанок можно купить на 4 триллиона
Please open Telegram to view this post
VIEW IN TELEGRAM
2😁190🔥51🤯25❤9👍8❤🔥6 2👏1
Стрим задержали на час, но теперь наконец-то показывают какие-то бенчмарки.
Основное: 50.7% на Humanity’s Last Exam на максимальном компьюте ризонинга. Для сравнения, предыдущий лидер – Gemini 2.5 Pro – выбивала примерно 22%.
Без использования инструментов результат немного падает – около 25%. Говорят, tool use интегрировали прямо в обучение и теперь Grok исключительно хорошо умеет пользоваться браузером, интерпретатором кода и мультиагентностью: несколько агентов работают параллельно, а затем сравнивают результаты и вместе выдают финальное решение.
Также улучшили voice mode: теперь в голосовом режиме Grok работает еще быстрее и умеет шептать, петь, менять интонации и вот это все.
В чате будут доступны две версии: обычный Grok и Grok Heavy. Grok Heavy, кстати, выбивает 100 процентов на AIME 2025 (RIP очередной бенчмарк).
Все модели и даже API доступны уже сегодня, но за Grok Heavy придется платить 300 долларов в месяц
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤142🔥78👍33 31😁7 5🤯3🏆3✍1
OpenAI близки к тому, чтобы запустить собственный браузер
The Reuters пишут, что это случится уже на следующей неделе. Это будет полноценный конкурент Google Chrome, но (естественно!) на базе ИИ – в частности, агентов и чат-бота.
По классике, обещают, что «продукт изменит то, как люди пользуются поиском в браузере».
Как бы там ни было, это значит одно: у OpenAI будет еще больше данных.
The Reuters пишут, что это случится уже на следующей неделе. Это будет полноценный конкурент Google Chrome, но (естественно!) на базе ИИ – в частности, агентов и чат-бота.
По классике, обещают, что «продукт изменит то, как люди пользуются поиском в браузере».
Как бы там ни было, это значит одно: у OpenAI будет еще больше данных.
❤94👍50👻24🔥11🕊7🤔5🤯5😁4💯3👾2✍1
Media is too big
VIEW IN TELEGRAM
А тем временем другой ИИ-браузер – Comet от Perplexity – вышел уже сегодня
Это первый за три года принципиально новый продукт от Perplexity. Выглядит как обычный браузер, но добавляется окошко чат-бота. По черрипикам тестеров из X выглядит интересно: агента даже можно залогинить в ваши учетки и он сможет автономно (реально автономно, а не как Operator) выполнять какие-то действия от вашего имени.
Comet уже доступен для юзеров подписки Max (200 долларов). Вряд ли кто-то пользуется этим тарифом, поэтому ждем, когда раскатят с лимитами на обычную и бесплатную подписки.
Это первый за три года принципиально новый продукт от Perplexity. Выглядит как обычный браузер, но добавляется окошко чат-бота. По черрипикам тестеров из X выглядит интересно: агента даже можно залогинить в ваши учетки и он сможет автономно (реально автономно, а не как Operator) выполнять какие-то действия от вашего имени.
Comet уже доступен для юзеров подписки Max (200 долларов). Вряд ли кто-то пользуется этим тарифом, поэтому ждем, когда раскатят с лимитами на обычную и бесплатную подписки.
👍138💯28❤18😁18🔥7✍2🤯1
Google продолжают экспериментировать с архитектурами: они выпустили T5Gemma
Большинство современных LM – это decoder-only трансформеры. А T5, напротив, – полноценная encoder-decoder архитектура.
Причем обучали ее не с нуля, а с помощью уже предобученной Gemma-2, которая как раз decoder-only. Веса сначала просто инициализировали с помощью Gemma-2, а затем адаптировали методом UL2.
Интересна архитектура тем, что можно гибко подбирать размер модели. Взял энкодер на 9В и декодер на 2В – получил модель побольше, поменял энкодер – и сделал ее поменьше. Так же можно регулировать баланс между метриками и тяжеловесностью (см таблицу 2 и 3).
Перформит на достойном уровне. Веса доступны тут, а вот блогпост
Большинство современных LM – это decoder-only трансформеры. А T5, напротив, – полноценная encoder-decoder архитектура.
Причем обучали ее не с нуля, а с помощью уже предобученной Gemma-2, которая как раз decoder-only. Веса сначала просто инициализировали с помощью Gemma-2, а затем адаптировали методом UL2.
Интересна архитектура тем, что можно гибко подбирать размер модели. Взял энкодер на 9В и декодер на 2В – получил модель побольше, поменял энкодер – и сделал ее поменьше. Так же можно регулировать баланс между метриками и тяжеловесностью (см таблицу 2 и 3).
Перформит на достойном уровне. Веса доступны тут, а вот блогпост
🔥81👍37❤23🤯6✍2😁2👨💻1🆒1
Grok-4 теперь еще и топ-1 на ARC-AGI и ARC-AGI-2
Вот что пишет про это сама команда ARC-AGI:
Результат действительно красивый. Особенно учитывая, что по стоимости Grok-4 остается на нормальном уровне Claude Opus.
Вот что пишет про это сама команда ARC-AGI:
«Вчера нам позвонили из xAI и сказали, что они хотят протестировать Grok-4. Мы слышали слухи, что он хорош, но не знали, что он будет #1 на ARC-AGI.
Сначала факты: Grok-4 теперь является самой сильной публично доступной моделью на ARC-AGI 1/2. Он даже превосходит специализированные решения с Kaggle.
ARC-AGI-2 создан специально для современных моделей. Чтобы получить хорошие результаты, модели должны освоить мини-навык на серии обучающих примеров, а затем продемонстрировать его во время тестирования.
Предыдущий максимальный результат был около 8% (Opus 4). Но все, что ниже 10% – это просто шум.
Grok 4 демонстрирует результат 15.9%, преодолевая этот шумный барьер и демострируя настоящий ненулевой уровень гибкого интеллекта»
Результат действительно красивый. Особенно учитывая, что по стоимости Grok-4 остается на нормальном уровне Claude Opus.
1🤯177🔥83❤31👍19 11😁3🐳2