Claude Opus 4 и 4.1 впервые в мире получили функцию «завершения диалога»
Теперь, если вы слишком долго будете пытаться выбить из бота что-то запрещенное или не прекращая оскорблять кого-то, включая саму модель, она может решить просто не говорить с вами дальше и завершить диалог.
Говорят, что большинство пользователей никогда с таким не столкнется, потому что функция активируется только как последнее средство, когда все попытки перенаправить диалог в конструктивное русло не дали результата. И тем не менее, это вообще первый в мире случай, когда у модели появляется что-то типа права выбирать, «хочет» ли она вести диалог.
И Anthropic утверждают, что делают это НЕ потому что наделяют ИИ сознанием. В то же время, они вводят термин «model welfare», то есть «благополучие модели» и не отрицают возможности обсуждать, например, стресс моделей или их поведенческие реакции в контексте элаймента и безопасности.
www.anthropic.com/research/end-subset-conversations
Теперь, если вы слишком долго будете пытаться выбить из бота что-то запрещенное или не прекращая оскорблять кого-то, включая саму модель, она может решить просто не говорить с вами дальше и завершить диалог.
Говорят, что большинство пользователей никогда с таким не столкнется, потому что функция активируется только как последнее средство, когда все попытки перенаправить диалог в конструктивное русло не дали результата. И тем не менее, это вообще первый в мире случай, когда у модели появляется что-то типа права выбирать, «хочет» ли она вести диалог.
И Anthropic утверждают, что делают это НЕ потому что наделяют ИИ сознанием. В то же время, они вводят термин «model welfare», то есть «благополучие модели» и не отрицают возможности обсуждать, например, стресс моделей или их поведенческие реакции в контексте элаймента и безопасности.
www.anthropic.com/research/end-subset-conversations
1🗿105 46👍35❤31😁12 11🔥7🤯2 2👌1
Data Secrets
Claude Opus 4 и 4.1 впервые в мире получили функцию «завершения диалога» Теперь, если вы слишком долго будете пытаться выбить из бота что-то запрещенное или не прекращая оскорблять кого-то, включая саму модель, она может решить просто не говорить с вами дальше…
Пример того, как это будет работать
2😁424 111 23❤8🗿5 5😎3🔥2💯2👏1🤯1
Media is too big
VIEW IN TELEGRAM
Qwen только что релизнули собственную Image Edit модель
В основе Qwen Image 20B – она была выпущена 4 августа. А Edit версия – это моделька специально для редактирования изображений: всяких там изменений стиля, корректировок деталей, добавления или удаления объектов, изменение поз и прочего.
Сам Qwen Image – это мультимодальный диффузионный трансформер (MMDiT). А Edit – затюненная версия, в которую добавили к тому же двойное кодирование входного изображения: VAE Encoder для контроля визуала и Qwen2.5-VL для семантического понимания, то есть управления смыслом изменений.
Ну и результаты довольно приятные. По крайней мере, по первым примерам. К тому же в чате можно попробовать бесплатно.
Ну и конечно, все как всегда в опенсорсе (веса, гитхаб)
Короче, теперь у Qwen сформировалась настоящая полноценная экосистема моделей на любой вкус и задачу, с чем мы нас всех и поздравляем
В основе Qwen Image 20B – она была выпущена 4 августа. А Edit версия – это моделька специально для редактирования изображений: всяких там изменений стиля, корректировок деталей, добавления или удаления объектов, изменение поз и прочего.
Сам Qwen Image – это мультимодальный диффузионный трансформер (MMDiT). А Edit – затюненная версия, в которую добавили к тому же двойное кодирование входного изображения: VAE Encoder для контроля визуала и Qwen2.5-VL для семантического понимания, то есть управления смыслом изменений.
Ну и результаты довольно приятные. По крайней мере, по первым примерам. К тому же в чате можно попробовать бесплатно.
Ну и конечно, все как всегда в опенсорсе (веса, гитхаб)
Короче, теперь у Qwen сформировалась настоящая полноценная экосистема моделей на любой вкус и задачу, с чем мы нас всех и поздравляем
7🔥166👍31❤26🤗4👏3😁2🤯2
Ха, Meta* открыли в своей новой лаборатории «обычную» вакансию не за миллионы долларов
Позиция – Product Operations Manager. Ставка – всего лишь 122 000-177 000 $ в год.
То есть, по самым грубым рассчетам, «бедняга» будет получать в десятки раз меньше всех своих коллег🥹
Непонятно, как вообще выживать на такую сумму…
www.metacareers.com/jobs/717327034414949
Позиция – Product Operations Manager. Ставка – всего лишь 122 000-177 000 $ в год.
То есть, по самым грубым рассчетам, «бедняга» будет получать в десятки раз меньше всех своих коллег
Непонятно, как вообще выживать на такую сумму…
www.metacareers.com/jobs/717327034414949
Please open Telegram to view this post
VIEW IN TELEGRAM
3😁119😎45🤯15❤9👍4☃1
Сейчас будет интересная история про ИИ и физику
В Caltech есть специальная команда физиков, которая занимается поиском самых точных способов измерить гравитационные волны – крошечные колебания пространства-времени, возникающие при столкновениях черных дыр и других космических катастрофах.
Для этих целей был даже построен гигантский детектор LIGO, способный замечать изменения длины тоннелей в миллиард раз меньше атома. Тем не менее, даже точность LIGO ограничена, и его чувствительность ученые пытались повысить кучу лет подряд.
Так вот в апреле этого года они решили попробовать новый метод и применить ИИ для поиска новых конфигураций прибора. Использовались, если что, специализированные системы, специально заточенные под многомерную оптимизацию и перебор вариантов.
И тут начались странности. Алгоритмы начали буквально фантазировать и вместо знакомых ученым симметричных схем выдавать что-то с первого взгляда совершенно хаотичное. В общем, в глазах исследователей это выглядело как галлюцинации.
Но проходит несколько месяцев тестов, и тут одна из таких инопланетных схем, выдуманная ИИ, вдруг повышает чувствительность детектора на 10–15%. Для фундаментальной науки это скачок на годы вперёд.
Это не все. Система не просто нашла лучшие решения, а внезапно переоткрыла старый советский закон, о котором научное сообщество почти забыло. Дело в том, что он был открыт еще несколько десятилетий назад, но до этого дня никто не пытался реализовать эту идею на практике. И тут в 2025 году ее воссоздала уже ИИ-система🚨
Ну разве не в удивительное время живем?
www.wired.com/story/ai-comes-up-with-bizarre-physics-experiments-but-they-work/
В Caltech есть специальная команда физиков, которая занимается поиском самых точных способов измерить гравитационные волны – крошечные колебания пространства-времени, возникающие при столкновениях черных дыр и других космических катастрофах.
Для этих целей был даже построен гигантский детектор LIGO, способный замечать изменения длины тоннелей в миллиард раз меньше атома. Тем не менее, даже точность LIGO ограничена, и его чувствительность ученые пытались повысить кучу лет подряд.
Так вот в апреле этого года они решили попробовать новый метод и применить ИИ для поиска новых конфигураций прибора. Использовались, если что, специализированные системы, специально заточенные под многомерную оптимизацию и перебор вариантов.
И тут начались странности. Алгоритмы начали буквально фантазировать и вместо знакомых ученым симметричных схем выдавать что-то с первого взгляда совершенно хаотичное. В общем, в глазах исследователей это выглядело как галлюцинации.
Но проходит несколько месяцев тестов, и тут одна из таких инопланетных схем, выдуманная ИИ, вдруг повышает чувствительность детектора на 10–15%. Для фундаментальной науки это скачок на годы вперёд.
Это не все. Система не просто нашла лучшие решения, а внезапно переоткрыла старый советский закон, о котором научное сообщество почти забыло. Дело в том, что он был открыт еще несколько десятилетий назад, но до этого дня никто не пытался реализовать эту идею на практике. И тут в 2025 году ее воссоздала уже ИИ-система
Ну разве не в удивительное время живем?
www.wired.com/story/ai-comes-up-with-bizarre-physics-experiments-but-they-work/
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤263🤯127🔥64👍12😁9😍8👀5🤔4 4☃2🤨1
У Авито вышло очень информативное интервью про ИИ в бизнесе, архитектуры и социальные эффекты от генеративок
Управляющий партнер Авито Иван Гуз без приукрас и очень емко ответил сразу на много основополагающих вопросов. Наш топ-3 вопрос-ответ, кратко:
1️⃣ Произошло ли массовое принятие технологии?
2️⃣ Какая окупаемость продуктов на базе генеративного ИИ?
3️⃣ На каком этапе развития искусственного интеллекта мы сейчас находимся?
Интервью полностью читаем здесь
Управляющий партнер Авито Иван Гуз без приукрас и очень емко ответил сразу на много основополагающих вопросов. Наш топ-3 вопрос-ответ, кратко:
Уровень использования ИИ в качестве помощников растет экспоненциально. То есть сомнений в том, что все будут использовать искусственный интеллект, не возникает.
Есть технологии, которые живут под капотом, улучшают всю нашу рекламную модель и реально окупаются. Это трансформеры, за счет которых релевантность всех наших поисковых выдач, рекомендаций существенно возрастает.
В других сценариях мы, например, автоматически рекомендуем описание товара по картинкам, которые были загружены. Здесь GenAI помогает сокращать трудозатраты, потому что большой объем информации изначально создает за пользователя.
Но есть агенты, их мы только начинаем тестировать. Мы верим, что мир в итоге придет к использованию агентского ИИ, поэтому и мы продолжаем идти в этом направлении.
Текущие архитектуры достигли определенного предела, и надо думать про создание не больших языковых моделей, а про создание так называемых world models, то есть моделей, которые понимают не только слова.
Интервью полностью читаем здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤨68❤28👍20🗿15😁13🔥6👨💻1😎1
Вышел DeepSeek-V3.1
Веса base модели уже лежат на HF, вот тут, но официального анонса еще нет. Пока ждем, вот что уже известно:
– Увеличили контекст до 128к токенов
– Знания теперь до июля 2024
– Архитектура не изменилась, но вроде как теперь модель гибридная
Несмотря на последний пункт, пока релиз выглядит как небольшой апдейт. Ждем бенчмарки и официальный блогпост🤔
Веса base модели уже лежат на HF, вот тут, но официального анонса еще нет. Пока ждем, вот что уже известно:
– Увеличили контекст до 128к токенов
– Знания теперь до июля 2024
– Архитектура не изменилась, но вроде как теперь модель гибридная
Несмотря на последний пункт, пока релиз выглядит как небольшой апдейт. Ждем бенчмарки и официальный блогпост
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍107🔥28🐳24 9❤7👌2☃1😁1🤗1 1
Альтман внезапно заявил, что ИИ может оказаться пузырем
(Да-да, главное говорить это уже после выпуска GPT-5)
Сэм сравнил рыночные условия с бумом доткомов в девяностых. Тогда тоже была массовая гонка инвестиций, но затем всего за 2 года главная американская фондовая биржа Nasdaq потеряла почти 80% своей стоимости: многие компании так и не смогли выйти на прибыль.
К слову, если текущее состояние рынка – все-таки пузырь, то он уже сейчас больше, чем интернет-пузырь. От этом недавно писал в своем отчете известный экономист с Уолл-стрит Торстен Слок. По его словам, текущие показатели переоценки акций (фактически цена к ожидаемой прибыли) для топ‑10 компаний сегодня сильно выше, чем это было тогда. График наверху.
Ну что, у кого какие идеи для стартапов?🙂
(Да-да, главное говорить это уже после выпуска GPT-5)
Сэм сравнил рыночные условия с бумом доткомов в девяностых. Тогда тоже была массовая гонка инвестиций, но затем всего за 2 года главная американская фондовая биржа Nasdaq потеряла почти 80% своей стоимости: многие компании так и не смогли выйти на прибыль.
«Пузыри формируются, когда умные люди начинают слишком увлекаться какой-то хорошей идеей. Находимся ли мы в фазе, когда инвесторы в целом слишком увлечены ИИ? По-моему, да. Но при этом остается ли ИИ самым важным событием в мире за долгое время? По-моему, тоже да»
К слову, если текущее состояние рынка – все-таки пузырь, то он уже сейчас больше, чем интернет-пузырь. От этом недавно писал в своем отчете известный экономист с Уолл-стрит Торстен Слок. По его словам, текущие показатели переоценки акций (фактически цена к ожидаемой прибыли) для топ‑10 компаний сегодня сильно выше, чем это было тогда. График наверху.
Ну что, у кого какие идеи для стартапов?
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁178 62❤33👍16 4🤔3🔥1
В догонку к утреннему посту про ИИ-пузырь: MIT выяснили, что в индустрии фейлятся 95% пилотных внедрений ИИ
Дисклеймер: видели, что много где эта новость подается под видом «95% ИИ-стартапов терпят провалы», но все не совсем так. Сразу уточняем⬇️
Пилотный запуск – это не только стартапы. Это также внедрение ИИ (именно генеративного) в компаниях любого типа. Причем, опять же, это не обязательно про продукт: под внедрением может подразумеваться даже запуск небольшой фичи.
Ну так вот. Отчет MIT основан на 150 интервью с руководителями, опросе 350 сотрудников и анализе 300 публичных проектов внедрения генеративного ИИ.
Основная цифра: только 5% пилотных внедрений генеративного ИИ приводят к быстрому росту выручки, а остальные остаются малозаметными, не влияя на прибыль компаний.
Звучит так себе, конечно. Но вот на что стоит обратить внимание:
1. Компании допускают очевидные ошибки в стратегиях. Более 50% бюджетов на генеративный ИИ направляются в продажи и маркетинг, хотя MIT отмечает, что максимальный ROI – это про автоматизацию бэк-офисных задач типа оптимизации операций.
2. Если компании покупают решения, а не пытаются придумывать что-то сами, то успех уже наблюдается в 67% случаев.
3. Не берется в расчет теневой ИИ. То есть неофициальное использование сотрудниками чат-ботов, агентов и других инструментов для работы.
И вот уже получается, что если копнуть глубже, то все не так уж и плохо. Судите сами, в общем. Отчет вот (доступ через форму)
Дисклеймер: видели, что много где эта новость подается под видом «95% ИИ-стартапов терпят провалы», но все не совсем так. Сразу уточняем
Пилотный запуск – это не только стартапы. Это также внедрение ИИ (именно генеративного) в компаниях любого типа. Причем, опять же, это не обязательно про продукт: под внедрением может подразумеваться даже запуск небольшой фичи.
Ну так вот. Отчет MIT основан на 150 интервью с руководителями, опросе 350 сотрудников и анализе 300 публичных проектов внедрения генеративного ИИ.
Основная цифра: только 5% пилотных внедрений генеративного ИИ приводят к быстрому росту выручки, а остальные остаются малозаметными, не влияя на прибыль компаний.
Звучит так себе, конечно. Но вот на что стоит обратить внимание:
1. Компании допускают очевидные ошибки в стратегиях. Более 50% бюджетов на генеративный ИИ направляются в продажи и маркетинг, хотя MIT отмечает, что максимальный ROI – это про автоматизацию бэк-офисных задач типа оптимизации операций.
2. Если компании покупают решения, а не пытаются придумывать что-то сами, то успех уже наблюдается в 67% случаев.
3. Не берется в расчет теневой ИИ. То есть неофициальное использование сотрудниками чат-ботов, агентов и других инструментов для работы.
И вот уже получается, что если копнуть глубже, то все не так уж и плохо. Судите сами, в общем. Отчет вот (доступ через форму)
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍97❤31😁23🔥3🦄2
Data Secrets
Илон Маск заявил, что в xAI и SpaceX нет рисерчеров – а есть только инженеры Термин «рисерчер» он назвал чопорным и малоответственным, и сказал, что это пережиток академической среды. Он утверждает, что рисерчеры в xAI не нужны, потому что у него работают…
Настроение, когда ушел из xAI, в котором запрещено слово «рисерчер», и теперь наконец-то можешь выговориться
2😁417👍31❤24 8🔥6🗿4
Исследование: в России прогнозируется двукратный рост рынка ПО и ИТ-услуг к 2032 году
Объём рынка тиражного программного обеспечения (ПО) в России увеличился с 287 млрд рублей в 2022 году до 448 млрд рублей в 2024-м, демонстрируя среднегодовой рост на 25%, - так перспективы рынка ИТ в своем свежем исследовании оценивает консалтинговая компания Б1.
В числе ключевых драйверов роста эксперты называют импортозамещение, активное внедрение цифровых технологий и модернизация систем, приложений с интеграцией в них функционала AI. Особенно заметный вклад в развитие сектора вносят госпредприятия и бизнес, переходящие на отечественные программные решения.
По оценкам аналитиков, к 2032 году объем рынка ИТ-услуг может превысить 1,1 трлн рублей, при этом заказная разработка к 2032 году вырастет почти вдвое – до 282 млрд руб. Последнему сегменту в исследовании уделяется особое внимание: за год он вырос уже на 12% и достиг 150 млрд рублей в 2024 году. Среди лидеров этого направления Б1 выделяет «FabricaONE.AI» (11%), «БФТ-холдинг» (7%) и «Ланит» (6%).
Дальше рынок явно будет консолидироваться – игроков много, а спрос на продукты с интеграцией продвинутых технологий (аналитики, AI, BI) только усиливается. Наглядная иллюстрация выражения «Успех – это успеть».
Объём рынка тиражного программного обеспечения (ПО) в России увеличился с 287 млрд рублей в 2022 году до 448 млрд рублей в 2024-м, демонстрируя среднегодовой рост на 25%, - так перспективы рынка ИТ в своем свежем исследовании оценивает консалтинговая компания Б1.
В числе ключевых драйверов роста эксперты называют импортозамещение, активное внедрение цифровых технологий и модернизация систем, приложений с интеграцией в них функционала AI. Особенно заметный вклад в развитие сектора вносят госпредприятия и бизнес, переходящие на отечественные программные решения.
По оценкам аналитиков, к 2032 году объем рынка ИТ-услуг может превысить 1,1 трлн рублей, при этом заказная разработка к 2032 году вырастет почти вдвое – до 282 млрд руб. Последнему сегменту в исследовании уделяется особое внимание: за год он вырос уже на 12% и достиг 150 млрд рублей в 2024 году. Среди лидеров этого направления Б1 выделяет «FabricaONE.AI» (11%), «БФТ-холдинг» (7%) и «Ланит» (6%).
Дальше рынок явно будет консолидироваться – игроков много, а спрос на продукты с интеграцией продвинутых технологий (аналитики, AI, BI) только усиливается. Наглядная иллюстрация выражения «Успех – это успеть».
1😁78🗿22👍11❤7🤯5✍4🫡2🦄2❤🔥1
Мем дня: в Америке 16% сотрудников делают вид, что используют ИИ
Все затем, чтобы удовлетворить руководство. 75% работников либо официально, либо неофициально обязаны внедрять ИИ в свою деятельность.
В таких условиях само собой появляется ощущение, что отказ сделает тебя менее компетентным, даже если ИИ тебе по факту и не нужен. И это тоже подтверждают цифры: 22% работников чувствуют давление использовать ИИ даже в тех случаях, когда не уверены в своих навыках работы с ним.
Что тут скажешь. Дожили😐
www.howdy.com/blog/AI-fatigue-statistics
Все затем, чтобы удовлетворить руководство. 75% работников либо официально, либо неофициально обязаны внедрять ИИ в свою деятельность.
В таких условиях само собой появляется ощущение, что отказ сделает тебя менее компетентным, даже если ИИ тебе по факту и не нужен. И это тоже подтверждают цифры: 22% работников чувствуют давление использовать ИИ даже в тех случаях, когда не уверены в своих навыках работы с ним.
Что тут скажешь. Дожили
www.howdy.com/blog/AI-fatigue-statistics
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁186👍23❤16 12 9❤🔥1
Разбираем статью подписчика: дискретный подход к машинному обучению
Авторы (один из них – @x7CFE) предлагают перейти от привычных нейросетей и методов их обучения к работе с дискретными элементами – разреженными битовыми векторами.
Идея основана на том, как кодирует и обрабатывает информацию мозг живого существа. В частности, прототипом послужило строение неокортекса, гиппокампа и других его определяющих частей. По части теории исследователи опирались на гипотезу многообразия и лемму Йонеды, а на практике работает все примерно так:
1. Исходные данные кодируются в так называемые стимулы – как раз те самые битовые векторы. Кодирование происходит по набору правил, то есть это не привычные эмбеддинги. Но полезные свойства сохраняются: стимулы похожих понятий похожи друг на друга.
2. Полученные векторы наносятся на плоскость и происходит кластеризация, выявление паттернов и структур. Для каждого кластера формируется детектор, из которого мы получаем дискретные структурные эмбеддинги.
3. Эти эмбеддинги показывают, какие кластеры активируются, когда модель видит новое поступающее на вход слово. Далее процесс повторяется на следующем уровне иерархии.
То есть обучение превращается в изучение четких ассоциаций, а инференс – в поиск соответствий в памяти. И получается, что:
– Модель более устойчива к галлюцинациям
– Память можно редактировать в любое время, добавлять в нее что-то или удалять (привет элаймент и machine unlearning!)
– Это не черный ящик: все шаги модели интерпретируемы и понятны
Модель тестировали на нескольких задачах, в том числе на медицинских изображениях (да, это работает для разных модальностей). Показано, что она способна понимать и интерпретировать незнакомые данные, улавливать их структуру и четко воспринимать семантику.
В статье приведено еще несколько экспериментов и аргументов, почему это удачный сетап, и чем он лучше современного подхода. Так что советуем почитать полностью, реально интересно ⬇️
- Статья на архив
- Лендинг с версией на русском языке, данными и кодом
- Сообщение автора из нашего чата с кратким разбором результатов
В комментариях приглашаем задавать вопросы лично автору (ну и, конечно, поздравлять его с крутой публикацией!)
Авторы (один из них – @x7CFE) предлагают перейти от привычных нейросетей и методов их обучения к работе с дискретными элементами – разреженными битовыми векторами.
Идея основана на том, как кодирует и обрабатывает информацию мозг живого существа. В частности, прототипом послужило строение неокортекса, гиппокампа и других его определяющих частей. По части теории исследователи опирались на гипотезу многообразия и лемму Йонеды, а на практике работает все примерно так:
1. Исходные данные кодируются в так называемые стимулы – как раз те самые битовые векторы. Кодирование происходит по набору правил, то есть это не привычные эмбеддинги. Но полезные свойства сохраняются: стимулы похожих понятий похожи друг на друга.
2. Полученные векторы наносятся на плоскость и происходит кластеризация, выявление паттернов и структур. Для каждого кластера формируется детектор, из которого мы получаем дискретные структурные эмбеддинги.
3. Эти эмбеддинги показывают, какие кластеры активируются, когда модель видит новое поступающее на вход слово. Далее процесс повторяется на следующем уровне иерархии.
То есть обучение превращается в изучение четких ассоциаций, а инференс – в поиск соответствий в памяти. И получается, что:
– Модель более устойчива к галлюцинациям
– Память можно редактировать в любое время, добавлять в нее что-то или удалять (привет элаймент и machine unlearning!)
– Это не черный ящик: все шаги модели интерпретируемы и понятны
Модель тестировали на нескольких задачах, в том числе на медицинских изображениях (да, это работает для разных модальностей). Показано, что она способна понимать и интерпретировать незнакомые данные, улавливать их структуру и четко воспринимать семантику.
В статье приведено еще несколько экспериментов и аргументов, почему это удачный сетап, и чем он лучше современного подхода. Так что советуем почитать полностью, реально интересно ⬇️
- Статья на архив
- Лендинг с версией на русском языке, данными и кодом
- Сообщение автора из нашего чата с кратким разбором результатов
В комментариях приглашаем задавать вопросы лично автору (ну и, конечно, поздравлять его с крутой публикацией!)
3❤196🔥79 31👍22 14🗿4🤩3🍾3😁1👌1
Внезапно: OpenAI в будущем планирует стать платформой для аренды мощностей типа AWS
Об этом рассказала финансовый директор стартапа. Что это теоретически может означать:
1. Что OpenAI в перспективе планируют переключиться с огромных затрат на обучение на оптимизацию и поддержку в первую очередь инференса. Это чуть не единственный их шанс начать получать прибыль, кстати.
2. И, возможно, для инференса они будут использовать не Nvidia, а какое-то железо подешевле, – а Nvidia как раз сдавать. У Хуанга монополия на чипы для обучения, но под инференс можно попытаться оптимизировать и что-нибудь другое.
3. Ну и RIP огромные бюджеты ресурсов на рисерч, видимо…
Все странноватее и странноватее
Об этом рассказала финансовый директор стартапа. Что это теоретически может означать:
1. Что OpenAI в перспективе планируют переключиться с огромных затрат на обучение на оптимизацию и поддержку в первую очередь инференса. Это чуть не единственный их шанс начать получать прибыль, кстати.
2. И, возможно, для инференса они будут использовать не Nvidia, а какое-то железо подешевле, – а Nvidia как раз сдавать. У Хуанга монополия на чипы для обучения, но под инференс можно попытаться оптимизировать и что-нибудь другое.
3. Ну и RIP огромные бюджеты ресурсов на рисерч, видимо…
Все странноватее и странноватее
1 106 32🤔25❤8😁6⚡2👍1
Наткнулись тут на забавное
Однажды в 1912 году Эйнштейн писал своему другу:
А теперь угадайте, какую именно математику он имеет в виду.
Ответ:тензоры и тензорный анализ . В те годы он работал над проблемой гравитации и тензорный аппарат был ему нужен для того, чтобы описать, как гравитация связана с геометрией пространства-времени.
Короче, теперь вы знаете, чем себя утешить, когда в следующий раз запутаетесь в размерностях тензоров в PyTorch✨
Однажды в 1912 году Эйнштейн писал своему другу:
«Я никогда в жизни так тяжело не работал и теперь испытываю благоговейный ужас перед математикой, которую до сих пор в своей наивности считал просто роскошью в её более утончённых формах! По сравнению с этой задачей исходная теория относительности – детская забава»
А теперь угадайте, какую именно математику он имеет в виду.
Ответ:
Короче, теперь вы знаете, чем себя утешить, когда в следующий раз запутаетесь в размерностях тензоров в PyTorch
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁282🔥32❤21 8🤯7 7👍6🍾5🤔3
Мы наконец-то дождались официального анонса новой DeepSeek-V3.1. Главное:
➖ Инференс действительно гибридный: одна модель, два мода. Причем DeepSeek-V3.1-Think «соображает» быстрее DeepSeek-R1-0528 (см. график 3): для получения тех же результатов тратится намного меньше токенов.
➖ Улучшенный tool use и мультиагентные способности. На Terminal bench перформит в 6 раз лучше R1-0528. На SWE-bench выбивает 66%. Для сравнения, результат gpt-oss – 62%.
➖ Цены: 0.56$/1.68$ за млн токенов. Немного дороже gpt-oss, но дешевле, например, Sonnet. Эти цены вступят в силу 6 сентября + с этой даты перестанут действовать ночные скидки.
И еще раз ссылка на веса: huggingface.co/deepseek-ai/DeepSeek-V3.1
И еще раз ссылка на веса: huggingface.co/deepseek-ai/DeepSeek-V3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥72❤27👍18🤗3🤨2⚡1😁1