Finantial Times пишет, что выход DeepSeek R2 задерживается из-за проблем с Huawei Ascend; насколько это правда, это отдельный вопрос, но из этой новости мы узнаем, что DeepSeek действительно тренируют на Ascend, раньше были только слухи; повторю, что именно это - серьезный вызов монополии nVIDIA; остальные игроки - также американские, к слову - Intel и AMD, пока ничего близкого по уровню не представили
@valuableai
@valuableai
🌚6👍3🤔1
всем привет, сегодня седьмой выпуск подкаста "Капитанский мостик", он как обычно посвящен важным новостям прошедшей недели; мы снова были втроем, я, Дмитрий Колодезев и Алексей Натекин; видео тут:
VK Video
YouTube
присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai)
@valuableai
VK Video
YouTube
присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai)
@valuableai
🔥6
вроде бы не замеченная в желтизне Wall Street Journal пишет (даю ссылку на РБК, т.к. в WSJ - пейвол) , что люди в Силиконовой долине отдают по 50 тысяч долларов за то, чтобы выбрать наиболее подходящий эмбрион для беременности - тот, у которого потенциально будет наивысший IQ; оправдывают это тем, что человечеству нужно защищаться от ИИ
мне это напоминает Гаттаку и "О дивный новый мир", первое - это отличное кино, а по второму сняли недавно сериал, книга того стоит, сериал я не смотрел; суть обоих произведений как раз сводится к евгенике (выведению лучшего в физиологическом смысле подвида человека); правда, в обоих же произведениях не упомянут ИИ, но на мой взгляд он и в этот раз за уши притянут
@valuableai
мне это напоминает Гаттаку и "О дивный новый мир", первое - это отличное кино, а по второму сняли недавно сериал, книга того стоит, сериал я не смотрел; суть обоих произведений как раз сводится к евгенике (выведению лучшего в физиологическом смысле подвида человека); правда, в обоих же произведениях не упомянут ИИ, но на мой взгляд он и в этот раз за уши притянут
@valuableai
🤔8💊3👍2
в последнее время только ленивый не написал про то, что Интернет погибает, например, вот BBC; они разгоняют панику по поводу ИИ-саммари по запросу от Google; раньше уже были жалобы на ChatGPT, что они съедают поисковый трафик, и еще StackOverflow жаловались на снижение посещаемости; особо смешно последнее, т.к. трафик SO стал падать задолго до появления ChatGPT
на мой взгляд идет нормальный естественный отбор: ресурс - человеческое внимание, ограниченное 24 часами в сутки - конечен, его потребителей расплодилось очень много, выживет сильнейший; мы, как пользователи, скорее всего и не заметим пропажи проигравших
@valuableai
на мой взгляд идет нормальный естественный отбор: ресурс - человеческое внимание, ограниченное 24 часами в сутки - конечен, его потребителей расплодилось очень много, выживет сильнейший; мы, как пользователи, скорее всего и не заметим пропажи проигравших
@valuableai
💯18👎2
хочу поделиться статьей, которая меня удивила - я не думал, что в 2025 году кто-то всерьез продолжает заниматься контекстно-независимыми векторными представлениями слов (типа word2vec); однако реальность всегда богаче наших фантазий, и группа Кристофера Мэннинга выпустила статью про обновленный GloVe
для оценивания, к примеру, они используют тот же WordSim353, как 10 лет назад; тут нужно оговориться, что каждый инструмент хорош для своих задач и для быстрой классификации, например, тот же fasttext все также отлично работает; но все равно, как на машине времени проехался
@valuableai
для оценивания, к примеру, они используют тот же WordSim353, как 10 лет назад; тут нужно оговориться, что каждый инструмент хорош для своих задач и для быстрой классификации, например, тот же fasttext все также отлично работает; но все равно, как на машине времени проехался
@valuableai
🔥12❤3😁3👍1🤯1
спасибо моему подписчику, который попросил разобрать статью про Hierarchical Reasoning Model; на мой взгляд - это очередная попытка переизобрести рекуррентные нейронные сети; берется два трансформерных блока, один из которых работает все время, а другой - только изредка; на первой картинке графическое представление, на второй - упрощенный код
такой подход позволяет при минимуме весов показать хорошие результаты на ARC и других логических задачах (третья картинка); про время исполнения по сравнению с текущими моделями не пишут, что интересно
@valuableai
такой подход позволяет при минимуме весов показать хорошие результаты на ARC и других логических задачах (третья картинка); про время исполнения по сравнению с текущими моделями не пишут, что интересно
@valuableai
👍5
Claude 4 теперь может обрабатывать до 1 миллиона входных токенов; вообще это не есть что-то удивительное, например, у Gemini такое было год назад; nVIDIA ведет специальный репозиторий под характерным названием "линейка" для таких сравнений; у них там даже есть специальная колонка "эффективная длина контекста" для отличения от заявленной; как говорится, на словах ты - Лев Толстой, а на деле не то, что "Войну и мир", а скромный рассказик не напишешь
Claude пока линейкой не померяли, так что ждем
@valuableai
Claude пока линейкой не померяли, так что ждем
@valuableai
👍12🔥1
недавно говорили про евгенику в Калифорнии и вот подоспел ответ из-за океана (Тихого): китайские ученые разработали искусственную матку, в 2017 году эта группа продемонстрировала донашивание ягненка; а в следующем году они обещают уже такой аппарат доступный для всех желающих - всего за миллион рублей (100 тысяч юаней); будущее уже здесь, такие дела
@valuableai
@valuableai
⚡5👍2🌚2❤1👎1
пока я был в отпуске, вышла интересная статья про рассуждения; авторы попробовали посмотреть на рассуждения с точки зрения нескольких простых атрибутов - длины (в токенах и по количеству шагов рассуждения), формата и самой задачи; начнем с последнего (первая картинка), т.к. оно самое непонятное; идея в том, чтобы взять базовые трансформации и просить модель воспроизводить их некоторую комбинацию; длина, я думаю, очевидна из названия; а формат - это стандартная атака на LLM в виде убирания/добавления токена и т.п.
в статье демонстрируется, что модели не устойчивы ни по одному из заявленных параметров; неустойчивость к атакам демонстрировали уже давно, обобщаемость на новые задачи также ожидаемо отсутствует, но на длину рассуждения была надежда; однако же нет (вторая картинка): если изначально учить модель на два шага рассуждений, то она не умеет делать рассуждения в один шаг, а если ее этому учить, то разучивается делать двухшаговые
QED: модели отступать от выученных шаблонов не приспособлены
@valuableai
в статье демонстрируется, что модели не устойчивы ни по одному из заявленных параметров; неустойчивость к атакам демонстрировали уже давно, обобщаемость на новые задачи также ожидаемо отсутствует, но на длину рассуждения была надежда; однако же нет (вторая картинка): если изначально учить модель на два шага рассуждений, то она не умеет делать рассуждения в один шаг, а если ее этому учить, то разучивается делать двухшаговые
QED: модели отступать от выученных шаблонов не приспособлены
@valuableai
🤔2👍1
я эту тему как-то пропустил, хотя началась она еще 10 лет назад, тема эта - электронные татуировки (как на первой картинке), кому что, а мне вспоминается Cyberpunk 2077 (вторая картинка, не так много отличий, правда? ); всплыла она в связи с тем, что про нее опять вспомнил Билл Гейтс; причем не просто вспомнил, а заявил, что они заменят смартфоны; мы не так давно обсуждали замену смартфона от Rabbit, iyO; на мой взгляд, такая замена выглядит даже более перспективной, только мне непонятно, как тут происходит вывод информации: у Rabbit есть экранчик, у iyO - динамик, а тут? обещают не имплантировать никаких чипов, только сами чернила; не очень понятно, как происходит ввод, но допустим, оно сможет считывать колебания кожи от звука голоса, а вот вывод я себе не могу представить
@valuableai
@valuableai
🤔3🍓1
товарищи, то, о чем столько лет говорили большевики, произошло: GitHub запретил сгенерированные CoPilot описания пулл-реквестов; я немного преувеличиваю, конечно, но к этому все шло; люди не готовы читать сгенерированные описания, т.к. их банально слишком много
забавно, что на той неделе пришла еще и вторая новость в эту же сторону: Miсrosoft добавила возможность отключать подсказки от CoPilot в VisualStudio
на мой взгляд, вывод из обеих новостей простой - все хорошо в меру, слишком активная "помощь" от ИИ скорее вредит, чем помогает
@valuableai
забавно, что на той неделе пришла еще и вторая новость в эту же сторону: Miсrosoft добавила возможность отключать подсказки от CoPilot в VisualStudio
на мой взгляд, вывод из обеих новостей простой - все хорошо в меру, слишком активная "помощь" от ИИ скорее вредит, чем помогает
@valuableai
❤13🔥3
почти подряд пришло две новости:
1) Microsoft выпустила сеть для генерации голоса VibeVoice; она позволяет генерировать аудио длиной до 90 минут с 4 участниками; и это моделькой, размером в 1.5B; я попробовал генерировать русский, сильный американский акцент слышно и периодически захлебывается, явно на русский не рассчитано, хотя на странице есть пример с китайским
2) OpenAI буквально сегодня ночью выпустила Realtime API для генерации голоса при общении с ChatGPT, кстати, поддерживает SIP
@valuableai
1) Microsoft выпустила сеть для генерации голоса VibeVoice; она позволяет генерировать аудио длиной до 90 минут с 4 участниками; и это моделькой, размером в 1.5B; я попробовал генерировать русский, сильный американский акцент слышно и периодически захлебывается, явно на русский не рассчитано, хотя на странице есть пример с китайским
2) OpenAI буквально сегодня ночью выпустила Realtime API для генерации голоса при общении с ChatGPT, кстати, поддерживает SIP
@valuableai
🆒6