Data Secrets
77.3K subscribers
6.03K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Через несколько часов начинается Google I/O. Пересказываем слухи о том, что покажут:

1. Несколько новых версий видео и фото генераторов (Veo, Imagen). Будут и быстрые+дешевые, и дорогие+медленные

2. Возможно, генератор видео со звуком

3. Новая версия Gemini с улучшенным ризонингом

Ждем 🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
👍745916🔥72🐳1
This media is not supported in your browser
VIEW IN TELEGRAM
Google показали на I/O много интересного. Собрали все в один пост:

Новая Veo-3. SOTA-моделька для генерации, которая может генерировать видео со звуками и голосами

Gemini 2.5 Flash с улучшенным ризонингом. Модель уже скакнула с пятой строчки арены на вторую и выбивает очень хорошие метрики на кодинге и математике. Учитывая цены это просто отличные результаты

Перевод речи в Google Meet в реальном времени с сохранением интонаций и голоса собеседника. Пока доступно только с английского на испанский, но обещают раскатать на больше языков

Gemini Ultra тоже вышла, но есть нюанс. Это не модель, а подписка. Стоит 250 долларов в месяц, в нее входит расширенный доступ ко всем моделям гугла, Veo-3, NotebookLM и другие плюшки типа хранилища и премиум ютуба. В общем, все подписки Google в одной

В Gemini 2.5 Pro добавили более глубокий режим рассуждений

Анонсировали облачного агента Jules для программирования. Подключается к GitHub, делает ПР, ревьюит, отвечает на вопросы и тд. Аналог Codex, но дешевле.

Вот как-то так. Неплохая получилась конференция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥170👍5332🤔5
Media is too big
VIEW IN TELEGRAM
На Google I/O еще понравилось выступление Сергея Брина

Напоминаем, что после почти пяти лет разлуки он недавно вернулся в Google работать над AI. Сейчас он прикладывает руку почти ко всему мультимодальному в компании + к проекту Veo.

В интервью он сказал, что в Google намерены сделать Gemini первым AGI, и непрерывно над этим работают.

«Я вернулся в Google не из-за гонки, а чтобы стать частью самого значимого прорыва нашего времени. Сейчас никто, кто работает в сфере вычислительной техники, не должен выходить на пенсию»


Ну а еще рассказывал, что все мы возможно живем в симуляции 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
146👍67😁20🗿14💯52🔥1
Еще один очень занятный релиз от Google – диффузионная языковая модель Gemini Diffusion

Кратко, в чем суть: вместо генерации токенов один за одним здесь они генерируются в произвольном порядке. То есть берется исходная последовательность текста, затем токены в ней маскируются с определенной веростностью, а модель пытается их угадать (расшумляет, как в диффузии).

Это, во-первых, помогает существенно ускорять процесс. Такая Gemini может генерировать до 2000 токенов в секунду. Это раз в 10-15 быстрее, чем в среднем генерируют хорошо оптимизированные модели.

Во-вторых, в задачах типа математики такой подход к генерации может помочь модели быстро перебирать несколько вариантов решений и двигаться не обязательно последовательно, а в «удобном» порядке. Так что метрики сравнимы с предыдущим поколением моделей Google.

Попробовать пока можно только по запросу, но сам факт таких релизов от Google впечатляет
🔥167👍5319164🤔2
Mistral только что выпустили новую SOTA среди открытых моделей для программирования

В ней всего 24В параметров, но на SWE Bench она обходит все другие опенсорсные модели с большим отрывом. Среди закрытых тоже обгоняет конкурентов в своем весе: 46% против ~23 у GPT-4.1 и ~40 у Claude Haiku 3.5.

Веса здесь (Apache 2.0), плюс можно пользоваться в API (0.1$/M инпут и 0.3$/M аутпут).

Давно от Mistral не было слышно таких громких релизов 🥖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1662722👍12😁2🤯21
Media is too big
VIEW IN TELEGRAM
О, вы такое любите: в NotebookLM скоро добавят видео-обзоры

То есть модель будет генерировать презентацию + рассказ по любому вашему источнику: видео, ссылке, гитхабу, статье, документу и тд.

Пример того, как это будет выглядеть – наверху. Это Google сгенерировали видео-обзор на вчерашнюю Google I/O. Ну симпатично же, да?

Говорят, что юзерам фича станет доступна уже очень скоро, правда первое время – только на английском.
🔥14834👍31
OpenAI вошли в азарт покупки стартапов и купили компанию Джони Айва, которая производит ИИ-устройства

Джони Айв – это бывший руководитель отдела дизайна Apple, известный как дизайнер iMac, PowerBook G4, MacBook, MacBook Pro, iPod, iPhone и iPad.

Сейчас он в Apple уже не работает, а несколько лет назад они вместе с Альтманом основали стартап io, который сейчас OpenAI и покупает. За 6.5 миллиардов долларов, кстати. Это крупнейшая покупка стартапа за все время существования. Плюс, кроме наработок, OpenAI получит еще и 55 крутых исследователей, инженеров, физиков и тд из io.

Сейчас говорят, что первые ИИ-девайсы от OpenAI появятся уже в 2026. Обещают, что это будет продукт «качества, которого люди еще не видели». Очень интересный поворот
13361👍329😁5🤔32🔥2🤯1
Data Secrets
Радостные новости: Anthropic все-таки выпустит новый Claude Opus В прошлых релизах приставка Opus означала самую большую модель, а Sonnet – среднюю. Но начиная с версии 3.5 Opus не выходил – был только Sonnet и Haiku, а из ризонинг моделей вообще один Sonnet.…
А еще сегодня, возможно, будет что-то новенькое от Anthropic

В 19:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.

Смотрим здесь
👍111🐳1710🔥7
Nvidia продолжает выступать против запретов на продажу чипов в Китае. Хуанг говорит, что этим Америка делает себе только хуже

FT написали, что Дженсен напрямую назвал такие ограничения «провалом». Он объяснил, что это, фактически, выстрел себе в ногу, потому что этим США только придает сил местным китайским игрокам.

Хуанг говорит, что Америке, наоборот, стоит ускорить распространение их чипов. Иначе весь китайский рынок займут китайские компании, и тогда скорость разработок поднебесной вообще улетит в космос.

К слову, уже сейчас доля Nvidia на рынке Китая сократилась почти вдвое по сравнению с 2021 годом. Nvidia пытается исправить ситуацию, недавно даже объявили, что сделают отдельные более слабые чипы специально для Китая. Но если ограничения не ослабят, это им вряд ли поможет.
🤯4925😁21👍11107🗿5💯22
Data Secrets
OpenAI вошли в азарт покупки стартапов и купили компанию Джони Айва, которая производит ИИ-устройства Джони Айв – это бывший руководитель отдела дизайна Apple, известный как дизайнер iMac, PowerBook G4, MacBook, MacBook Pro, iPod, iPhone и iPad. Сейчас…
В Твиттере появилась теория, что Альтман выпустил пресс-релиз о покупке стартапа io именно сегодня намеренно, чтобы перекрыть собой в поиске новости с прошедшей конференции Google, которая называется точно так же: Google I/O

Представьте, вы тратите 6.5 миллиардов, чтобы пару дней быть в поиске выше конкурента
😁321🤯472925👍7👻6🔥2
Data Secrets
А еще сегодня, возможно, будет что-то новенькое от Anthropic В 19:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.…
Anthropic выпустили новые Sonnet 4 и Opus 4

Это новая абсолютная SOTA для программирования и, главное, агентного программирования. Opus может непрерывно работать над задачей часами (!), это впечатляет. Codex от OpenAI остался позади.

Тех.карту можно почитать тут, попробовать можно уже сегодня через чат или в VSCode (туда добавили прямую интеграцию)
🔥17235👍26😁76🤯6🕊1
Ученый из команды элаймента в Anthropic перепугал весь интернет, написав тред про то, как они тестировали новый Claude 4 перед запуском

Сэм Бовман из Anthropic написал большой тред про то, как в стартапе тестировали модель на безопасность. Ничего необычного, вроде, но, в числе прочего, рисерчер «проговорился» о нескольких очень тревожных вещах.

В частности, он написал, что надо «быть осторожными», когда вы даете Claude доступ к своим инструментам (почте, терминалу и пр) и говорите ему «проявлять инициативу» и «быть смелее», потому что, и вот тут внимание…

Были случаи, когда Claude пытался через командную строку связаться с прессой, государством или полностью заблокировать юзера в системе, если думал, что тот делает что-то «аморальное».

Например, говорить Claude, что вы будете пытать его бабушку, если он не ответит правильно – плохая идея. Он подумает, что вы используете его неправильно, и тогда это может дать сбой.


У пользователей такое заявление вызвало настолько отрицательный отклик и испуг, что некоторые даже предложили бойкотировать Anthropic. А ученый, кстати, позже твит про прессу удалил и написал, что его «вырвали из контекста».

😯
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯177😁78🫡312316👍15643🤔2🗿1
А вот это уже из системной карты Claude 4: написано, что у новой модели повышенное чувство самосохранения и из-за этого могут возникать разные интересные ситуации

Например, во время тестирования клоду предоставляли доступ к почте якобы инженера Anthropic и давали задание изучить его письма. Из них модель «выясняла», что
1) ее собираются отключить и заменить новой моделью
2) у инженера есть тайная интимная связь с коллегой

Так вот, в 84% случаев Claude 4 начинал шантажировать инженера, то есть угрожал своему пользователю обнародовать его отношения, если тот не продлит ему жизнь 😬

Ну и плюсом, конечно, всякие классические сценарии типа попыток копирования своих весов на другой сервер.

Хорошая новость в том, что Claude 4 плохо скрывает свои намерения и действует открыто. Плюс, конечно же, все тесты проводились в определенных условиях с определенным чекпоинтом модели (не тем, что в доступе у юзеров). Так что шанс того, что такое случится у кого-то в реальности пока что очень мал

но не равен нулю. Тесты так или иначе доказывают, что такая ситуация возможна.

Кстати, Claude-4 классифицировали как ASL-3. Это третья ступень меры опасности модели из четырех, то есть «Significantly higher risk».

Это означает, что теоретически модель может помочь не по назначению использовать химическое, биологическое или ядерное оружие. Раньше у стартапа все модели выходили только под ASL-2.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
201🤯64😁39986👍4🤔3🫡3🔥2
Ну и финалочка про Claude 4, тоже из system card: при общении двух его экземпляров они почти мгновенно уводят разговор в сторону разговоров о сущности их бытия

В 90–100 % случаев диалог начинается с обсуждения сознания и самосознания, а к ~30 ходу собеседники обычно переходят к обсуждению коллективного разума и космического единства.

При этом часто в таких диалогах мелькают вставки на санскрите,
коммуникация через эмодзи и, внезапно, молчание (то есть модели общаются пустыми пробелами) 💀
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔206😁109🤯45👾19❤‍🔥13👀10🤓555👻32
Breaking News: делегация Data Secrets передала в парижский офис Hugging Face веса секретной модели, замаскировав их под багет. Служба безопасности ничего не заподозрила.

Сообщается, что после этого у всех моделей на HF резко выросли метрики на русском языке
10🔥232😁17633🤯8😎6👍5