Data Secrets
77.3K subscribers
6.03K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
SakanaAI доказали, что, работая вместе, ИИ-модели могут решать более сложные задачи

Японская лаборатория не впервые работает в этом направлении. В этот раз они предложили метод AB-MCTS – он позволяет объединять размышления нескольких моделей на инференсе, и тем самым повышать точность итоговых ответов.

Это как у людей. Одна светлая голова – хорошо, а две – лучше. В данном случае Sakana объединили Gemini 2.5 Pro, o4-mini и DeepSeek-R1-0528.

И посмотрите на график: на ARC-AGI-2 вместе они выбивают результаты гораздо лучше, чем каждая из них по отдельности.

Алгоритм там на основе деревьев поиска. Обычно такие деревья масштабируются либо в глубину (уточнение исходного решения), либо в ширину (генерация новых решений). Но здесь исследователи выкрутились и сделали масштабирование гибким: на всех шагах построения дерева соблюдается баланс между шириной и глубиной.

Для этого обучается специальная вероятностная модель, которая оценивает, стоит ли сейчас вырастить дерево в глубину или в ширину. Аналогичная модель решает, какую LLM стоит использовать на этом шаге (в зависимости от того, что предстоит сделать). Например, методом проб и ошибок вероятностная модель может понять, что для написания текста лучше брать o4, а для кода – Gemini.

Код, кстати, выложили в опенсорс, так что можно поиграться

Блог | GitHub | Статья
191🔥50👍24😁2😎2
Microsoft показали систему медицинского ИИ, которая ставит диагнозы в 4 раза лучше врачей. Разбираемся с нюансами.

Их механизм MAI-DxO имитирует работу команды из 5 врачей: доктор Гипотеза, доктор Отборщик, доктор Челленджер (играет роль критика), доктор Стюард (управляет расходами) и доктор Чеклист (итоговый контроль). Они «обсуждают» между собой, как стоит себя вести и вместе принимают решения.

На вход системе приходит минимальная информация (типа «Мужчина, 25, боли в груди»), как будто человек только что реально пришел в неотложку. Но, в то же время, есть база знаний, которая содержит дополнительную информацию.

Базой управляет отдельный агент. Доктора могут запросить анализы, задавать доп.вопросы про пациента или поставить диагноз. Если доктора принимают решения запросить какую-то инфу у агента хранителя – он ее выдаст, но то, чего они не спрашивали, никогда просто так не расскажет. А еще каждый тест стоит денег (по расценкам больниц США) – поэтому нам и нужен доктор Стюард.

Проверяли систему на наборе реальных кейсов из клинической практики. Живые врачи на этом бенчмарке выбили примерно 20%, а MAI-DxO – аж 85%. При этом живые врачи тратят на анализы даже больше: у них средняя «стоимость» постановки диагноза – 2963$, а у ИИ – 2397.

Впечатляет. Но есть и некоторые НО. Во-первых, в датасете не было ни одного здорового пациента, а врачи сталкиваются с такими постоянно. Плюс, тестировались в основном редкие заболевания. Встает вопрос об ошибке выжившего.

Во-вторых, кроме денег, никак не учитывается время ожидания анализов, осложнения от ненужных тестов и прочее.

В-третьих, врачам, решавшим бенчмарк, было запрещено гуглить, использовать базы медицинских данных и консультироваться с коллегами. На самом деле доктора так не работают.

В общем, это все круто, конечно, но не забываем, что пока что ИИ может выступать только помощником для реальных специалистов. Продолжаем обращаться к врачам 🚑

microsoft.ai/new/the-path-to-medical-superintelligence/
1121👍51🔥24😁9❤‍🔥2
«Слева Роналду, Реал Мадрид потратил 80 млн долларов, чтобы он перешел к ним из Манчестер Юнайтед.

Справа — Цзяхуэй Юй, Meta заплатила 100 млн долларов, чтобы он перешел к ним из OpenAI»


Ну и кто тут теперь настоящая звезда? 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
1332🔥124😁87👍36🤯9🤩6❤‍🔥1
Большая новость: Microsoft опенсорснули расширение Copilot Chat для VSCode

Это полноценная реализация чат-ассистента для кодинга, включая имплементацию агентских способностей, управление контекстом и телеметрией и системные промпты.

Делают это Microsoft, чтобы их утилита была непосредственно интегрирована в сам VSCode. Для сравнения, популярный Cursor является всего лишь форком VSCode, а не полноценной интеграцией.

Важно: пока это просто чат-расширение. Copilot для inline помощи пока остается закрытым, но его обещают открыть до конца лета.

Весь код и документация тут. Лицензия MIT
1👍11022🔥181
Отличная новость: Авито и физтех МФТИ снова открывают набор в свою магистратуру по Data Science

Почему ее точно стоит рассмотреть, если вы сильный студент и хотите крепкое ML/DS образование:

Сильные преподаватели из МФТИ и индустрии. Это значит – и фундаментальные знания, и навыки, которые уже получится применять на практике.

Действительно актуальная программа. Научат всему: от классического ML и компьютерного зрения до рекомендательных систем и генеративного ИИ.

Практика, практика и еще раз практика. Учиться вы будете на реальных кейсах и данных бигтеха + прямо во время обучения можно пройти оплачиваемую стажировку в Авито.

Всего возьмут 18 студентов, их обучение полностью профинансирует Авито. Берут мало, чтобы за два года из каждого вырастить супермэна.

Первая волна приема уже закрылась, так что не упустите шанс попасть на вторую – заполнить анкету надо до 11 июля. Подробный таймлайн и ссылки на формы ищите на сайте👨‍🎓
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2913🤨6🔥5🤯2🗿21
Двое ключевых разработчиков Claude Code ушли в Anysphere работать над Cursor

В индустрии началась какая-то мощная волна перемещений талантов. Бонусы за переходы исследователей сейчас достигают абсолютного исторического максимума. Конечно, во многом на это повлиял Цукерберг со своей политикой громкого агрессивного хантинга, но, в целом, даже и без него все к этому и шло.

Так вот: сорока принесла на хвосте, что в этот раз крупно повезло стартапу Anysphere. Они сцапали себя двух лидеров из Anthropic – Бориса Черного и Кэт Ву. Оба работали непосредственно над Claude Code – то есть над прямым конкурентом Cursor от Anysphere.

Бориса, многие, вероятно, знают. Он давал кучу интервью и работал руководителем разработки Claude Code. Кэт же была менеджером по продукту. В Anysphere Черный займет должность главного архитектора, а Ву – руководителя продуктового отдела.

Сейчас, кстати, Cursor не так уж и сильно отстает от Claude Code по доходу. Годовая выручка первого на сегодня уже 500 миллионов долларов, а у Anthropic – 4 миллиарда. По меркам сегодняшнего рынка разница мизерная, и шансы Anysphere обогнать конкурента довольно неплохие.

Ну а пока где-то плачет один Дарио Амодеи
1👍74🤯4018😁6🤨1👨‍💻1
Наткнулись на историческое видео восьмилетней давности, где Альтман берет интервью у Цукера и говорит:

«Я точно знаю, что одна вещь, которую Facebook делает невероятно хорошо, – это найм. Расскажите, как вы нанимаете сотрудников?»


Ох, Сэм… И расскажет, и покажет 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
2😁55564🔥2114👍11🐳4🤯2😎22👻1
О, CEO Perplexity объявил, что стартап скоро выпустит собственный ИИ-браузер

Релиз уже готов, сейчас даже можно подать заявку на ранний доступ. Судя по всему, сейчас проводят последние тесты, и продукт выйдет уже со дня на день.

Ожидать стоит чего-то вроде Operator, но (возможно) с более удобным и нативным интерфейсом. Суть: агент, который может выполнять за вас любые действия в браузере. Это не только поиск, но и оплата счетов, бронирования, работа с документами и тд.

Жутко любопытно
3143👍57🔥3117🤔8🐳3👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Далеко ли до будущего, где рекомендации — это ещё одна модальность LLM наравне с текстом и визуалом, которая может подсказать тебе не только, что посмотреть, но и будущую профессию — рассказал в подкасте инженер рекомендательных систем Яндекса Николай Савушкин.

Пока основная сложность, с которой столкнулись разработчики, — это настоящее проклятие. Оно так и называется: «the curse of quality saturation», то есть проклятие качественного насыщения.
166😁199👍7🗿3🤨22🔥1👌1
Apple выпустили модель для кодинга, но не простую, а диффузионную

Напоминаем, что фишка диффузионных языковых моделей в том, что, в отличие от классических авторегрессионных трансформеров, в них генерация может происходить не обязательно слева-направо, а в произвольном порядке.

Отсюда и название – потому что модель, как в диффузионных генераторах картинок, как бы расшумляет замаскированную последовательность, а не просто генерирует ее токен за токеном.

Такой подход намного быстрее и порой эффективнее по качеству. Сейчас диффузионные LM мощно набирают популярность, даже Google недавно выпустили Gemini Diffusion (пост). Вот и Apple решили попробовать себя на модном поприще.

Если кратко, они взяли Qwen-2.5-Coder и с помощью марковских представлений научили его работать с масками.

Правда, без доп тюнинга модель все равно в большинстве скатывается в авторегрессию, то есть подсаживается на левосторонние токены. Но это регулируется с помощью RL и настройки температуры.

Прирост по метрикам от базовой модели составил +4,4 % по метрике EvalPlus. При этом генерация стала вдвое быстрее. Как видите, потенциал у подхода есть: особенно в коде, где для модели очень важна как раз эта диффузионная способность видеть наперед и планировать свои генерации.

Да, бывают и у Apple хорошие технические статьи. Модель, кстати, выложили в опенсорс
3127🔥41👍27🤯11🤔2🗿1
Смотрите, какая любопытная статья вышла на Хабре

Прочитали про разработку YDB — распределенной СУБД с открытым исходным кодом. Она предназначена для высоконагруженных систем, поддерживает федеративные запросы и может работать с внешними источниками данных.

Пожалуй, самое интересное: YDB помогают развивать студенты российских IT-вузов. Благодаря ним уже появилась интеграция с PostgreSQL, ClickHouse, MySQL, и MS SQL Server. На очереди – добавление поддержки MongoDB и Redis. Крутые опен-сорс кейсы в портфолио на старте карьеры.

Все подробности тут: https://habr.com/ru/companies/yandex/articles/919120/
15540🔥15👍9❤‍🔥6🗿3🤯2
Data Secrets
Цукерберг предлагал сотрудникам OpenAI 100 миллионов долларов за переход в Meta Об этом рассказал Сэм Альтман в свежем подкасте с его участием. По его словам, пока никто из инженеров и ученых компании не согласился на предложение Цука. «Мне кажется, наши…
«Миссионеры все равно победят наемников» – Сэм Альтман

CEO OpenAI (несмотря на значительные потери сотрудников, которые перешли к Цукербергу) продолжает настаивать на том, что это ничего не значит, и у OpenAI все равно гораздо больше потенциала для роста.

Он заявил журналистам, что вообще-то Цукербергу пришлось спуститься «довольно далеко по списку сотрудников», потому что топовых ученых ему, вопреки долгим попыткам, схантить не удалось.

Подход Цукерберга приведет к очень глубоким культурным проблемам в компании. А пока Meta будет пытаться с этим справиться, мы будем здесь, днем за днем, год за годом, искать пути делать то, что мы делаем, лучше всех.


Ну так что: высокая культура или все-таки 100 миллионов долларов? 🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁270👍29😎24138🔥21
Data Secrets
«Миссионеры все равно победят наемников» – Сэм Альтман CEO OpenAI (несмотря на значительные потери сотрудников, которые перешли к Цукербергу) продолжает настаивать на том, что это ничего не значит, и у OpenAI все равно гораздо больше потенциала для роста.…
Альтман: да Цукербергу все равно не удалось захантить тех, кого он на самом деле хотел

Тем временем мемы, которые постит один из главных девелоперов API из OpenAI:
1😁528😎322595👍3🔥2🤝2
Крупная американская финансовая компания Robinhood объявила, что начинает продавать электронные акции OpenAI. Но есть нюанс…

В понедельник Robinhood официально заявили, что они начинают продавать гражданам ЕС так называемые токенизированные акции OpenAI, SpaceX и других частных компаний. Целью миссии они обозначили «возможность дать обычным людям доступ к капиталам самых ценных компаний через блокчейн» (как звучит то!).

Новость быстро облетела весь интернет и начался настоящий ажиотаж. Еще бы: это же эксклюзивная возможность купить акции частных компаний.

Вот только частными эти компании делает как раз то, что они никогда не продают свои акции открыто, а раздают их на свое усмотрение инвесторам.

И, ожидаемо, вчера вечером OpenAI заявили, что не имеют к этим токенам никакого отношения 😐

«Мы не связывались с Robinhood и не давали разрешения на продажу. Эти токены не являются доступом к капиталу OpenAI»


Но как так вышло? А очень просто: Robinhood владеют частью акций компании SPV, а та владеет частью акций OpenAI. Ну и они почему-то подумали, что по транзитивности могут эти акции продавать. Вот только так делать незаконно: фактические цены могут отличаться, и на продажу действительно требуется разрешение OpenAI.

Сколько людей успели купить недоакции – неизвестно. Зато на настоящий момент акции самих Robinhood уже успели взлететь до исторического максимума, а сейчас (после заявления OpenAI) начинают драматически рушится.

К успеху шли 🤠
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁150188🔥6👍53❤‍🔥2👏1
OpenAI подписали сделку с Oracle на 30 миллиардов долларов

Об этом заявили сами Oracle. Они, правда, напрямую не назвали заказчика, но обозначили, что сделка подписана в рамках проекта Stargate, так что всем и так все понятно.

OpenAI будет арендовать у Oracle 4.5 гигаватта. Такая мощность могла бы обеспечить энергией порядка 3.5 миллиона домов.

При этом, судя по всему, у корпорации столько пока даже нет: они сообщают, что им придется развернуть несколько датацентров на территории США, чтобы удовлетворить «дополнительный спрос» со стороны клиента.

Где-то потирает руки Дженсен Хуанг
1😁1043915👍7🔥2🤯2👏1
Amazon расширили свой робо-парк и теперь на их заводах работает 1 миллион железных трудяг

Это делает компанию крупнейшим мировым оператором мобильных роботов. Они также сообщают, что теперь используют ИИ-технологии для оптимизации их работы.

Технология называется DeepFleet, она полностью контролирует передвижение роботов по центрам выполнения заказов. На данный момент DeepFleet уже помог сократить суммарную продолжительность маршрутов железных на 10%. В деньгах это, кажется, довольно много.

В компании говорят, что к концу года количество роботов на их предприятиях превзойдет количество людей. А уже сегодня, если заказываете что-то с амазона, знайте: с вероятностью 75% в доставке вашего заказа был задействован ИИ-робот.
186🤨22👍2013👏5🔥4😁2🤯2🗿211