Итак, Stargate. Что нам известно?
➖ На начальном этапе будут реализованы 100 млрд долларов. Государственных денег США здесь нет: среди акционеров SoftBank, OpenAI, Oracle и MGX. SoftBank и OpenAI являются ведущими партнерами, причем SoftBank несет финансовую ответственность, а OpenAI — операционную.
➖ В техно-партнерах помимо Oracle и OpenAI числятся Arm, Microsoft и NVIDIA. Деньги потратят на инфраструктуру, то есть будут строить датацентры и кластеры. Судя по всему, первые кампусы появятся в Техасе, остальные территории пока "оцениваются".
➖ Интересно также, что теперь в силу вступает новое соглашение между OpenAI и Microsoft. Стартап еще больше отдаляется от гиганта: раньше Microsoft фактически конролировало все вычислительные силы Альтмана, теперь же стартап волен сам наращивать мощность и управлять своими датацентрами.
➖ Основной экономический упор на первом этапе – рабочие места. Ожидается, что их Stargate сгенерирует сотни тысяч. В перспективе – конечно, AGI, лидерство США в гонке технологий и ИИ в медицине.
➖ Так как вся компания крутится вокруг OpenAI, фактически они теперь – официальный ИИ Америки. У Google и Anthropic вряд ли остаются шансы после такого.
Пост OpenAI
Пост OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍95🤔30❤15🔥10😭6😁2🗿2
Тем временем Perplexity наконец-то запускает API
Проект называется Sonar, о его запуске объявили вчера. Теперь серчинг в интернете на основе ИИ можно встраивать в приложения, то есть каждый может на коленке написать собственный ИИ-поисковик.
Есть два варианта использования: базовый и Sonar Pro (лучше подходит для сложных составных задач). Цены вполне ок: по 1 доллару за миллион инпут-аутпут токенов, для Pro $3/m input $15/m output.
🤩
Проект называется Sonar, о его запуске объявили вчера. Теперь серчинг в интернете на основе ИИ можно встраивать в приложения, то есть каждый может на коленке написать собственный ИИ-поисковик.
Есть два варианта использования: базовый и Sonar Pro (лучше подходит для сложных составных задач). Цены вполне ок: по 1 доллару за миллион инпут-аутпут токенов, для Pro $3/m input $15/m output.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40🔥19👍9🙈2
Об этом сообщает The Information. Напоминаем, что Operator это это ИИ-агент для автономного управления компьютером, аналог агента Sonnet от Anthropic. С его помощью можно будет, например, заказать еду, забронировать путешествие или... оставить его работать над проектом и уйти отдыхать.
Учитывая, что почти все релизы у OpenAI выходят в четверг, готовимся увидеть Operator уже завтра
Please open Telegram to view this post
VIEW IN TELEGRAM
👍87👾18🔥14❤8🤯5😁3
Высок ли потенциал китайских LLM: новое исследование от EpochAI (надеемся, на этот раз не проспонсированное OpenAI)
Основное: исследователи насчитали, что мощности, выделяемые на обучение моделей, в Китае растут почти в два раза медленнее, чем у конкурентов с Запада и Европы. Если для глобала это 4.8x в год, то в Китае 2.9x (если считать с конца 2021).
Это не означает, что потенциала у Китая нет. Например, до 2021 – посмотрите на график – они уверенно давили педаль в пол, за счет чего и догнали мировую индустрию.
А сейчас разрыв опять растет. Конечно, флопсы – это только один из аспектов, и метрики последних моделей DeepSeek нам явно на это указывают, но все-таки недостаток мощности это риск. Например, уже сейчас Китаю бы потребовалось 2 года, чтобы достичь скейла глобального сегодняшнего топ-10. Неужели Gwern был прав?
Основное: исследователи насчитали, что мощности, выделяемые на обучение моделей, в Китае растут почти в два раза медленнее, чем у конкурентов с Запада и Европы. Если для глобала это 4.8x в год, то в Китае 2.9x (если считать с конца 2021).
Это не означает, что потенциала у Китая нет. Например, до 2021 – посмотрите на график – они уверенно давили педаль в пол, за счет чего и догнали мировую индустрию.
А сейчас разрыв опять растет. Конечно, флопсы – это только один из аспектов, и метрики последних моделей DeepSeek нам явно на это указывают, но все-таки недостаток мощности это риск. Например, уже сейчас Китаю бы потребовалось 2 года, чтобы достичь скейла глобального сегодняшнего топ-10. Неужели Gwern был прав?
👍36🔥15🤔5❤4🙈4
Media is too big
VIEW IN TELEGRAM
Пока OpenAI начинают раскатывать Operator на Pro юзеров (похоже релиз действительно будет сегодня вечером!), китайская ByteDance подгадала момент и выкатила своего такого же агента в опенсорс
Он называется UI-TARS и вышел под лицензией Apache 2.0 (репозиторий). Основан агент на VLM (есть варианты на 2B, 7B и 72B, вот тут веса), на вход принимает картинки аля кадры экрана, а на выход генерирует человекоподобные действия, то есть движения мыши или нажатия на клавиатуру.
Самое интересное: в агенте есть ризонинг! Его обучали как на простых "интуитивных" сценариях, так и на CoT, так что для сложных задач он может поключать размышление и какое-то подобие планирования. Датасеты там, конечно, огромные, и собранные самими ByteDance.
На бенчмарках выглядит ничего. Учитывая, что Operator, вероятно, будет доступен только за 200 долларов, довольно приятный релиз.
Статья здесь
Он называется UI-TARS и вышел под лицензией Apache 2.0 (репозиторий). Основан агент на VLM (есть варианты на 2B, 7B и 72B, вот тут веса), на вход принимает картинки аля кадры экрана, а на выход генерирует человекоподобные действия, то есть движения мыши или нажатия на клавиатуру.
Самое интересное: в агенте есть ризонинг! Его обучали как на простых "интуитивных" сценариях, так и на CoT, так что для сложных задач он может поключать размышление и какое-то подобие планирования. Датасеты там, конечно, огромные, и собранные самими ByteDance.
На бенчмарках выглядит ничего. Учитывая, что Operator, вероятно, будет доступен только за 200 долларов, довольно приятный релиз.
Статья здесь
🤯69👍46🔥14❤9❤🔥3
Data Secrets
Выиграть $5000 и стать соавтором в статье с CEO ScaleAI в обмен всего на один вопрос? Да запросто. CAIS и ScaleAI запустили конкурс вопросов для сложнейшего в мире бенчмарка для LLM. За каждый подходящий вопрос они обещают 500 до 5000 долларов, а также соавторство…
Помните бенчмарк Humanity’s Last Exam, в который можно было предложить свой вопрос за 5000 долларов? Его опубликовали!
Напоминаем: ученые из CAIS и ScaleAI с сентября собирали самый сложный бенчмарк с вопросами из разных областей. За хорошие вопросы они давали от 500 до 5000 долларов, а также соавторство в статье.
И вот наконец бечмарк вышел! Он состоит из 3000 вопросов и ведущие модели выбивают на нем < 10%. Лучше всех справляется (не поверите) новая R1 от DeepSeek: она выбивает 9.4%, в то время как даже o1 выбивает всего 9.1%.
Среди вопросов бОльшая часть по математике (42%), но также много физики, биологии и других наук. Примеры задачек можно посмотреть в статье.
Датасет | Статья | Репо
Напоминаем: ученые из CAIS и ScaleAI с сентября собирали самый сложный бенчмарк с вопросами из разных областей. За хорошие вопросы они давали от 500 до 5000 долларов, а также соавторство в статье.
И вот наконец бечмарк вышел! Он состоит из 3000 вопросов и ведущие модели выбивают на нем < 10%. Лучше всех справляется (не поверите) новая R1 от DeepSeek: она выбивает 9.4%, в то время как даже o1 выбивает всего 9.1%.
Среди вопросов бОльшая часть по математике (42%), но также много физики, биологии и других наук. Примеры задачек можно посмотреть в статье.
Датасет | Статья | Репо
❤99🔥43👍27🗿3❤🔥1
Да, это тот самый агент, о котором ходило так много слухов последние дни, и которого мы все так долго ждали. Он может самостоятельно управлять компьютером, выполнять сложные задачи и взаимодействовать с браузером.
Например, с помощью Operator можно заказать доставку, спланировать путешествие или забронировать столик.
В основе GPT-4o. На вход подаются скриншоты экрана, на основе которых модель генрирует экшны. При этом все действо разворачивается не в вашем браузере, а на виртуальной машине прямо внутри чата с зашифрованным подключением. В этом окне что-то можно (а иногда и приходится, например в случае с капчами) делать самому.
Говорят, агент особенно хорош в навигации по сайтам. Метрики из блогпоста это подтверждают. Конечно, все еще не уровень человека, но уже большой шаг по направлению к сильным агентам. К тому же на стриме Сэм сказал, что скоро нас ждут и другие подобные оператору релизы.
Operator уже доступен пользователям по подписке Pro (200$/месяц), позже обещают раскатить на плюсов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94🤔20❤16🤯7🗿3🔥2❤🔥1🍌1🤝1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁196🤔12🎉8🤯4👏3😎2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Лекун предиктнул новую архитектуру в течение 3-5 лет
Вчера он выступал в Давосе на Debating Technologies и сказал следующее:
Лекун выделяет четыре основных ограничения: отсутствие понимания физического мира, отсутствие постоянной памяти, нехватка способности к рассуждению и неспособность к сложному планированию. По его мнению, без всего этого настоящий AGI/ASI невозможен.
Вчера он выступал в Давосе на Debating Technologies и сказал следующее:
«Я думаю, что срок актуальности текущей парадигмы LLM довольно короткий — вероятно, три-пять лет. Думаю, через пять лет ни один здравомыслящий человек не будет использовать трансформеры, по крайней мере в качестве центрального компонента системы ИИ»
Лекун выделяет четыре основных ограничения: отсутствие понимания физического мира, отсутствие постоянной памяти, нехватка способности к рассуждению и неспособность к сложному планированию. По его мнению, без всего этого настоящий AGI/ASI невозможен.
«В ближайшие годы нас ждёт новая революция ИИ.
Возможно, нам даже придётся поменять название
, так как это уже вряд ли будет генеративным ИИ в том виде, в котором мы понимаем его сегодня».
👍154🔥59❤11🤔11😁8💯7🗿5❤🔥3🕊3👀3🤯2
Мем: на teamblind кто-то из Meta расчувствовался и пожаловался, что DeepSeek v3 уже превосходит следующую версию Llama
Сотрудники переживают, что начальству, которое вкладывает в ИИ в Meta миллиарды, не понравится, что китайская компания обучила нейросеть получше всего лишь за годовой оклад десяти таких инженеров.
«DeepSeek r1 сделал ситуацию только страшнее» – жалуется аноним
😭
Сотрудники переживают, что начальству, которое вкладывает в ИИ в Meta миллиарды, не понравится, что китайская компания обучила нейросеть получше всего лишь за годовой оклад десяти таких инженеров.
«DeepSeek r1 сделал ситуацию только страшнее» – жалуется аноним
Please open Telegram to view this post
VIEW IN TELEGRAM
😁219🔥48👍14☃6
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉210😁44❤37🤪9❤🔥8☃2🐳2
Пришли вести с LMSYS арены: DeepSeek R1 заняла 1 место в общем рейтинге со Style Control*
Также на первое место модель вскарабкалась в рейтинге Hard Prompts, Coding, Math и Writing. Не забываем, что при этом модель открытая и в 20 раз дешевле o1.
*Style Control – это оценка «сырого» текста без форматирования. Сделано это, чтобы пользователи не подкупались на красиво оформленные списки вместо того, чтобы оценивать содержание (подробнее почитать можно в этом посте)
Также на первое место модель вскарабкалась в рейтинге Hard Prompts, Coding, Math и Writing. Не забываем, что при этом модель открытая и в 20 раз дешевле o1.
*Style Control – это оценка «сырого» текста без форматирования. Сделано это, чтобы пользователи не подкупались на красиво оформленные списки вместо того, чтобы оценивать содержание (подробнее почитать можно в этом посте)
🔥122👍28❤16😍7🤯5🕊1
Помните второй стартап Альтмана World?
Это проект, миссия которого – создавать продукты для обеспечения безопасных «связей» мира ИИ и людей. Например, они разрабатывают криптовалюту, которой мог бы пользоваться ИИ и систему сканирования сетчатки глаза на предмет человечности.
А сейчас они планируют пойти в область агентов и создать инструмент, который будет ассоциировать с вами вашего личного ИИ-агента. Это значит, что ассистент будет повторять вашу онлайн-идентичность и сможет действовать в интернете от вашего лица (от ввода паролей до одобрения транзакций)😐
При этом, кстати, OpenAI и World, по словам Сэма, все еще несвязанные проекты
Это проект, миссия которого – создавать продукты для обеспечения безопасных «связей» мира ИИ и людей. Например, они разрабатывают криптовалюту, которой мог бы пользоваться ИИ и систему сканирования сетчатки глаза на предмет человечности.
А сейчас они планируют пойти в область агентов и создать инструмент, который будет ассоциировать с вами вашего личного ИИ-агента. Это значит, что ассистент будет повторять вашу онлайн-идентичность и сможет действовать в интернете от вашего лица (от ввода паролей до одобрения транзакций)
При этом, кстати, OpenAI и World, по словам Сэма, все еще несвязанные проекты
Please open Telegram to view this post
VIEW IN TELEGRAM
51👍62😁20🍌12👾10🌭5👏2