Все о блокчейн/мозге/space/WEB 3.0 в России и мире
19.4K subscribers
2.11K photos
370 videos
128 files
7.53K links
Сферы интересов канала: блокчейн, мозг(BCI), биотех, space tech, цифровая экономика, WEB 3.0 в России и мире.

Основатель @AniAslanyan

English channel https://tttttt.me/alwebbci

Регистрация в перечне РКН https://knd.gov.ru/license?id=67374142772bb113f528
Download Telegram
Meta* может уйти от open source и создаёт 2 гигантских суперкластера для ИИ мощностью в несколько гигаватт.

Новая лаборатория MSL рассматривает идею прекращения поддержки Behemoth — открытой модели ИИ Meta. Вместо этого планирует сосредоточиться на разработке закрытой модели. Это сейчас обсуждается среди новых членов команды. Марк Цукерберг пока не дал на это одобрения.

Между тем, вчера Цукерберг заявил, что строится 2 вычислительных кластера — «Prometheus», который начнёт работать в 2026 году, и «Hyperion», масштабом сравнимый с большей частью Манхэттена, он сможет масштабироваться до 5 гигаватт за несколько лет

По данным SemiAnalysis, Meta станет первой лабораторией, которая запустит суперкластер мощностью 1 гигаватт+.

Для ускорения развертывания компания отказалась от традиционных дата-центров в пользу модульных "палаточных" конструкций. Для обеспечения энергией строятся собственные газовые электростанции.

В этом году компания потратит до $72 млрд на капвложения, в основном на ИИ-дата-центры.

Для сравнения, OpenAI планирует потратить $320 млрд с 2025 по 2030 год, но вынуждена постоянно привлекать внешние инвестиции. xAI Илона Маска "скребет деньги по углам" из всей империи Маска. Так SpaceX инвестирует $2 млрд в xAI, но у SpaceX и Tesla есть собственные потребности в капитале.

Ключевое преимущество Meta - самофинансирование за счёт рекламного бизнеса, генерирующего ~$100 млрд в год. Это создаёт давление на конкурентов вроде OpenAI и xAI, которые зависят от внешнего финансирования.

Цукерберг скорее всего делает агрессивные заявления об инвестициях на ИИ, чтобы психологически давить на конкурентов.

*запрещенная в России организация.
10🤯2
Казахстан хочет вложить часть средств Нацфонда в криптовалюты

Об этом заявил глава Национального банка страны Тимур Сулейменов. Он говорит, что Казахстан смотрит на опыт Норвежского фонда, США и ближневосточных фондов.

Хотя Казахстан — относительно небольшая экономика, но она играет роль в криптоиндустрии. На страну приходится около 13% глобального хешрейта биткоина.

При этом глава Нацбанка заявил, что они хотят создать отдельный госрезерв криптовалют из конфискованных у преступников.
👍6
Apple создали 1-ю модель для анализа поведенческих данных человека с Apple Watch и iPhone.

WBM (Wearable Behavior foundation Model) - 1-я большая фундаментальная модель для анализа поведенческих данных с носимых устройств. Она обучена на 2,5 миллиардах часов данных от 162 тысяч участников исследования Apple Heart and Movement Study.
Модель не публикуется из-за ограничений согласия участников исследования.

Это уже 2-й крупный проект Apple в области анализа биологических данных человека после представления протокола BCI HID для нейроинтерфейсов в мае.

Вместо анализа сырых сенсорных данных (пульс, акселерометр) команда сосредоточилась на поведенческих метриках:
количестве шагов, времени активности, показателях походки, качестве сна. Эти данные агрегируются по часам и анализируются недельными интервалами.

Модель проверили на 57 задачах прогнозирования состояний здоровья:

1. Определение базовых характеристик (возраст, пол, хронические заболевания)
2.Отслеживание временных изменений (беременность, инфекции, травмы)
3.Анализ качества сна.

WBM показала особенно хорошие результаты в задачах, где важны поведенческие паттерны: прогнозирование сна, обнаружение беременности (точность >90%), выявление респираторных инфекций.

Потенциальные применения: мониторинг хронических заболеваний, раннее выявление изменений в состоянии здоровья, персонализация рекомендаций по здоровью.

Ограничения:
- Данные только с устройств Apple
- Выборка не полностью репрезентативна для населения США
- Часть диагнозов основана на самоотчетах пользователей.
🔥11👍43🤬2
Google представили инструмент для создания виртуальных миров, где множество ИИ-агентов могут взаимодействовать друг с другом в различных сценариях.

Concordia 2.0 - это обновленная библиотека для построения симуляций с несколькими ИИ-агентами.

Разработчики подходят к многоагентному генеративному ИИ как к игровому движку. Это любимый подход СЕО DeepMind.

Возможности применения:

1. Симуляции социальных наук
2. Оценка LLM
3. Интерактивные нарративы
4. Генерация синтетических данных для обучения других ИИ-систем.
🔥10
США сняли ограничения на продажу ИИ-чипов Китаю, речь идет о H20 от Nvidia

Дженсен Хуанг оказался на одном уровне с Илоном Маском, лоббирующим интересы своего бизнеса в Китае.

Снятие ограничений связано с доминированием Китая в сфере редкоземельных металлов: диспрозий, галлий и германий, которые необходимы для производства полупроводников. Китай контролирует ~ 90% мировой переработки редкоземельных металлов, что делает его критически важным игроком в глобальной цепочке поставок технологий.

Запрет на продажу H20 стал серьезным ударом для Nvidia, так как Китай является ключевым рынком, на который приходится около 13% от общего дохода компании ($17 млрд в последнем финансовом году).

Ограничения привели к тому, что Nvidia была вынуждена списать $5,5 млрд из-за невозможности продать запасы чипов H20 и выполнить обязательства по заказам.

В дополнение к возобновлению продаж H20, Дженсен Хуанг анонсировал новый графический процессор для китайского рынка — RTX PRO GPU, основанный на новейшей технологии Blackwell. Этот чип, по словам Хуанга, разработан с учетом требований экспортного контроля и предназначен для использования в «умных» фабриках и логистике.
👍10😁86🐳2
Лучшие ИИ-модели справляются только с половиной реальных финзадач.

Согласно лидерборду Snorkel AI, у которой есть платформа Snorkel Flow(помогает компаниям разрабатывать специализированные наборы данных и модели ИИ) выявлено, что лучшие ИИ-модели справляются только с половиной реальных финансовых задач (52% у Claude 3.7), хотя на академических тестах показывают 90%+.

Разрыв между 90%+ на MMLU и 51.9% на Finance Reasoning показывает, что индустрия оценивает ИИ по неправильным метрикам. Умение отвечать на вопросы из учебников кардинально отличается от способности работать с реальными бизнес-задачами.

Агентские возможности — это узкое место современных LLM
Все топовые модели проваливаются на задачах, требующих:
- Многошагового планирования (в среднем 12 шагов)
- Работы с инструментами (SQL, анализ документов)
- Самокоррекции при ошибках
- Интеграции разрозненной информации.
Это говорит о том, что текущая архитектура LLM плохо подходит для автономной работы в сложных средах.

Специализация домена критически важна
51.9% точности даже у лучших моделей на финансовых задачах показывает, что универсальные LLM недостаточны для корпоративного применения. Нужны либо специализированные модели, либо кардинально другие подходы к обучению.

Проблема не в размере модели, а в подходе
Факт, что открытые модели показывают 10-20% при том, что закрытые достигают 50-80%, указывает не только на разницу в вычислительных ресурсах, но и на фундаментальные различия в архитектуре или методах обучения.

Корпоративные ожидания завышены.
Если модели с трудом справляются с анализом финансовых документов (задача, которую делают тысячи аналитиков), то автоматизация более сложных бизнес-процессов пока невозможна. Это объясняет, почему многие корпоративные внедрения ИИ не оправдывают ожиданий.

Неструктурированные данные остаются проблемой.

Нужны новые метрики и подходы к оценке
Традиционные бенчмарки не только бесполезны, но и вредны — они создают ложное ощущение прогресса.

Ближайшее будущее — гибридные системы
Раз ИИ не может автономно решать сложные задачи, логичный путь — системы с участием человека, где ИИ берет на себя рутинные операции, а человек — контроль и принятие решений.
16👍8
Слушайте, а что от OpenAI останется? Ещё 2 лучших исследователей переходят к Цукербергу - Джейсон Вэй и Хён Вон Чунг

Вэй участвовал в разработке моделей O3 и Deep Research. Он присоединился к OpenAI в 2023 году после работы в Google, где занимался исследованиями в области chain-of-thought — метода, обучающего ИИ-модели последовательно обрабатывать сложные запросы.

Чун также работал над проектами Deep Research и моделью O1 вместе с Вэем. Чун, как и Вэй, ранее работал в Google и присоединился к OpenAI одновременно с ним.

Если вы тоже хотите, чтобы вас купил Цукерберг, оставьте коммент у нас под этим постом 😁
😁20🔥64
Команда Цукерберга выпустила ИИ-модель, которая думает как живая клетка

Chan Zuckerberg Initiative (CZI) представили GREmLN — опен сорс модель ИИ, которая анализирует гены не как статистические данные, а как живую биологическую систему. GREmLNчасть большого проекта по созданию виртуальной модели клетки. Цель: от описания болезней перейти к их предсказанию и предотвращению на клеточном уровне. Другие проекты CZI мы описали здесь.

Обычные модели машинного обучения находят корреляции между генной активностью и болезнями, но не могут ответить на главный вопрос: какой именно ген запустил болезнь? Они видят следствия, но не причины.

GREmLN встраивает знания о генных регуляторных сетях прямо в свою архитектуру. Вместо анализа всех возможных комбинаций генов, она фокусируется только на тех взаимодействиях, которые реально происходят в клетках.

Результат: GREmLN может отследить цепочку от симптома к первопричине — найти конкретную мутацию, которая запустила каскад изменений.

Практическое значение этой модели:

Онкология
: определить, какая именно мутация привела к раку
Иммунотерапия: понять, как перенастроить иммунные клетки для атаки на опухоль
Разработка лекарств: найти ключевые гены-регуляторы для точечного воздействия

Модель уже обучена на 11 миллионах клеточных профилей и доступна исследователям.
👍10🔥9❤‍🔥5😱2👎1
Google интегрировал ИИ-агента в поиск + еще 2 новые функции в поиске

1. Теперь во время поиска через Google, например, услуг (грумеры, химчистки и т.д.) появляется опция "Have AI check pricing". ИИ самостоятельно обзванивает компании, узнает цены и доступность, затем консолидирует информацию для пользователя.

Это первое массовое внедрение ИИ-агентов, которые реально взаимодействуют с внешним миром от имени пользователя.

Эта функция доступна всем пользователям в США.

2. Deep Search-исследовательский инструмент на базе Gemini 2.5 Pro. Выполняет поисковые запросы, анализирует разрозненные источники и создает структурированный отчет с цитатами.

По сути — прямой конкурент Claude Advanced Research и Perplexity Pro, но интегрированный в основной продукт Google.

3. Доступ к Gemini 2.5 Pro в прямо в поиске через выпадающее меню.

Специализируется на сложных рассуждениях, математике и программировании. Дополняет стандартную быструю модель для базовых запросов.

Deep Search и Gemini 2.5 Pro пока доступны для подписчиков AI Pro/Ultra в США (через экспериментальную программу Labs).

Ранее
Google добавлял ИИ в поиск.
🔥127👍63
OpenAI внедрит в ChatGPT функцию покупки товаров

Скоро в чате можно будет купить любой товар, OpenAI и её партнёры, среди которых Shopify, уже тестируют ранние версии системы с брендами.

Это впервые позволит OpenAI монетизировать бесплатных пользователей, так как компания будет получать комиссию с каждой покупки от продавцов.

Ранее мы писали о том, как будет меняться электронная коммерция, где будут играть роль в том числе ИИ-агенты и стейблкоины.
👍7👎1
Вот это времена: инвесторы просят Anthropic взять у них деньги

К Anthropic обращаются инвесторы, которые хотят войти со своими $ в новый раунд, сегодня компания Дарио Амодея уже оценивается свыше $100 млрд.

Это почти вдвое превышает оценку 4-х месячной давности. Годовая выручка компании выросла с 3 до 4 млрд $ за последний месяц.

В течение многих лет инвесторы предполагали, что потребители не будут платить за ПО

Теперь люди с радостью платят $200+ в месяц за такие продукты, как Claude, Grok 4 Heavy и Gemini.

Не потому, что они подходят всем, а потому, что для кого-то они в 100 раз лучше.

Бесплатный уровень — это воронка продаж. Реальный продукт узкий.
🔥1343
OKX_and_Blockwords_Research_Blockchain_Applications_1752698313.pdf
3.7 MB
Новая экономмодель с
$10трлн токенизированных активов к 2030
- данные из отчета OKX и Blockworks Research.

Основные тренды:

1. Растущая волна токенизации активов - децентрализованные приложения (dApps) позволяют создавать, торговать и управлять токенизированными активами.

2. Изменения в обработке данных - переход к пользоцентричному владению данными изменит способы их сбора и использования.

3. Инновации цифровых кошельков упрощают пользовательский опыт и способствуют массовому принятию.

4. Конвергенция ИИ и крипто - ИИ позволит более эффективное программирование, а крипто создаст стимулы для развития ИИ.

5. Новые источники дохода для компаний благодаря росту dApps и цифровых активов.

Традиционные посредники будут устранены: банки, брокеры, платформы.

Появляются программируемые деньги и автоматизированные финансы. Финансовая система перестраивается - стейблкоины это новая инфраструктура (уже $180 млрд), а ИИ-агенты новые участники системы.
Walmart, LVMH, Goldman Sachs уже внедряют блокчейн и ИИ.

ИИ + блокчейн = новая операционная система экономики. ИИ-агенты будут совершать транзакции автономно.

Сегодня общая капитализация всей блокчейн-экосистемы составляет $2.6трлн.

Временные горизонты:

1. 2025-2027 - Массовое принятие стейблкоинов. Токенизация основных активов.
Регуляторная ясность.

2. 2027-2030 - 10% мирового ВВП токенизировано. ИИ-агенты как экономические акторы.
Программируемая экономика.
1🔥10👍54❤‍🔥1
Вот это движ: Вчера Google внедрил ИИ-агентов в поиск, сегодня OpenAI сделает похожую историю в своих продуктах, через 3 часа узнаем подробности.

Но самое крутое - это то, что Langchain представил Open Deep Research — это опен сорс инструмент для автоматизированного глубокого исследования.

Вместо одного ИИ-агента используется система подчиненных агентов, каждый из которых выполняет свою узкую задачу (поиск информации, анализ данных, написание текста и тд.).

Супервизор координирует их работу, распределяя задачи и контролируя процесс.
👍18🔥4
Anthropic только что запустили Claude для финансовых услуг

Теперь Claude интегрируется с ведущими платформами данных и отраслевыми поставщиками для доступа в онлайн-режиме к комплексной финансовой информации, проверенной по внутренним и отраслевым источникам.
🔥133
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Вот это движ: Вчера Google внедрил ИИ-агентов в поиск, сегодня OpenAI сделает похожую историю в своих продуктах, через 3 часа узнаем подробности. Но самое крутое - это то, что Langchain представил Open Deep Research — это опен сорс инструмент для автоматизированного…
OpenAI объединила в ИИ-агента браузер, Deep Research и разговорный ИИ

ChatGPT Agent — это ИИ, который не только отвечает на вопросы, но и выполняет задачи, используя собственный «виртуальный компьютер».

Пользователь активирует режим агента через меню «Agent Mode» или команду «/agent» в интерфейсе ChatGPT.

Он может:
- Проводить исследования, собирать данные с веб-сайтов и синтезировать их в отчёты.
- Создавать презентации, таблицы и другие документы с возможностью их редактирования.
- Взаимодействовать с веб-сайтами: заполнять формы, кликать по кнопкам, искать информацию.
- Работать с внешними сервисами через API (например, Gmail, GitHub) с помощью ChatGPT Connectors.
- Планировать задачи: от бронирования ресторана до анализа финансовых данных.

ChatGPT Agent использует набор инструментов:
1. Визуальный браузер, который взаимодействует с сайтами, как человек, кликая и прокручивая страницы.
2. Текстовый браузер, который быстро собирает информацию с веб-страниц.
3. Терминал, выполняющий код в изолированной среде.
4. API-доступ, который интегрируется с внешними сервисами.
5. Memento сохраняет прогресс для долгих задач.

Задачи занимают от 5 до 30 минут в зависимости от сложности.

Сэм Альтман назвал технологию «передовой, но не готовой для высокорисковых задач или работы с чувствительными данными». Пользователям рекомендуют быть осторожными, особенно при предоставлении личной информации.

ChatGPT Agent — часть глобального тренда на агентские ИИ, которые становятся цифровыми помощниками, способными выполнять многоэтапные задачи. По прогнозам Litslink, рынок ИИ-агентов вырастет с $5.4 млрд в 2022 году до $47.1 млрд к 2030 году с годовым ростом 45%.
👍148👏2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️Квантовая гонка mode on: Amazon представил свой чип Amazon Web Services представила Ocelot – 1-й квантовый чип компании, основанный на подходе к квантовой коррекции ошибок. В отличие от традиционных методов, требующих тысяч физических кубитов для создания…
Microsoft продает Дании за €80млн квантовый компьютер уровня 2 - это 1-ая коммерческая история

Дания объявила о создании СП QuNorth для покупки и эксплуатации квантового компьютера уровня 2 Magne- теоретически должны показать реальное преимущество перед классическими компьютерами.

Ранее мы писали о квантовой гонке среди ИТ-гигантов.

Что покупают датчане?

- 50 логических кубитов (1-я коммерческая система такого уровня)
- Более 1200 физических кубитов для обеспечения коррекции ошибок
- Полный программный стек от Microsoft Azure Quantum
- Аппаратное обеспечение на технологии "нейтральных атомов" от Atom Computing.
7👍6🤔2🤣1
⚡️Стейблкоины теперь в законе - Трамп подписал закон

Палата представителей конгресса США приняла 3 закона о регулировании криптовалютного рынка.

Помимо GENIUS Act конгрессмены проголосовали за принятие закона о прозрачности рынка цифровых активов и закона о государственном надзоре за цифровой валютой ЦБ.

Стейблкоины уже обогнали visa, Mastercard по объему транзакций, подробнее тут.
🔥9👍7👏21🤔1🦄1
Итоги уходящей недели, то, что имеет значение в России и мире

Новые ИИ-модели, агенты и архитектуры

Китайская Kimi K2 от Moonshot
самая обсуждаемая новая ИИ-модель

Google DeepMind представили Mixture-of-Recursionsновую архитектуру LLM, которая удваивает скорость инференса и снижает потребление памяти на 50%.

Decart запустили MirageLSD — первую модель Live-Stream Diffusion для трансформации любого видеопотока в реальном времени с задержкой менее 40мс

Apple создали первую ИИ-модель для анализа поведенческих данных

OpenAI объединили в ИИ-агента браузер, Deep Research и разговорный ИИ в единую систему

Google интегрировал ИИ-агента в поисковик

Apple представили Foundation Models framework — дает разработчикам прямой доступ к встроенной AFM модели

Google создали инструмент для виртуальных миров, где множество ИИ-агентов взаимодействуют в различных сценариях

Команда института AIRI вошла в топ-5 соревнования Google на базе Concordia

OpenAI внедрит в ChatGPT функцию покупки товаров прямо в чате

MiniMax представили Max — первого в мире ИИ-агента для сложных многошаговых задач: от создания интернет-магазинов до анализа портфеля акций

Langchain выпустили опен-сорс инструмент для автоматизированного глубокого исследования

AgentsNet - benchmark для оценки координации ИИ-агентов в распределенных сетях без центрального управления

Anthropic запустили Claude для финансовых услуг

Лучшие ИИ-модели справляются только с половиной реальных финансовых задач, хотя показывают 90%+ на академических тестах.

Исследования и открытия

Российские математики решили задачу
57-летней давности, используя методы психологии

ИИ-агенты замедляют работу программистов на 19%исследование METR

MIT представили парадигму программирования, где ИИ помогает превращать неформальный контент в структурированный код

Исследователи Tencent обнаружили уязвимостьодин токен может обмануть LLM-судей

Биотехнологии

CZI Цукерберга выпустила GREmLN — опен-сорс модель ИИ, которая анализирует гены как живую биологическую систему

CellFlux - ИИ-модель изображений, которая симулирует морфологические изменения клеток по данным микроскопии

Стратегии, бизнес и финансы

Bay Area превосходит Индию, Японию и Германию
— совокупная стоимость компаний области залива Сан-Франциско превышает стоимость компаний 3-х стран

Meta* может отказаться от open source, также создает 2 гигантских суперкластера для ИИ мощностью в несколько гигаватт

Инвесторы просят Anthropic взять у них деньги

Технологии и железо

Google выпустит
первый полностью самостоятельно разработанный чип для смартфона Pixel 10, который представят 20 августа

США сняли ограничения
на продажу ИИ-чипов H20 от Nvidia в Китай

Microsoft продает Дании квантовый компьютер уровня 2 за €80 млн — первая коммерческая сделка такого масштаба

Hugging Face открыли предзаказы на Reachy Mini — опен-сорс робота для стола за $299

Криптовалюты и блокчейн

Трамп подписал закон о стейблкоинах
криптовалюты получили официальный правовой статус.

Казахстан планирует инвестировать часть средств Национального фонда в криптовалюты

Новая экономмодель с $10 трлн токенизированных активов к 2030 году - свежий отчет OKX

*запрещенная в России организация.
👍157
Производитель микроэлектроники в РФ купил долю у разработчика робота Федор

АО "Корпорация роботов" (входит в ГК "Элемент") приобрело 51%-ю долю в уставном капитале АО "НПО "Андроидная техника"". Что такое робот Федор можно узнать тут.

Одним из первых приоритетных проектов "Корпорации роботов" станет развитие производства электродвигателей и сервоприводов для рынка промышленной робототехники, металлообрабатывающего оборудования и систем автоматизации производства.
🥴13👍2🔥1👏1
Важная история сейчас происходит, которая может разрушить репутацию OpenAI

Произошел скандал на выходных, связанный с OpenAI и якобы их победой золотой медали на международной олимпиаде по математике (IMO).

IMO — самое престижное соревнование по математике для школьников. В этом году к соревнованию людей добавились ИИ-системы от крупных компаний.

IMO установила правила для участия ИИ-лабораторий:
1. Можно тестировать ИИ на задачах IMO
2. НО нельзя публиковать результаты 7 дней после закрытия Олимпиады, чтобы не затмить достижения детей.
3. Плюс нужна независимая проверка результатов ИИ-работ.

В итоге среди участников-людей:
Китай занял 1-е место с командным счетом 231 из 252 возможных. США — 2-е место 216 баллов, Южная Корея — 3-е 203 балла. Порог золотой медали (35 баллов) оказался рекордно высоким.

Заявления ИИ-компаний:

OpenAI
19 июля заявила, что их экспериментальная модель решила 5 из 6 задач IMO 2025, набрав 35 баллов — достаточно для золота. Ключевые утверждения:
- Тестирование проводилось в "стандартных условиях" (4,5 часа на сессию, без инструментов)
- Оценку проводили три бывших медалиста IMO
- Решения доступны на GitHub.

Google DeepMind получила отличные результаты 18 июля, но ничего не опубликовала в паблик, так как таковы правила IMO. Команда работала с официальными координаторами IMO. Отметим, что в феврале этого года Google решил 84% задач на математической олимпиаде.

Кроме этих компаний участвовала лаборатория Harmonic, созданная Владом Теневым, СЕО Robinhood. Их ИИ-модель для математики Аристотель тоже принял участие в IMO. Они заявят официально результаты только 28 июля, согласно правилам.

Тем временем организаторы
IMO подтвердили, что проверили математическую корректность доказательств OpenAI, но не смогли проверить, как эти доказательства были получены. Это критически важное различие между оценкой результата и валидацией процесса.

Независимая проверка MathArena показывает, что при честном тестировании даже самые продвинутые ИИ-модели не могут получить бронзу IMO, не говоря уже о золоте. Paper. GitHub.

Лучший результат был у Gemini 2.5 Pro — 13 баллов (31%)
Все протестированные модели, включая o3 и o4-mini от OpenAI, не достигли даже бронзовой медали (19 баллов).
Без best-of-32 селекции результаты упали бы ниже 10%

Бывшие участники IMO выступили с критикой к OpenAI и отказались
комментировать самоотчетные результаты без раскрытия методологии.

Джозеф Майерс, председатель комитета IMO, заявил, что OpenAI не сотрудничала с IMO для тестирования, и никто из 91 официального координатора не участвовал в оценке их решений.

А между тем в паблике OpenAI заявляет о золоте (35/42), независимые тесты показывают неспособность достичь даже бронзы (19/42).

Эта ситуация
показывает реальность наших дней - противоречие между реальностью и маркетинговыми заявлениями.

Что мы знаем точно?
- Доказательства OpenAI математически корректны
- Процесс их получения не верифицирован независимо
-Публичные модели далеки от заявленного уровня
Что остается неясным?
- Реальные условия тестирования модели OpenAI
- Количество попыток и вычислительных ресурсов
- Возможность воспроизведения результатов.

Для научного сообщества важнее не сам факт решения задач, а понимание того, как это было достигнуто.
💯34🤣76👀3🔥2👍1