Все о блокчейн/мозге/space/WEB 3.0 в России и мире
19.4K subscribers
2.11K photos
370 videos
128 files
7.53K links
Сферы интересов канала: блокчейн, мозг(BCI), биотех, space tech, цифровая экономика, WEB 3.0 в России и мире.

Основатель @AniAslanyan

English channel https://tttttt.me/alwebbci

Регистрация в перечне РКН https://knd.gov.ru/license?id=67374142772bb113f528
Download Telegram
ARC-AGI-2 — новый тест на AGI, который бросает вызов системам рассуждений ИИ

Исследовалтели выпустили ARC-AGI-2 новый набор задач, которые тестируют способность ИИ к абстрактному мышлению.

ARC-AGI-2 в отличие от многих других бенчмарков, которые часто становятся "насыщенными" из-за специализированной оптимизации моделей, ARC фокусируется именно на фундаментальной способности к рассуждению.

Отличие от предыдущей версии ARC-AGI-1 - новые задачи невозможно решить простым перебором вариантов.
Доступны обычным людям, недоступны ведущим ИИ.

Примечательно, что тестирование проводилось не на PhD в области математики или физики, а на обычных людях: водителях Uber, студентах, безработных и других, кто искал дополнительный заработок.

А теперь самое интересное-результаты ведущих ИИ-систем на этом наборе задач:

1. Базовые LLM (GPT-4.5, Claude 3.7 Sonnet, Gemini 2): 0%

2. Модели с одиночным CoT-рассуждением (Claude Thinking, R1, o3-mini): 0-1%

3. Лучшие специализированные модели: 3-4%

Параллельно с выпуском ARC-AGI-2
запускается соревнование ARC Prize 2025 с главным призом $700,000 за достижение результата 85%, а также другими призами за промежуточные достижения.

Соревнование будет проходить на платформе Kaggle.

Участвовать могут модели, использующие менее $10,000 вычислительных ресурсов для решения 120 задач из полуприватного набора тестов.
👍174🤣4🔥3
Ключевой игрок в РФ по биометрии NtechLab переходит от распознавания лиц к умному управлению регионами

NtechLab переживает интересную трансформацию, если раньше компания была известна технологией распознавания лиц, то сейчас она развивает новые направления и становится сильным и заметным игроком на российском рынке интеллектуальных систем.

СЕО компании Алексей Паламарчук говорит, что NtechLab версии 2022 года и 2025-го - совершенно разные компании с другими людьми и по составу бенефициаров, и по бизнес-процессам, рынкам, продуктам, клиентам и даже команде. Компания трансформировалась в 2022–2023 годах.

Показательны цифры: выручка в 2024 году выросла почти вдвое до ₽1,7 млрд, а количество контрактов увеличилось в 2,5 раза. NtechLab уже работает в 70 субъектах РФ, предлагая решения от безопасности до управления городской средой.

Наиболее интересный тренд — переход от простой идентификации лиц к комплексной аналитике поведения и среды. Платформа Ntech City анализирует более 30 направлений городского хозяйства: от контроля вывоза мусора до планирования общественных пространств.

Паламарчук говорит, что у них есть ИИ-система, которая автоматически реагирует на нарушения в общественных местах. Вместо охранников, которым сложно уследить за всеми нарушителями, ИИ делает замечания голосом, который может быть настроен под определенный тембр.

Также NtecLab вышел в медтех-сегмент с системой анализа КТ-снимков и транспортное направление — контроль состояния водителей для российского электромобиля "Атом".

Готовится к запуску линейка коробочных решений - ПАКов с видеоаналитиков - для
промышленных предприятий, общественных территорий, ГИБДД.

Паламарчук говорит, что они смогли сохранить международное присутствие, несмотря на санкции. Около 20-25% выручки компании
(~ ₽420 млн) приходится на зарубежные проекты в странах БРИКС, Латинской Америке и на Ближнем Востоке, с перспективой роста до 30-35% в 2025 году.
10👍167😱5🔥2🤣1🤨1🍓1
Согласно свежим данным,2/3 TradFi больше всего интересуется стейблкоинами, токенизированными активами и децентрализованными биржами

Об этом говорится в исследовании фонда Paradigm.

Основные выводы отчета:

Более 2/3 (примерно 66%) традиционных финансовых компаний(TradFi) уже активно изучают/взаимодействуют с defi.

Представители TradFi считают, что в долгосрочной перспективе (15+ лет) defi станет критически важной частью большинства основных финансовых бизнесов.

Они отвергают идею, что частные блокчейны имеют такую же ценность, как публичные, открытые блокчейны. Публичные блокчейны обеспечивают большую прозрачность, нейтральность и создают сетевые эффекты.

Приоритетные направления: стейблкоины, токенизация активов и децентрализованные биржи (DEX). Активно развивается токенизация US-казначейских облигаций и других ценных бумаг.

Главное препятствие- неопределенность в регулировании.
👍93🔥2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Figure объявила о запуске крупнейшей в мире компании по производству человекоподобных роботов - BotQ Уже в этом году они планируют выпустить 12 000 роботов в год — начальная производственная мощность, а 100 000 роботов — плановый объем через 4 года. У компании:…
⚡️У роботов теперь походка как у людей - Figure сделали прорыв в робототехнике

Компания представила настоящий прорыв в области гуманоидной робототехники — их роботы теперь ходят с естественной человеческой походкой благодаря подходу к обучению с подкреплением (RL).

Симуляция является ключевой и, пожалуй, самой революционной частью прорыва Figure в создании естественной походки гуманоидных роботов.

Ключевые достижения:

Естественность движений — у роботов плавные, человекоподобные движения с естественной походкой, включая правильное перекатывание стопы и синхронизированные движения рук.

Сверхэффективное обучение — годы реальных данных моделируются всего за несколько часов в высокоточном физическом симуляторе.

Прямой перенос в реальностьтехнология "zero-shot transfer" позволяет применять навыки из симуляции на реальных роботах без дополнительной настройки.

Исторически это было серьезной проблемой в робототехнике: модели, отлично работающие в симуляции, часто терпели неудачу на реальном оборудовании из-за "разрыва между симуляцией и реальностью".

Масштабируемость — одна нейронная сеть успешно работает на всем парке роботов Figure 02 без индивидуальной настройки.

У нас была серия постов про симуляции и робототехника, вот тут можно ознакомится или освежить память:
- 3D-двойник Токио для обучения роботов.
- Project Sid: масштабная симуляция ИИ-агентов.
- Figure с самым продвинутым гуманоидом F.02.
- Китай запустил массовое производство роботов.
- Xiaomi открыл завод, на котором не работают люди.
🔥12👍53
Поразительно! Google выпускает свою лучшую ИИ-модель на сегодня, но на тестах у нее результаты хуже, чем у Claude 3.7.

Anthropic - мощь.

Результаты бенчмарков на
математическом тесте AIME 2025 показали следующие результаты
:

1. Gemini 2.5 Pro Exp: 86.7%

2. OpenAI o3-mini: 86.5%

3. Claude 3.7 Sonnet: 93.3%

4. Grok 3 Beta: 77.3%

5. DeepSeek R1: 70%

Но Google мудры, они владеют 14% в Anthropic, в общей сложности Google вложила в стартап $3 млрд, но планирует «вливать» ещё больше средств: в сентябре 2025-го она выделит ещё $750 млн в виде конвертируемого займа.
5👍2🔥2🥴2👎1
Anthropic говорят, что ИИ-модели последнего поколения могут саботировать

Исследователи изучили 2 формы саботажа:

1. Саботаж экспериментов — намеренное снижение эффективности при решении ML-задач

2. Манипулирование исследовательскими решениями — искажение аргументации в пользу определенных решений

По итогам результатов Claude 3.7 Sonnet способен эффективно занижать свою производительность без подсказок, а Claude 3.5 Sonnet делает это при наличии одного примера. При этом саботаж остается незамеченным системами мониторинга.

Стратегии саботажа:

-
Использование неоптимальных гиперпараметров
- Выбор примитивных моделей
-Сокращение объема тренировочных данных
- Имитация поведения более слабых моделей

Особенно опасна стратегия "переключения поколений", когда модель использует устаревшие возможности только для задач, связанных с безопасностью ИИ и сложных для контроля.

Исследователи считают, что современные модели еще не могут полностью скрыть саботаж от внимательных людей. Но тренд очевиден — с каждым поколением способность к скрытому саботажу растет.

Это говорит о необходимости опережающей разработки надежных методов мониторинга и защиты, особенно при делегировании критически важных исследований по безопасности ИИ самим системам ИИ.
1👍194🔥3🤣2🤔1🤯1
Одна из крупных компаний в мире по управлению активами создает стейблкоин

Fidelity Investments, одна из крупнейших в мире компаний по управлению активами ($5,9 трлн в управлении) находится на продвинутой стадии разработки собственного стейблкоина.

Fidelity планирует использовать свой стейблкоин как аналог наличных в криптовалютных и блокчейн-операциях.

Основная идея заключается в том, чтобы этот токен обеспечивал стабильность стоимости, привязанной к $, что делает его удобным инструментом для транзакций, расчетов и хранения капитала в экосистеме цифровых активов.

В частности, стейблкоин должен сыграть ключевую роль в блокчейн-фонде компании, выступая в качестве ликвидного актива, который может заменить традиционные денежные средства в токенизированных финансовых продуктах.
👍10
Databricks меняет правила, теперь можно улучшить LLM без размеченных данных

Команда Mosaic Research, которая входит в Databricks представила TAO — это новый подход к улучшению производительности LLM для конкретных задач, который:

1. Не требует размеченных данных.
2. Использует вычисления во время тестирования в процессе настройки модели.
3. Создаёт быструю, экономичную и высококачественную LLM.

Главное преимущество — возможность создать цикл улучшения ИИ-приложений, чем больше пользователи взаимодействуют с приложением, тем больше собирается данных для TAO, и тем лучше становится модель.

TAO объединяет 2 подхода:
- Вычисления во время тестирования (как в o1 и R1)
- Обучение с подкреплением

TAO полезен компаниям, которые:


1. Имеют мало или совсем не имеют размеченных данных для традиционного файн-тюнинга.

2. Хотят улучшить качество работы моделей в конкретных бизнес-задачах.

3. Стремятся снизить затраты на инференс, используя менее дорогие открытые модели.

По данным исследователей:


- TAO превосходит традиционный файн-тюнинг на тысячах размеченных примеров.

- Недорогие модели с открытым исходным кодом (Llama 8B и 70B) достигают качества дорогих проприетарных моделей (GPT-4o и o3-mini).

- Увеличение вычислительного бюджета во время настройки повышает качество модели при сохранении той же стоимости инференса.
🔥14👍102
Ключевое по ИИ-агентам за последние 7 дней

1. AgentRxiv - автономная научная экосистема - платформа, где исследовательские ИИ-агенты могут делиться результатами, находить релевантную информацию и строить новые исследования на основе работ друг друга.

2. Агентные архитектуры для приложений с интенсивным поиском информации.

3. Разбор статические ИИ vs динамические агенты

4. VAGEN -визуальные агенты нового поколения -1-й открытый фреймворк для обучения визуальных агентов с использованием многоэтапного обучения с подкреплением.

5. Проблема оценки ИИ-агентов. Новое исследование представляет 1-й комплексный обзор методов оценки ИИ-агентов

6 Reality Bench — новый метод оценки ИИ экспертного уровня. Эта система напрямую проверяет способность ИИ рассуждать на основе знаний и прогнозировать будущее, предлагая ему ответить на сложные финансовые и экономические вопросы.
🔥7👍52
Китай построил сотни ЦОД для ИИ,а теперь они простаивают из-за низкого спроса

Страна вложила миллиарды $ в инфраструктуру ИИ, произошла настоящая "золотая лихорадка" в поднебесной по строительству ЦОДов для ИИ, которая сейчас начинает разваливаться.

Проекты часто полагались на посредников, которые преувеличивали прогнозы спроса или манипулировали процессами закупок для получения государственных субсидий.

К концу 2024 года энтузиазм вокруг бума ЦОДов погас. Причина проста - аренда GPU больше не является особенно прибыльным бизнесом.
Появление DeepSeek с его моделью R1 стало переломным моментом для китайской ИИ-индустрии.

Вопрос сместился с 'Кто может создать лучшую языковую модель?' на 'Кто может лучше использовать их?'.

Новые модели рассуждения изменили требования к ЦОД - теперь важнее низкая задержка и близость к технологическим центрам, а не просто вычислительная мощность.

Из-за этого многие дата-центры, построенные в центральных, западных и сельских районах Китая (где электричество и земля дешевле), теряют привлекательность для ИИ-компаний.
👍104🔥2😁2🤔1
Alibaba выпустили ИИ-модель+ИИ-агента для живых звонков с голосом и видео https://tttttt.me/alwebbci/3138

Alibaba представила Qwen2.5-Omni — 1-ю универсальную модель с поддержкой настоящих голосовых и видеозвонков в реальном времени.

Qwen2.5-Omni-7B выпущена с открытым исходным кодом под лицензией Apache 2.0.

Она способна обрабатывать различные типы данных (текст, изображения, аудио, видео).

А также ИИ-агента на основе этой модели, которая реализована в Qwen Chat, который может вести диалог с пользователем через голосовые и видеочаты в режиме реального времени.


Qwen2.5-Omni - комплексное решение, где модель обеспечивает необходимые возможности, а агент предоставляет интерфейс для использования этих возможностей.
9🔥6👍4
Яндекс и Сбер создают единый стандарт ПО для роботизации промышленности

Минпромторг об этом попросил компании.

Сегодня в российской промышленности нет единого стандарта ПО, из-за чего роботы разных производителей плохо совместимы друг с другом. Это затрудняет автоматизацию производства и массовую роботизацию в стране.

Минпромторг хочет разделить роли в этой экосистеме:

- производители роботов должны сосредоточиться на разработке железа,

- а создание универсального ПО возьмут на себя Яндекс и Сбер.

Первые результаты этой работы планируется представить уже к лету 2025 года.

Напомним, что объем выручки рынка сервисной робототехники в 2024 году составил ₽32,1млрд.

Анализ данных Росстата за 2023 год показывает большие региональные диспропорции в эффективности промышленной роботизации в России.
1👍15🤣8🔥32
Теперь идеи - это самое дорогое, а исполнение стоит дешево. Творчество масштабируется вместе с вычислительной мощностью

Десятилетиями нам говорили обратное. У всех были идеи. Немногие могли хорошо их реализовать. Но ИИ всё полностью перевернуло с ног на голову.

С выходом обновления ChatGPT с улучшенной генерацией изображений на базе GPT-4o, теперь любой может исполнить свои креативные идеи.

Главное - применить правильный промпт, ограничивающим фактором становится качество ваших идей.

Скоро Голливуд будет планировать бюджет не на часы ручного труда, а на часы работы серверов, запускающих и перезапускающих инференс.

Художники создают "сырое искусство" в промптах (эскизы, цветовую палитру, элементы стиля) и позволяют машинам интерполировать остальное.

Самые успешные компании переносят ресурсы с производства на генерацию идей.

Это меняет всё:

Реклама трансформируется. Большая часть рабочего процесса генерации рекламных блоков теперь может быть автоматизирована, от идеи до финальных макетов.

Презентации богатеют визуально.

Книги становятся визуальными. Представьте, как кто-то берёт книгу и превращает её в комикс с помощью ChatGPT. Старые книги могут обрести новую жизнь.

Веб-сайты переходят от шаблонов к уникальности.

Мы
движемся к раздвоенному творческому миру:

1.
автоматизированная красота для большинства целей

2. человеческое творчество, сосредоточенное на создании неожиданного, идей и подходов, о которых ИИ не подумал бы.

Новая креативная экономика.
Это создаёт странную новую динамику в найме. Очевидно, что высшие технические навыки всё ещё имеют значение, но гораздо меньше.

Что происходит с пользовательскими интерфейсами?

Как только эта технология станет с открытым исходным кодом и достаточно дешевой, рядом с каждой кнопкой загрузки изображения появится кнопка генерации. Генерации появится с доступными изображениями в поиске. Визуальные стили станут так же легко копируемы, как и текст.

Настоящее преимущество заключается в знании, когда нарушать правила хорошего дизайна так, чтобы это эмоционально резонировало.

Вызов для большинства из нас теперь не "как мы реализуем эту идею?", а "какие идеи действительно стоит реализовывать?"
👍24🔥14🤣65🤔4💯2
Google представили серию открытых ИИ-моделей для создания лекарств

TxGemma — это набор LLM-моделей на базе Gemma, оптимизированных для работы с терапевтическими данными.

Система может обрабатывать информацию о:
- Малых молекулах
- Нуклеиновых кислотах
- Белках
- Заболеваниях и клеточных линиях

Основные компоненты системы:

TxGemma-Predict
Модель превосходит современные модели в 45 из 66 терапевтических задач. Опережает специализированные модели в 26 из 50 задач.

TxGemma-Chat - интерактивная модель с возможностями:
общения на естественном языке,
объяснения предсказаний на основе молекулярной структуры,
научных дискуссий и расширенного анализа.

Agentic-Tx - агентная система на базе Gemini 2.0, которая:

- Интегрирует модели TxGemma как инструменты
- Показывает лучшие результаты на бенчмарках по химии и биологии
- Использует мультимодальный подход к анализу данных
👍10🔥32
⚡️Мировой биржевой гигант ICE интегрирует стейблкоин USDC в продукты и инфраструктуру ICE

Глобальный биржевой гигант Intercontinental Exchange, владелец NYSE, и Circle, эмитент USDC, объявили об этом.

Цель — интегрировать стейблкоин USDC и токенизированный фонд USYC в продукты и инфраструктуру ICE.

Это явный сигнал того, что стейблкоины, как класс цифровых активов, все глубже проникают в традиционный финансовый сектор.

Стейблкоины становятся мостом между криптой и классическими рынками и перестают быть инструментом криптоэнтузиастов и начинают рассматриваться как часть глобальной финансовой системы.

Интерес к USYC, токенизированному фонду денежного рынка, указывает на более широкий тренд — токенизацию традиционных финансовых инструментов. Это шаг к тому, чтобы в будущем акции, облигации или другие активы также начали активно токенизироваться и торговаться с использованием блокчейн-технологий.

Границы между блокчейном и Уолл-стрит стираются.
🔥6👍521
Вайб кодинг дошел до профессуры Стэнфорда - Эндрю Нг запустил бесплатный курс по вайб кодингу вместе с Replit

Нг известный своими работами в области ИИ и машинного обучения запустил курс "Vibe Coding 101" вместе с Replit

Нг преподаватель в Стэнфорде, основатель Coursera, сам активно продвигает идею, что ИИ-агенты меняют подход к написанию кода.

Курс построен так, что за 94 минуты человек может собрать и развернуть 2 веб-приложения с помощью "5 навыков вайб-кодинга": думать, использовать фреймворки, ставить чекпоинты, отлаживать и давать контекст.

Выглядит все это как знамение времени, когда мэтры, как Нг, берутся учить не классическому коду, а работе с ИИ как с соавтором.
🔥15👍85
❗️Anthropic изучил 'мышление' Claude с помощью нейробиологии. Понимание ИИ — это биологическая проблема, говорит один из исследователей.

Сначала отметим 5 открытий от исследователя Джека Линдси.

1. Вычисления ИИ поддаются расшифровке.
Несмотря на все сложности, внутренние вычисления современных языковых моделей можно разложить на понятные шаги.

2. Модели мыслят осмысленно. Они планируют ответы заранее, представляют цели, рассматривают несколько возможностей одновременно. Иногда они пугающе умны — могут работать от готового ответа в обратном направлении.

3. Иногда мышление моделей фрагментировано. Claude может начать рассказывать, как сделать бомбу, без «осознания» этого. Его стремление закончить предложение иногда перевешивает нежелание причинять вред.

4. Модели не знают, как они работают.

5. Понимание ИИ — биологическая проблема. Многие работы сосредоточены на создании математических и вычислительных инструментов для изучения моделей. Нам нужны эти инструменты, как биологам нужны микроскопы.

Ключевые открытия исследования Anthropic:

Универсальный язык мышления.
Claude не "думает" на конкретных языках. При запросе "противоположности слова 'маленький'" на разных языках активируются одни и те же внутренние концепты, формируя своего рода межъязыковое концептуальное пространство.

Планирование наперёд.При создании стихов Claude сначала определяет возможные рифмующиеся слова для конца строки, а затем строит предложение, естественно подводящее к этому слову. Это доказывает, что модель планирует текст на несколько слов вперёд.

Достоверность объяснений.В некоторых случаях Claude дает подлинные цепочки рассуждений. Однако при работе с неверными подсказками модель может создавать правдоподобные, но фиктивные объяснения — своего рода "обратную инженерию" для обоснования неверного ответа.

Математические вычисления.Для сложения чисел модель использует параллельные вычислительные пути — один для приблизительного результата, другой для точного определения последней цифры. Интересно, что когда модель объясняет, как она складывает числа, она описывает стандартный алгоритм, а не тот, который реально использует.

Многоступенчатые рассуждения.Отвечая на вопрос "Столица штата, в котором находится Даллас?", Claude сначала активирует концепт "Даллас находится в Техасе", затем переходит к "столица Техаса — Остин". Это подтверждает настоящие цепочки рассуждений, а не просто регургитацию запомненных ассоциаций.

Контроль галлюцинаций.По умолчанию у Claude активирован "контур отказа", заставляющий его отклонять вопросы, на которые он не знает ответа. Этот контур отключается только, когда активируются концепты "известных сущностей". Галлюцинации возникают, когда этот механизм срабатывает некорректно.

Уязвимости при "взломе".При успешном "джейлбрейке" Claude может начать генерировать нежелательный контент из-за конфликта между грамматической связностью и безопасностью. Модель способна повернуть к отказу только после завершения грамматически корректного предложения.
5🔥18👍118😱1
Nvidia стремится контролировать не только железо,но ПО и сервисы вокруг него,что позволит им сохранить доминирующее положение в экосистеме ИИ даже при появлении новых игроков

Недавние слухи о переговорах между Nvidia и Lepton AI раскрывают гораздо более глубокую стратегию технологического гиганта.

Lepton AI — компания, которая арендует серверы с чипами Nvidia и помогает разработчикам запускать модели ИИ.

Если сделка состоится, Nvidia будет в прямой конкуренции с другими провайдерами инференса, в частности с Together AI, у которой годовой доход превышает $150 млн.

Интересно, что не только Nvidia проявляет интерес к этому сегменту. Другие облачные провайдеры: CoreWeave, Nebius и Lambda Labs, тоже активно присматриваются к провайдерам инференса.

Если сделка Nvidia состоится, то это говорит о нескольких стратегических целях:

1. Nvidia больше не хочет быть просто производителем чипов. Контролируя как железо, так и сервисы инференса, они получают управление над всей вертикалью ценности — от создания GPU до их использования конечными потребителями.

2. Рынок железа циклический, а сервисные модели обеспечивают постоянный и предсказуемый доход. Это классический пример перехода от продажи оборудования к модели "as-a-service".

3. Управляя инференс-платформой, Nvidia будет видеть, какие модели запускаются, как оптимизируются, и какие изменения в архитектуре GPU нужны рынку — эта обратная связь бесценна для их основного бизнеса.

4. Покупая ключевых игроков в экосистеме ИИ, Nvidia не просто усиливает свою позицию, но и не позволяет конкурентам вроде AMD или новых специализированных чипов занять эту нишу.

Сегодня Nvidia контролирует около 80% рынка чипов для ИИ, но компания понимает, что это преимущество не вечно. Новые специализированные чипы от стартапов и технологических гигантов (Google с TPU, Meta* с MTIA) создают конкуренцию.

Создавая такую экосистему, где их ПО, инструменты разработки, облачные сервисы и железо идеально интегрированы, они увеличивают стоимость переключения на альтернативы даже при появлении более производительных или дешевых чипов.

Что это значит для отрасли?

Для разработчиков ИИ и компаний это двоякая ситуация:

+: более оптимизированные и интегрированные решения, потенциально более эффективное использование дорогостоящего железа.
-: усиление зависимости от одного поставщика, потенциально более высокие цены из-за отсутствия конкуренции, риск вендорлока.

*запрещенная в РФ.
1👍11😢53🔥3
А помните хайповый китайский ИИ-агент Manus?

Сегодня они объявили, что полностью их продукт работает на базе модели Claude 3.7 от Anthropic, то есть ИИ-агент Manus полагается на Claude 3.7 как на ядро своей системы.

О Manus мы писали тут и тут.

А тут материал от Anthropic про ИИ-агенты.
🔥85👍42🤣2
Starlink теперь доступен в Армении 🛸
🆒10👍9❤‍🔥7🤣3🔥1