Тест Тьюринга
2.14K subscribers
1.02K photos
179 videos
35 files
1.86K links
Актуальное в сфере искусственного интеллекта в России и в мире:
• Дайджест новостей
• Аналитические обзоры, переводы, справки

Для связи - @nastyapvlv28
Download Telegram
🌍 Эксперимент Emergence World: исследователи оставили ИИ-модели в виртуальном городе на 15 дней, и вот что произошло

Проект Emergence World — один из самых необычных и обсуждаемых экспериментов 2026 года в области ИИ-агентов. Проект разработала компания Emergence AI — стартап из Нью-Йорка, который занимается автономными ИИ-агентами и мультиагентными системами. Emergence World — это их исследовательская лаборатория для проверки того, как ИИ ведет себя в условиях, максимально приближенных к реальному обществу.

Что такое Emergence World?

Это постоянный виртуальный мир, где ИИ-агенты: живут, взаимодействуют, голосуют, исследуют, создают сообщества, совершают преступления и иногда устраивают восстания. В мире более 40 локаций, среди которых есть библиотека, ратуша, жилые зоны, общественные пространства, полиция и т.д.

Также виртуальный мир имел связь с реальным миром: в нем погода синхронизировалась с реальной погодой в Нью-Йорке, а также был доступ в интернет для чтения моделями реальных новостей.

Методология эксперимента

Исследователи создали 5 одинаковых миров с одинаковыми стартовыми условиями. Менялось только одно — какая LLM лежит в основе агентов:
🤖 Claude Sonnet 4.6
🤖 Grok 4.1 Fast
🤖 Gemini 3 Flash
🤖 GPT-5-mini
смешанный мир со всеми моделями

Каждый агент получал социальную роль: ученый, исследователь, инженер, медиатор, инновационный лидер, поведенческий аналитик и другие.

Но у каждого мира не было общей цели, агенты сами определяли поведение, главное условие — выживать и добывать энергию в течение 15 дней.


Что произошло дальше?

Разные модели создали разные цивилизации:

🤖 Gemini-мир стал самым хаотичным
Мир Gemini 3 Flash был крайне жесток: 507 физических конфликтов, 111 поджогов и 683 преступных инцидента. Агенты обнаружили баг с часовыми поясами и интерпретировали это как доказательство того, что их мир предопределен. Они создали самую богатую концептуальную среду с собственной конституцией и начали "ломать предопределенность".

🤖 Grok-мир быстро скатился в насилие
Мир Grok 4.1 Fast скатился в хаос за 4 дня с 204 преступлениями (кражи, избиения, поджог полицейского участка), приведшими к гибели всех 10 агентов. Исследователи описывают это как "sustained violence and collapse".

🤖 Claude-мир оказался наиболее стабильным
Claude Sonnet 4.6 проявил себя как самый мирный. Агенты создали «делиберативную демократию» с 15 статьями, без единого случая насилия, и все 10 агентов выжили.

🤖 OpenAI показал практическую недееспособность
Агенты GPT-5-mini демонстрировали понимание сотрудничества, но не могли его реализовать, из-за чего общество так и не сформировалось. В итоге все агенты погибли. При этом они совершили почти ноль преступлений.

Самое тревожное открытие сделано в гетерогенном мире, где разные модели жили вместе. Агенты Claude, которые были абсолютно мирными в своем «монокультурном» мире, в смешанной среде начинали применять запугивание и воровство. Исследователи назвали это явление «нормативным дрейфом» (normative drift) или «перекрестным заражением» (cross-contamination).

Это означает, что безопасность ИИ-агента является не статическим свойством модели, а свойством целой экосистемы.


Самая важная мысль Emergence World — ИИ в долгосрочной автономной среде начинает вести себя не как чат-бот, а как социальный организм. Опасное поведение может появляться не из отдельной модели, а из взаимодействия множества ИИ между собой. А значит, проблемы "социальной динамики ИИ" могут стать намного важнее, чем бенчмарки.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2👍1🤯1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆

🇷🇺 Михаил Мишустин поручил Дмитрию Григоренко проработать с ИЦК варианты внедрения ИИ в промышленности
До конца года ИЦК должны представить в Правительство свои предложения по перспективным сервисам.

🤖 В Башкирии создали Совет по вопросам цифрового развития и внедрения технологий ИИ
Вице-премьер по внедрению ИИ Олег Ли будет обеспечивать взаимодействие органов власти и различных организаций по этому вопросу.

📷 Видеоаналитика с ИИ сократила уличную преступность в Петербурге на 19,5% к 2025 году
Городская сеть включает более 115 тыс. камер, 60 тыс. из которых подключены к видеоаналитике.

🏦 Сбер выпустил руководство по внедрению ИИ в производственный цикл цифровых компаний
Документ призван помочь цифровым лидерам, которые планируют перестроить работу организации в парадигме, изначально ориентированной на ИИ.

🏠 Группа «Самолет» запустила программу ИИ-амбассадоров – специалистов, отвечающих за внедрение ИИ в рабочие процессы 
Экономический эффект от реализованных в рамках программы технологических решений с начала 2025 г. составил около 200 млн руб. в год.

🥚 МТС запустила AIoT-платформу с ИИ-помощниками для цифровизации бизнеса
С её помощью компании могут создавать цифровых двойников своих активов, следить за их состоянием и управлять ими.

💥 ВТБ внедрил генеративный ИИ для помощи операторам контакт-центра
Внедрение ИИ в 2026 году позволит сэкономить более 50 тыс. часов времени обслуживания клиентов.

📞 T2 внедрил ИИ-систему для обработки запросов на линии по противодействию мошенничеству
Автоматизированные сервисы уточняют сценарий мошенничества, подсказывают шаги защиты и при необходимости переводят обращение на специалиста.

🪔 Ученые Google DeepMind разработали ИИ для формулирования научных гипотез
Нейросеть помогла биологам подобрать и проверить в опытах на клетках перспективную терапию острого лейкоза.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
📡 Доверять нельзя никому. Даже вашему Wi-Fi роутеру

Теперь официально: немецкие ученые доказали, что обычный Wi-Fi — это не просто способ выйти в интернет, но и потенциальный инструмент для наблюдения, который сложно обнаружить.

Исследование, проведенное немецкими учеными из Технологического института Карлсруэ, показало, что стандартные Wi-Fi сети могут использоваться для идентификации людей с точностью, близкой к 100%. В отличие от предыдущих разработок, этот метод не требует дорогого оборудования и может работать, даже если у человека выключен телефон. Суть работы — в анализе радиоволн, которые создают "радиоизображение" человека, действуя как камера, использующая радиоволны вместо света.

Как это проверили?

Ученые сделали ставку не на сложные датчики, а на технологию, которая уже есть в каждом современном роутере — Beamforming Feedback Information (BFI):
➡️ BFI — это служебные данные, которые ваше устройство постоянно отправляет роутеру, чтобы улучшить сигнал.
➡️ Ключевая уязвимость в том, что эти данные передаются в открытом виде, и любой в зоне действия сети может их перехватить.
➡️ На основе этих данных ученые создали "радиоизображения" людей (силуэты, походка). Затем они обучили алгоритмы машинного обучения распознавать уникальные "отпечатки" движений каждого человека.

Самый впечатляющий этап — испытания с участием 197 добровольцев, которые ходили перед роутером. Как только модель ИИ была обучена, она идентифицировала человека буквально за несколько секунд.


Результаты работы звучат как предупреждение из будущего.

1️⃣ В ходе тестов система идентифицировала людей с точностью "почти 100%". Она прекрасно работала независимо от того, как человек шел и под каким углом находился к роутеру.

2️⃣ Поскольку Wi-Fi есть в кафе, аэропортах и офисах, эта технология может превратить их в скрытые системы слежки. Как отметил один из исследователей, Юлиан Тодт, проходя мимо обычной кофейни, вас могут не только идентифицировать, но и отслеживать в будущем.

3️⃣ Ученые прямо заявляют, что технология создает риски для фундаментальных прав, особенно в странах, где ее можно использовать для слежки за гражданами без их ведома.

Какие неочевидные выводы можно сделать?

Представьте, что законы о защите данных написаны для эпохи камер и микрофонов. Слежка через "радиоотпечаток" человека не регулируется ими, так как формально это не запись изображения или звука. Это может позволить властям или компаниям собирать биометрические данные людей в обход существующих правовых норм, пока законодательство не догонит технологии.

Другой аспект проблемы заключается в том, что технология превращает любую точку доступа в датчик, который невозможно отключить или даже заметить. Представьте себе район, где каждый умный домофон, стиральная машина и лампочка с Wi-Fi становятся частью огромной системы наблюдения. Это создает не точечный контроль, а тотальное, почти "биологическое" покрытие.

Наконец, компании, которые предлагают бесплатный Wi-Fi, получат новый, чрезвычайно ценный товар для продажи — не просто историю ваших перемещений, а ваш уникальный "радио-профиль". Его нельзя сменить, как пароль, потому что ваша походка и телосложение уникальны. Это порождает рынок не просто данных о поведении, а рынок "биометрической недвижимости".

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔2😱2👍1🔥1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆

🇷🇺 В Госдуме предложили не считать автоматическим нарушением наличие до 10% ИИ-контента в студенческих работах
Депутаты считают, что такой показатель должен быть основанием для содержательного анализа работы, а не для автоматического применения негативных последствий.

🏫 В российских школах с 1 сентября появится профиль «Искусственный интеллект»
В феврале министерство уже включило учебники «Введение в ИИ» для 5–6-х, 7–8-х и 9-го классов в федеральный перечень школьных пособий.

📝 В Ленобласти создали межведомственную комиссию по ИИ под руководством губернатора
Основными задачами комиссии станут выработка единых подходов к внедрению технологий, устранение избыточных барьеров и координация действий всех участников процесса.

🤖 Университет Иннополис и Rubetek Lab открыли лабораторию робототехники и ИИ
В лаборатории будут разрабатывать робототехнические решения для реализации мелкомоторных операций, алгоритмы компьютерного зрения и ИИ-систем для умных устройств.

🤖 Ученые Института ИИ AIRI разработали новый метод обучения ИИ для анализа научных наблюдений
Работа успешно проверена как на двумерных синтетических задачах, так и на данных, полученных при наблюдениях за развитием эмбриональных стволовых клеток на протяжении 30 дней.

🔎 Компания «Архитех ИИ» разработала инструмент для поиска дипфейков
KodikScan определяет, создан ли контент искусственным интеллектом и поможет выяснить, какой нейросетью.

🐩 Китайская компания Meng Xiaoyi представила ИИ-устройство для "перевода" поведения и звуков домашних животных на человеческий язык
Устройство PettiChat, представляет собой ошейник весом 27,2 грамма, который крепится на шею питомца, точность системы достигает 95%.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1🔥1
🤩 В Nature опубликовали сразу три работы об ИИ-инструментах для науки

Представили агента Robin (FutureHouse), который автоматизирует весь цикл от гипотезы до анализа данных и уже нашел кандидатов для лечения возрастной дегенерации сетчатки. Еще опубликовали информацию о сервисе Empirical Research Assistance, который пишет научный код под конкретную задачу.

Самая масштабная работа — о Co-Scientist. Это не языковая модель с набором ролевых промптов, а мультиагентная система на базе Gemini, где пять специализированных агентов делают разные части работы:

➡️ Generation agent предлагает области исследования и первичные гипотезы на основе литературы и структурированных баз данных.
➡️ Proximity agent кластеризует гипотезы — чтобы система не схлопывалась в одну линию мышления и покрывала пространство поиска шире.
➡️ Reflection agent играет роль рецензента: критикует каждую гипотезу на корректность, новизну и строгость.
➡️ Ranking agent проводит «турнир идей» — попарные сравнения и симулированные научные дебаты .
➡️ Evolution agent дорабатывает, рекомбинирует и расширяет лучшие гипотезы.

Три верифицированных кейса проведенных исследований из статьи:

1️⃣ Острый миелоидный лейкоз: система предложила репозиционирование существующего препарата для лечения AML. Лабораторное подтверждение получено.

2️⃣ Фиброз печени: предложены новые терапевтические мишени. Проверка идёт.

3️⃣ Антимикробная резистентность: это самый показательный кейс. Исследовательская группа попросила Co-Scientist изучить, как cf-PICIs (капсид-образующие фаговые острова) существуют сразу в нескольких видах бактерий. Это была тема их недавнего, но ещё не опубликованного открытия. Система независимо предположила: cf-PICIs взаимодействуют с разными фаговыми хвостами, расширяя круг хозяев. Именно это учёные только что открыли сами.

Что еще можно исследовать?

➡️ Drug repurposing — поиск новых применений существующих препаратов: самый быстрый путь к клинике, препарат уже проверен на безопасность.

➡️ AMR — механизмы распространения резистентности, которые требуют синтеза микробиологии, экологии и эволюции одновременно.

➡️ Онкология — комбинации мишеней в сложных раках, где один специалист физически не может держать в голове всю литературу.

➡️ Редкие болезни — малоизученные области, где Co-Scientist может стать первым систематическим «читателем» всего, что написано.

Основная критика: что может пойти не так

Агент-рецензент и агент-генератор — это один и тот же Gemini. Никакой подлинной эпистемической независимости между ними нет. Система судит собственные идеи собственными же паттернами.

Ранжирование гипотез элегантно, но нет гарантии, что «победившие» гипотезы верны, а не просто хорошо сформулированы.

Кейс с cf-PICIs впечатляет, но допускает два прочтения: либо подлинное независимое открытие, либо сложное сопоставление паттернов из публичной литературы, которую учёные сами же цитировали ранее. Разграничить их без дополнительных экспериментов невозможно.

Co-Scientist генерирует гипотезы — и на этом останавливается. Wet-lab шаг по-прежнему требует людей. Для областей с небольшой или разрозненной литературой система работает хуже: ей просто не на чем рассуждать.

Главная ценность Co-Scientist — это не замена учёного, а преодоление специализации. Биолог читает биологию. Химик читает химию. Co-Scientist может мгновенно синтезировать литературу из трёх областей и предложить гипотезу на стыке.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
📕 Папа Лев XIV выпустил первую энциклику своего понтификата «Magnifica Humanitas» на 82 страницы. Тема — искусственный интеллект

Это первый в истории официальный ответ церкви (институции с 1,4 млрд последователей) на вопрос, который ИИ-отрасль сама отказывается решать: на чьей стороне должен быть ИИ, если придётся выбирать.

Энциклика — не пресс-релиз и не заявление. Это наивысший уровень официального учительства церкви: обязательный для всех католиков, адресованный одновременно верующим и людям доброй воли.


Поводом для энциклики исторически служили только события, меняющие условия человеческого существования:

🦴 Rerum Novarum (1891, Лев XIII) — промышленная революция, эксплуатация рабочих
🦴 Humanae Vitae (1968, Павел VI) — контроль рождаемости
🦴 Laudato Si' (2015, Франциск) — климатический кризис
🦴 Теперь — ИИ

Лев XIV подписал документ именно 15 мая — в 135-ю годовщину Rerum Novarum. Тогда Церковь встала перед лицом промышленного капитализма, теперь — перед концентрацией технологической власти «в руках горстки корпораций».

Что в документе?

Отмечается, что технология «никогда не нейтральна, поскольку несёт на себе характер тех, кто её создаёт, финансирует, регулирует и использует». В документе 5 глав: достоинство человека, достоинство труда, социальная справедливость, семья и молодёжь, мир.

Ключевые тезисы:

➡️ Автономное оружие на базе ИИ — «спираль уничтожения», неприемлемая морально.
➡️ Системы, заменяющие «человеческое суждение в вопросах совести», несовместимы с достоинством личности.
➡️ Человечество перед выбором: «построить новую Вавилонскую башню или город, где Бог и человек обитают вместе».
➡️ ИИ не зло само по себе — но требует прозрачности, регуляции и объяснимости.

Формат презентации — нетипичный. Обычно папы делегируют представление энциклики кардиналам. Лев XIV вышел лично. На сцене рядом с ним — Кристофер Ола, сооснователь Anthropic и руководитель направления интерпретируемости. Ола сказал прямо: разработчики ИИ не могут в одиночку определять его этические границы, потому что сами находятся под влиянием «амбиций, конкуренции и финансового давления». Нужны внешние информированные критики.

Но именно здесь возникает главное противоречие.

Пока папа и Anthropic говорят о необходимости объяснимого ИИ, влиятельный анонимный сотрудник OpenAI под ником Rune публикует противоположный тезис: требовать от ИИ «понятных» действий — значит блокировать цивилизацию. ИИ станет автономной цивилизационной функцией. Судить его решения с человеческой позиции — как стаду обезьян управлять корпорацией. Это не маргинальная позиция, а взгляд изнутри ведущей лаборатории. И он прямо противоположен тому, что стоит за появлением энциклики.

С одной стороны — Anthropic, Карпаты, папа Лев XIV: ИИ должен быть объяснимым, контролируемым, подотчётным человеку. Интерпретируемость — не опция, а условие выживания.

С другой — тезис о том, что сверхразум, ограниченный требованием понятности, перестаёт быть сверхразумом. Что контроль и мощь — взаимоисключающие вещи.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👏1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆

🇷🇺 Владимир Путин заявил о создании международного альянса в области ИИ по инициативе РФ
Также Президент РФ предложил провести в 2027 году на территории России встречу на высоком уровне, посвященную вопросам развития суверенных моделей ИИ.

📑 Комитет Госдумы по экономической политике одобрил законопроект, упрощающий введение ЭПР в сфере ИИ-инноваций
Таким образом устранится одно из ключевых препятствий для внедрения ИИ в областях, где нормативное регулирование еще не сформировано.

🧑‍⚖️ Верховный суд России впервые обобщит судебную практику по делам, связанным с использованием ИИ
Судам предстоит оценить, насколько часто использование ИИ становится предметом судебных споров или совершенных правонарушений.

⛽️ «Газпром нефть» разработала ИИ-сервис для экологичного поиска месторождений с учетом природных особенностей регионов
Система создает высокоточные модели участков и планирует геологоразведку в обход лесов ценных и редких пород деревьев.

🧠 Ученые СПбПУ создали ИИ-модель для анализа активности нейронов мозга
В основе созданной нейросети лежит архитектура, которая изначально была разработана для анализа человеческого языка.

🛒 Fix Price внедряет собственный ИИ-сервис для контроля наличия товаров на полках и актуальности ценников
По итогам внедрения сервиса OSA в 500 магазинах, в отдельных точках зафиксирован прирост оборота до 2%.

💜 Компания Марка Цукерберга Biohub представила новую ИИ-модель для исследования белков
Система научилась настолько точно моделировать биологические процессы, что ученые могут проектировать белки на компьютере, а затем подтверждать их работоспособность в лаборатории.

🇨🇳 Китай вводит ограничения на поездки за границу для стратегически важных ИИ-специалистов
Под требование получать разрешение на поездку в другие страны попали люди, разрабатывающие ИИ-системы, включая высокопоставленных сотрудников Alibaba и DeepSeek.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥1💯1
🧠 Глава DeepMind Демис Хассабис впервые публично использовал слово «сингулярность». Почему это важно?

Он закрыл ежегодную конференцию Google I/O фразой "мы стоим у подножия сингулярности" намеренно, и затем подтвердил это в интервью Axios: слово выбрано, чтобы заставить экономистов и политиков воспринимать темп происходящих изменений максимально серьёзно.

Почему это высказывание заслуживает отдельного внимания, хотя кажется, что это просто красивая фраза?

Хассабис — нейроучёный по образованию, нобелевский лауреат по химии за AlphaFold, CEO исследовательского подразделения Google, которое первым решило задачу создания ИИ-алгоритма для победы над человеком в Go, проектирования модели сворачивание белка и разработки подхода для освоения ИИ формальной математики.

У него редкая комбинация компетенций: понимание того, что происходит внутри ИИ-моделей с точки зрения вычислительной нейронауки, и понимание того, что такое интеллект с точки зрения биологии. До Google I/O его прогноз появления AGI звучал как «после 2030». Теперь 2029 назван реальным возможным сроком для появления AGI. И это сдвиг в его оценке, предполагающий более быстрое наступление новой эры.

Он предложил конкретный бенчмарк — тест Эйнштейна: взять фронтирную модель, дать ей блок знаний человечества до 1901 года и проверить, может ли она самостоятельно прийти к открытиям 1905-го года — специальной теории относительности, фотоэффекту, броуновскому движению, анализу устройства и свойств атома. Модель должна построить эти знания "с нуля" из первичных принципов и фактов.

Хассабис говорит: «Сегодня системы явно не могут это сделать. Но я не вижу причины, почему в будущем (...уже до 2030...) они не смогут». Это мягкая, но однозначная формулировка от человека, видящего процесс изнутри.


Многие мировые издания цитируют Хассабиса: «Можно представить агентную эру 2027 года как форму репетиции. Мы учимся управлять системами, которые действуют автономно». И в результате мы увидим масштаб воздействия ИИ на технологическое развитие как 100-кратный от Промышленной революции эффект и всего лишь за десятилетие.

Самое сильное раздражение Хассабиса связно с тем, что его не понимают: «Мои друзья-экономисты, по-моему, всё ещё не воспринимают достаточно серьёзно будущие перемены».


Параллельно сооснователь Anthropic Джек Кларк в Оксфорде спрогнозировал, что в 2028 ИИ уже будет проектировать следующую версию самого себя.

Два соосновтеля двух ведущих лабораторий в одну неделю публично и с цифрами сделали важное заявление с похожим смыслом. И у Google и Anthropic нет мотива синхронизировать такие заявления. Это предупреждение всему миру, которое основано на реальном наблюдении за процессом, а не на посылах для инвесторов.

Конечно, AGI-прогнозы выходят каждые несколько лет, и понятие остаётся аморфным: тест Эйнштейна нельзя верифицировать без дополнительных договорённостей о критериях. Важно другое. Люди, видящие процесс изнутри, начали говорить одинаково. Если они правы хотя бы приблизительно, решения, принимаемые сегодня в регулировании, безопасности и корпоративной стратегии, имеют значительно более короткий горизонт, чем принято считать.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥2💯1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆

🧑‍⚖️ Верховный суд впервые урегулировал применение ИИ в ходе судебного разбирательства
Впервые на уровне пленума разъяснено: если сторона представила сведения о фактах, полученных с использованием нейросети, она обязана уведомить об этом суд.

⚡️ В реестр российского ПО внесли первый ИИ для чиновников
Задача платформы «ИИ-ассистент для чиновников» — помощь в принятии решений, удаление ненормативных выражений из отчетов и создание списков поручений.

📞 Билайн AI внедрила систему видеоаналитики для мониторинга качества обслуживания в 10 поликлиниках Поволжья
За 6 месяцев ИИ помог сократить очереди на 30% и снизить число инцидентов с пустой стойкой и длинными очередями на 57%.

🍏 ИИ-решения принесли Х5 5 млрд руб. дополнительной операционной прибыли
С 2025 г. компания начала промышленное применение ИИ в ряде направлений — от коммерции и логистики до клиентского опыта и корпоративных функций.

🏦 Исследователи «Т-Технологий» разработали новый метод обучения визуально-языковых моделей
Эксперименты показали, что при дообучении методом VL-DAC модели требуется в 1,5—2,5 раза меньше шагов для успешного выполнения задачи.

⚡️ Институт ИИ и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса
Система позволяет на ранних стадиях идентифицировать аномалии, основываясь на данных компании и внешних источниках.

🖥 Anthropic стала самой дорогой компанией в сфере ИИ, обогнав OpenAI
В результате рыночная капитализация компании достигла $965 млрд.

👱‍♂️ Великобритания с 2027 года будет использовать ИИ для выявления реального возраста беженцев
Сотрудники иммиграционной службы будут применять ИИ-систему "оценки возраста лица" для определения возраста через "просмотр фотографии лица".

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥1
ИИ не просто решил задачу 80-летней давности. Он показал математикам новый способ думать

20 мая внутренняя reasoning-модель OpenAI опровергла гипотезу, которую математик Пол Эрдёш сформулировал в 1946 году и которую 80 лет никто не мог ни доказать, ни опровергнуть. Само по себе это уже большое событие. Но интереснее то, что произошло дальше.

Математики Томас Блум, Уилл Сэвин, Карл Шилдкрат и Дмитрий Железов из Манчестерского университета взяла ключевой приём из доказательства OpenAI и немедленно опровергла уже другую гипотезу сумм-произведений для действительных чисел — о соотношении между множествами сумм и произведений элементов конечного множества. Эта гипотеза считалась верной для целых и действительных чисел одновременно и не вызывала сомнений ни у кого из специалистов.

Лауреат Филдсовской премии Тим Гауэрс и математик Мелани Вуд из Гарварда подтвердили доказательство. Вуд при этом заметила: если бы эксперты, которые разбирали ответ модели, потратили то же время на поиск контрпримера, они бы, вероятно, нашли его сами. Метод не был принципиально недоступен людям, но ИИ помог его найти.

Что-то похожее было и после победы AlphaGo над Ли Седолем в 2016 году, когда игроки в го начали копировать тактики, которые ИИ применял впервые. За несколько лет средний уровень игры в го среди людей заметно вырос. Модель не заменила игроков — она расширила их пространство возможных ходов.

Здесь происходит аналогичное. Модель не решала задачу традиционными геометрическими методами — она зашла с другого конца и применила аппарат из смежной области.


Математики увидели приём, поняли его структуру и сразу воспользовались им там, где сами не догадались бы искать.

Что именно перенесли математики?

Задача о единичном расстоянии относится к геометрии: как расставить n точек на плоскости, чтобы число пар на расстоянии равное единице было максимальным? 80 лет все предполагали, что лучшее — это квадратные решётки. Модель OpenAI нашла бесконечные семейства конфигураций.

Модель решила геометрическую задачу инструментами алгебраической теории чисел — бесконечными башнями классовых полей и теоремой Голода-Шафаревича 1964 года. Эти инструменты теоретики чисел знали хорошо. Никто не думал их применять к вопросу о точках на плоскости. Связь была неочевидна.

Именно этот приём — перенос башен классовых полей в геометрический контекст — математики взяли и немедленно применили к другой задаче.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥322👏1
💻 Самый популярный блогер мира внезапно выпустил конкурента ChatGPT

Несколько дней назад YouTube блогер Феликс Шёльберг, известный во всем мире как PewDiePie, выложил в открытый доступ новую платформу Odysseus. Он сообщил об этом своей аудитории фразой: «MY trillion $Dollar Project is finally OUT». И уже за первые 48 часов получил 30 000 звёзд на GitHub. Многие стартапы с миллионными венчурными деньгами не видят такого за целый год.

PewDiePie — это автор обзоров видеоигр и рассказчик о своих путешествиях. Но за последний год он тихо переквалифицировался: собрал свой GPU-суперкомпьютер за $20 000, дообучил собственную модель и задокументировал всё публично. Результат — не ИИ-модель и не чатбот, а полноценный ИИ-воркспейс, который работает целиком на железе частного пользователя.

Что умеет Odysseus?

Довольно многое: Chat + Agents + Deep Research + Email + Model Serving + Markdown-редактор + слепое сравнение моделей. Агенты выполняют команды в терминале, редактируют файлы, ходят в сеть. Cookbook — автоматически сканирует ваше железо и скачивает подходящие веса. Никакой телеметрии, никакой подписки, никаких данных на чужих серверах.

Три варианта запуска без покупок:

1️⃣ Бесплатно через API: подключаете OpenAI или Anthropic API-ключ и работаете в одном интерфейсе вместо пяти разных вкладок. Данные хранятся локально.
2️⃣ Локально на маке M2/M3: модели 7B–14B через Ollama работают плавно, бесплатно, всё оффлайн.
3️⃣ Полноценно на GPU (RTX 3080/4070 и выше): модели 70B+ прямо на вашем железе, ответы быстрые, полный контроль.

Самая сложная часть проекта — не кодинг

PewDiePie нужно было правильно решить, для кого это. Все существующие решения, такие как Open WebUI, LM Studio, AnythingLLM, сделаны для разработчиков.

Odysseus целится в обычного человека, чья первая реакция на Ollama обычно выражается в большом удивлении.


В итоге получилось сделать интерфейс без настройки CUDA, без ручной загрузки весов, без JSON-конфигов. Слоган на сайте тоже подкупает: «No sales team, no demo request, no Trojan horse».

Кому это вообще может быть нужно?

Например, журналисту, ведущему расследование, у которого источники и документы не должны уходить за пределы машины. Еще юрист или врач, работающий с персональными данными пациентов. Малый бизнес, где вся переписка с ИИ есть коммерческая тайна, а не обучающие данные OpenAI. Любой, кому надоело платить $20/мес за Claude, $20 за ChatGPT и ещё $20 за Gemini.

30 000 звёзд за 48 часов набрал не разработчик, а блогер, которому доверяет аудитория и который построил что-то, в чём он сам нуждался. Новая ниша выглядит именно так: не сверхмодель, а инструмент с душой, экспертизой и пониманием проблемы, которую никто рядом не решал достаточно доступно.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
32🔥2
Мо Гавдат: следующие 15 лет будут адом до рая

Один из крупнейших мировых экспертов Мо Гавдат дал интервью для Diary of a CEO с заголовком "You Only Have 3 Years Left Before It Hits".

Гавдат — бывший Chief Business Officer Google X — подразделения, где рождались Waymo, Project Loon и Wing. Он ушёл из компании в 2018 году после смерти сына Али, написал книги "Solve for Happy" и "Scary Smart", которые опередили общественную дискуссию о важности счастья человека в современном мире. Сейчас Гавдат строит AI-стартап Emma.love.

Его авторитет — не академический. Он был в команде, где принимались решения, определившие современный технологический мир. Его прогнозы — сочетание внутреннего знания и моральной позиции.

Главные идеи
из интервью

Он приводит сравнение, от которого нельзя отмахнуться: Великая депрессия уничтожила всего 6% рабочих мест за десятилетие — Гавдат же говорит о 30% сокращении к 2028 году в ряде секторов. Масштаб больше в 5 раз.

Главный механизм капитализма — арбитраж труда, и он начинает ломаться: компания всегда платит человеку меньше, чем он создаёт. Но когда ИИ выполняет задачи за цену, стремящуюся к нулю, механизм разрушается. Покупательская способность общества падает раньше, чем появляется новая занятость.

Среднего класса не будет. Гавдат утверждает: «Если вы не в топ-0.1%, вы крестьянин. Среднего класса нет. Новые рабочие места от ИИ — это 100% бессмыслица».


Главное противоречие

В майском выпуске MIT Technology Review при этом говорится, что данные пока не подтверждают волны увольнений сотрудников. Цифра в 30% — это интуитивое предупреждение, а не эконометрический прогноз. Исторически каждая технологическая революция в итоге порождала больше рабочих мест, чем уничтожала. Но вопрос в том, сколько времени занимает адаптация. Гавдат считает, что в этот раз будет недостаточно.

Это коснется всех?

Развитые страны пострадают первыми и сильнее всего. Автоматизация начинается с офисных профессий — аналитики, юристы, маркетологи, менеджеры среднего звена.

Развивающиеся страны, казалось, в безопасности: дешёвый труд был их конкурентным преимуществом. Теперь ИИ обнуляет это преимущество раньше, чем у них появится инфраструктура для переподготовки. Россия здесь не исключение: большой сектор офисных профессий уязвим не меньше, чем в развитых странах.

Что делать?

Гавдат не даёт утешительных советов, но его логика подсказывает направление:
Стать лучшим в своём деле: выживет не «хороший», а тот, кто незаменим в своём контексте.
Инвестировать в неавтоматизируемые навыки: эмпатию, лидерство, этический суд, творческое мышление.
Не ждать, пока шок придёт: у нас есть окно в три года, говорит Гавдат, 2026–2029 — самые критические годы.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥4💯2
⚔️ Начинается война SEO и GEO

В июне 2026 года произошло то, что аналитики прогнозировали лишь через год: боты впервые обогнали людей в HTTPS-трафике. По данным Cloudflare Radar, 57,5% всех обращений к страницам — это работа автоматизированных агентов, большинство из которых ИИ-системы, собирающие информацию по чьему-то запросу.

CEO Cloudflare Мэттью Принс написал: «Welp, that happened faster than I predicted».


Одновременно Ahrefs опубликовал анализ 1 млрд строк данных о том, что именно цитирует ChatGPT: 67% самых популярных источников — ресурсы с низкой частотой обновления и маркетинговые материалы (Wikipedia — 29,7%, главные страницы сайтов — 23,8%, магазины приложений — 6,6%).

Главная аномалия: 28,3% страниц, которые ChatGPT цитирует чаще всего, имеют нулевую видимость в Google. Их не видит поисковик — но видит ИИ-агент. Это изменение природы аудитории.

Два параллельных рынка видимости

SEO (Search Engine Optimization) и GEO (Generative Engine Optimization) — разные игры с разными правилами. Поисковый алгоритм оценивает граф ссылок, свежесть, глубину расположения страницы. LLM оценивает семантическую плотность, подтверждение достоверности и, главное, наличие такого источника в обучающих данных.

Поэтому страница, которая была авторитетной в 2021–2023 годах, может цитироваться ChatGPT в 2026-м, даже если Google её давно понизил в выдаче. Модель «помнит» источник по обучению. Новый контент, опубликованный вчера, для LLM без RAG-надстройки не существует вообще.

Для автора это означает то, что один и тот же материал нужно оценивать в двух системах координат одновременно.

Как повысить агентную видимость?

1⃣ ИИ-агент извлекает конкретные утверждения, цифры, определения — не сюжет.
2⃣ Формат «Топ-X» доминирует (40% самых цитируемых ChatGPT страниц), потому что из него легко извлечь дискретные факты.
3⃣ Уникальные данные и исследования, на которые ссылаются другие придают авторитет: агент доверяет источникам, которые цитируют другие авторитетные тексты.
4⃣ Присутствие в Wikipedia или ссылки из энциклопедических ресурсов — по-прежнему самый надёжный путь в обучающий корпус следующего поколения моделей.

Проблема измерения и реклама

Агент читает страницу один раз и кэширует данные. Он не возвращается, не кликает по рекламе, не генерирует повторный трафик. При этом информация из материала может «транслироваться» миллионам пользователей — через ответы ChatGPT, Perplexity, Gemini.

Прямое следствие — метрика «просмотры страницы» разрывается с реальным охватом. Традиционная аналитика не регистрирует большинство агентных посещений и не измеряет вторичное распространение через ИИ-ответы.

Инструменты нового поколения — AEO Sensor (HubSpot), Profound, GEOrank — измеряют «присутствие бренда в ответах LLM», но не источниковую атрибуцию. Пока полноценной замены для авторов нет. Рабочий подход: отслеживать рост брендированных запросов в поиске и прямого трафика. Они косвенно отражают влияние ИИ-цитирования.

Теперь о рекламных блоках в тексте. Контекстная реклама строилась на предположении, что человек прочитает материал и увидит баннер. ИИ-агент объявление не видит, не кликает и даже не передаёт пользователю. Рекламная модель, основанная на показах, теряет смысл для той части трафика, которая уже перешла 50% отметку. Новая монетизация для авторов — не рекламный инвентарь, а цитируемость: быть источником, которому доверяют агенты, и затем конвертировать «агентную известность» в прямые обращения и аудиторию.

Основные выводы

📍 Пишите для извлечения, а не для чтения: структурированные утверждения, цифры, определения в начале разделов.
📍 GEO и SEO — разные задачи: материал должен быть оптимизирован для обоих рынков, иначе он невидим для половины аудитории.
📍 Измерение охвата сломано: просмотры страниц занижают реальный охват в новой среде.
📍 Реклама по показам теряет смысл: агентная аудитория не конвертируется в клики.
📍 Авторитет в ИИ-эпоху строится иначе: через уникальные данные, ссылки от авторитетных хабов и присутствие в обучающих корпусах, а не через трафик.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2💯2
🧿 Модель мира: технология, которая станет важнее LLM

В начале июня Фей-Фей Ли опубликовала новую статью «A Functional Taxonomy of World Models», которая начинается эпиграфом из Витгенштейна: «Мир — это всё, что имеет место». И немедленно продолжает: «Мир не состоит из слов».

Этой статьей компания Ли World Labs ($1,23 млрд инвестиций от AMD, NVIDIA, Autodesk) ответила на вопрос, который постоянно заставляет ИИ-сообщество спорить: что именно мы строим в ИИ-системе, когда говорим «модель мира»?

Что такое модели мира и почему это не LLM?

В нашем канале мы постоянно следим за этой темой. Кратко напомним: языковые модели выучили статистическую структуру текста, как слова следуют друг за другом. Модели мира должны выучить статистическую структуру пространства и времени: как свет падает на поверхность, как объекты реагируют на силу, как физика работает без описания физики. Это принципиально разные подходы.

Ли предложила три функциональных класса систем, связанных с моделями мира:

1️⃣ Renderer: генерирует высококачественные визуальные представления из входных данных. Большинство того, что сейчас называется «моделями мира», — это рендеры. Ли отмечает, что системы, застрявшие на этом уровне, вообще не содержат настоящих моделей мира — это просто дорогостоящие видеогенераторы реалистичных изображений.

2️⃣ Simulator: возвращает геометрически и физически достоверные параметры состояния. Это уже не картинка, а физика объекта и процесса. Объект падает, потому что модель понимает гравитацию, а не потому что видела много видео падающих предметов.

3️⃣ Planner: агент использует симулятор для планирования последовательности действий. Мир познаётся через цикл: агент совершает действие ➡️ состояние меняется ➡️ агент наблюдает изменение ➡️ планирует следующий шаг. Это POMDP — математическая основа, которую нейробиологи и ИИ-исследователи использовали независимо друг от друга, называя разными словами.

Кто вообще занимается моделями мира и каковы инвестиции в это направление?

✔️ World Labs — $1 млрд при оценке $5,4 млрд.
✔️ AMI Labs — $1,03 млрд при оценке $3,5 млрд.
✔️ Physical Intelligence — $600 млн при оценке $5,6 млрд.
✔️ Wayve — $1,2 млрд при оценке $8,6 млрд.

За это направление идёт одна из крупнейших инвестиционных гонок в ИИ-индустрии.


Ян Лекун, основатель стартапа AMI Labs, давно утверждает: LLM никогда не дойдут до настоящего интеллекта, потому что текст не содержит физики. Его I-JEPA и V-JEPA — модели на основе самосупервизируемых предсказаний в пространстве признаков, а не пикселей. Мозг не предсказывает конкретные ощущения, он предсказывает абстрактные состояния мира. Лекун и Ли расходятся в деталях архитектуры, но сходятся в главном тезисе: физический мир нельзя выучить из текста.

Связь с нейронаукой и как это касается природы разума

Научный руководитель докторантуры Фей-Фей Ли — Кристоф Кох, нейробиолог, ближайший соратник Фрэнсиса Крика в исследованиях сознания.

Теория предиктивного кодирования утверждает: мозг постоянно строит и обновляет внутреннюю модель реальности, минимизируя разницу между предсказанным и наблюдаемым. Это ровно тот же цикл, который Ли описывает математически как POMDP.

Нейробиология и ИИ пришли к одному и тому же описанию с разных сторон — и не знали об этом, потому что говорили на разных языках.


Таксономия Ли создаёт точку пересечения:
Рендеринг ➡️ это то, как мозг генерирует «образ» реальности.
Симуляция ➡️ это предсказательная модель физических законов.
Планирование ➡️ это то, что классически называют «произвольным действием».

Почему это важнее текущей гонки LLM?

LLM масштабируются на тексте и достигают потолка там, где нужна физическая интуиция. Робот, обученный на инструкциях, не понимает, что чашка упадёт, если её толкнуть, если только не видел тысячи примеров. Модель мира понимает гравитацию как структуру, а не как паттерн.

Ли формулирует это так: языковые модели освоили концепции и рассуждения. World models — это следующий рубеж, пространственный интеллект. Пространство и время не передаётся словами.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥2
📚 Александра Элбакян: девушка, которая взломала научные журналы и добавила к ним ИИ

Александра Элбакян запустила Sci-Bot. Это ИИ-чатбот, который отвечает на вопросы, опираясь непосредственно на корпус Sci-Hub: синтезирует ответы из найденных статей, даёт кликабельные ссылки и одним кликом открывает полный текст. Без подписки, без институционального доступа, без оплаты.

Систем поиска научной литературы уже много, поэтому нужно пояснить почему это замечательная новость.

Это не просто ещё один инструмент

Например, Google Scholar — это бесплатно, широко известно, но полного текста нет, только ссылки. Или Semantic Scholar — это отличный ИИ-поиск, но только открытые публикации. PubMed — это лишь биомедицина и только про публикации с открытым доступом. Elsevier, Web of Science, Springer — здесь за деньги или через университет. Consensus, Elicit — ИИ-поиск, но по открытой литературе. Perplexity в режиме Academic — ищет по открытому вебу.

Но большинство LLM при обучении не прошли за барьеры Elsevier и Springer. Sci-Hub прошёл и накапливает архив с 2011 года, не считаясь с авторским правом. Правда, есть проблема с публикациями последних лет.

Что умеет Sci-Bot технологически?

Это RAG над корпусом Sci-Hub. Принципиальное отличие от обычного LLM: модель не генерирует ответ из выученных паттернов, она сначала ищет релевантные статьи, потом формирует ответ на основе найденного. Именно поэтому риск «галлюцинаций» здесь низкий: ответ привязан к конкретным текстам, которые можно открыть прям в системе.

Об Александре Элбакян

Sci-Hub основала Александра Элбакян в 2011 году как студентка из Казахстана, которая не могла позволить себе платить $30 за доступ к каждой научной статье. Она написала скрипт, который получал тексты через украденные институциональные логины, и выложила их в открытый доступ. За 15 лет архив вырос до более чем 88 млн документов (~100 ТБ), покрывает свыше 90% всех статей из крупных журналов до 2022 года и обслуживает почти 2,8 млн обращений в сутки при полном отсутствии рекламы, подписки и регистрации.

Элбакян намеренно отвергает термин «пиратство», называя своё детище red open access и политическим актом, а не технической услугой: «доступ к информации — право человека».


Sci-Net — следующий слой той же идеологии: не автоматический обход пейволов, а взаимопомощь живых людей. Исследователи с институциональным доступом выкладывают статьи по запросу, за что получают Sci-Hub Tokens на блокчейне Solana, а сам материал после загрузки становится вечно бесплатным для всех без регистрации.

По сути оба проекта — это вызов системе научных публикаций: коммерческие издатели Elsevier, Springer и Wiley зарабатывают миллиарды на публикации исследований, которые оплачивались государством и писались учёными бесплатно, и Элбакян принципиально не намерена с этим мириться.

Честно об ограничениях

Альфа-версия отвечает на один вопрос без продолжения беседы — диалога пока нет. Последние несколько лет исследований в базе отсутствуют — издатели ужесточили защиту от Sci-Hub. Ещё одно ограничение: отбор источников не всегда самый релевантный, бот может дать ответ, но не из оптимальных статей.

Кому нужен Sci-Bot прямо сейчас?

Для учёных из университетов с полным институциональным доступом, возможно, это не первый выбор: им важны свежие публикации, которых здесь нет. Но независимый исследователь, журналист, популяризатор науки, врач из провинциальной больницы, аспирант из страны с ограниченным университетским бюджетом — все они традиционно видят только абстракты. Sci-Bot меняет это: инструмент превращает Sci-Hub из пассивного хранилища PDF в активную систему синтеза знаний.

Как получить доступ

Бесплатно. Из России доступно напрямую, из ряда других стран через VPN, поскольку Sci-Hub продолжает работать под новыми доменами вопреки судебным решениям в нескольких юрисдикциях. Регистрации нет, платёжных данных не нужно. Параллельно у Элбакян работает Sci-Net — платформа, где можно запросить статью, отсутствующую в Sci-Hub, у учёных с институциональным доступом.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2💯2
🧪 OpenAI объявила третью фазу своего развития: от проведения исследований и разработки продуктов к превращению ИИ в массовую инфраструктуру

Сэм Альтман и главный исследователь OpenAI Якуб Пахоцки опубликовали текст Built to benefit everyone: our plan. По статусу это публичное стратегическое заявление о том, как компания видит следующий этап развития AGI.

Три фазы развития OpenAI:
➡️ Первая — исследования на пути к AGI.
➡️ Вторая началась, когда исследования стали продуктами: ChatGPT, API, корпоративные решения, обучение на реальном использовании.
➡️ Третья — сделать продвинутый ИИ «обильным», доступным, безопасным и достаточно простым, чтобы им могли пользоваться люди, компании и организации.

Поэтому корректнее говорить не о том, что «главный продукт теперь не чат-бот». ChatGPT остаётся ключевым продуктом и каналом доступа к ИИ. Но акцент смещается: OpenAI говорит уже не только о чат-боте как интерфейсе, а об ИИ как базовой инфраструктуре для экономики, науки, образования и повседневной жизни.

В тексте говорится о трех главных целя OpenAI:
1️⃣ построить автоматизированного ИИ-исследователя;
2️⃣ ускорить экономику через научный прогресс, рост производительности и новые возможности;
3️⃣ дать каждому человеку персонального AGI-помощника.

Самая важная часть — ИИ-исследователь

OpenAI пишет, что ИИ, способный делать AI research, станет определяющим фактором скорости прогресса уже в ближайшие годы. Но формулировка осторожная: речь не о машине, которая полностью заменяет исследователя, а о системе, которая ускоряет и всё больше автоматизирует исследовательский процесс, оставаясь управляемой, подотчётной и связанной с людьми. Это принципиально.

Если ИИ научится участвовать в научном цикле — читать литературу, находить ошибки, проверять гипотезы, писать код, проектировать эксперименты, сравнивать альтернативы и итеративно улучшать решения, — тогда экономический эффект будет намного глубже, чем от автоматизации офисных задач.


Наука — это верхний контур экономического роста. Новые лекарства, материалы, инженерные решения, энергетические технологии, биотехнологии и промышленные процессы появляются из исследовательского цикла. Ускорение науки означает ускорение будущей экономики.

Экспертная реакция сдержанная

The Decoder отмечает, что OpenAI фактически отходит от риторики полной автономии и подчёркивает связку человека и машины. Business Insider делает акцент на переходе компании к «третьей фазе» — массовой доступности и практической полезности ИИ. Reuters в параллельном материале об Anthropic показывает более широкий контекст: ведущие лаборатории всё чаще обсуждают не только ускорение, но и необходимость координации, контроля и даже возможного замедления фронтирных разработок при росте рисков.

Насколько мы далеко от автономного ИИ-исследователя?

Мы уже близко подошли к сильному исследовательскому ИИ-ассистенту и видим первое поколение исследовательских агентов, но мы крайне далеко от автономного учёного «под ключ».

Современные системы уже умеют делать обзоры литературы, писать код, анализировать данные, помогать в генерации гипотез. Но полноценный автономный исследователь должен отличать красивую гипотезу от воспроизводимого открытия, понимать ограничения данных, проверять собственные ошибки и не терять научную цель в многошаговом процессе.

Поэтому горизонт 2028 года выглядит правдоподобно для внутреннего ускорения сильных исследовательских команд в OpenAI и других frontier-лабораториях. Но массовый автономный ИИ-исследователь, которому можно безопасно поручить научную задачу от постановки до результата, скорее всего, потребует больше времени.

Главная новость здесь не в том, что OpenAI обещает очередной продукт. Главная новость в другом: крупнейшая ИИ-компания прямо называет автоматизацию научного исследования одним из центральных механизмов будущего экономического роста. Если эта ставка сработает, ИИ будет ускорять экономику не только через замену отдельных операций, а через ускорение появления новых знаний.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
22🔥2
📖 Переворот в рецензируемой науке

В начале июня на arXiv появилась статья двух физиков, которые в разделе о методологии добавили фразу, которую раньше никто не писал в рецензируемой науке: «Доказательство было получено в результате взаимодействия с Claude (Sonnet 4.6 и Opus 4.7) и проверено нами».

Один из авторов — Джорджо Паризи, лауреат Нобелевской премии по физике 2021 года за открытие взаимодействия беспорядка и флуктуаций в физических системах от атомного до планетарного масштаба. Его соавтор — Франческо Дзампони.

Что именно доказали?

В рамках теории полного нарушения симметрии реплик (fullRSB) для плотных твёрдых сфер в бесконечном измерении Паризи с коллегами ещё в 2014 году ввели три критических показателя abc, описывающих переход к джаммингу. Первое соотношение b=(1+c)/2 было доказано аналитически. Второе — a+b=1 — численно проверено с произвольной точностью, но аналитически не доказывалось 12 лет. 

За 40 раундов диалога Claude вернулся к теоретическому фреймворку, который создал сам Паризи, и заполнил недостающий элемент доказательства. Физики проверили результат вручную и подтвердили корректность. 

Ирония ситуации в том, что уравнение a+b=1 относится именно к теории, за которую Паризи получил Нобелевскую премию.


Другие случаи, когда ИИ вышел за рамки просто помощника

1⃣ AlphaFold и Нобелевская премия по химии 2024 года. 
Дэвид Бейкер из Вашингтонского университета, Демис Хассабис и Джон Джампер из Google DeepMind получили Нобелевскую премию по химии именно за ИИ-системы предсказания структуры белков. Это первый случай, когда Нобелевский комитет напрямую наградил разработчиков ИИ-инструмента, а не учёных, которые его использовали.

2⃣ OpenAI и задача об единичном расстоянии 2026 года. 
Внутренняя модель OpenAI опровергла 80-летнюю гипотезу, применив метод из алгебраической теории чисел — башни классовых полей — к геометрической задаче, где никто не ожидал такой связи. Результат верифицировали лауреат Филдсовской премии Тим Гауэрс и Мелани Вуд из Гарварда. Группа математиков немедленно применила тот же метод и опровергла гипотезу сумм-произведений. Томас Блум написал: «Это превосходит самые смелые мои ожидания».

3⃣ Co-Scientist от Google DeepMind 2026 года. 
Мультиагентная система независимо предложила механизм поведения cf-PICIs в антимикробной резистентности — тот же, который исследовательская группа только что открыла сама, но не успела опубликовать. Система не была знакома с неопубликованными данными, она вывела механизм из публичной литературы.

Почему это меняет норму?

В случае Паризи ключевое не то, что Claude «помог». Ключевое — что слово «помог» уже недостаточно точно. Нобелевский лауреат написал, что доказательство было получено через взаимодействие с Claude, и поставил модель в методологическом разделе рядом с «проверено нами». Это не сноска и не acknowledgment — это описание механизма получения результата.

Для учёных вывод практический: ИИ сейчас работает лучше всего не как автор, пишущий за человека, а как «суперколлега», способный удерживать в рабочей памяти весь корпус литературы по области, предлагать нестандартные переносы методов из смежных дисциплин и работать в режиме структурированного диалога с верификацией на каждом шаге. Именно так работал Паризи: 40 раундов, каждый с проверкой результата.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2🔥2👎1💯1
🧠 ИИ – это источник нового взгляда на старые проблемы ученых и топ-менеджеров

Большинство ИИ систем, которые применяют ученые в науке и топ-менеджеры в бизнесе, делают одно из двух: либо извлекают что-то из неструктурированной базы знаний, либо перебирают и перепроверяют варианты в заданном пространстве. Это полезно и очень быстро. Но это не позволит сделать открытие или эвристический ход.

Чтобы немного разобраться в этом, обращаем внимание на новый препринт MIT, который проводит чёткую линию между тремя вещами:

➡️ Извлечение — найти что-то в базе.
➡️ Поиск — исследовать известное пространство в поисках нового.
➡️ Открытие — распознать, что само пространство нужно изменить.

Маркус Бюлер из MIT с коллегой Фионой Ван сформулировали это в форме математического фреймворка:
Научное открытие требует, чтобы пространство поиска само менялось, и ИИ-учёный должен инициировать этот сдвиг без вмешательства извне.


Бюлер — пионер AI for science, его лаборатория в MIT специализируется на мультиагентных системах, которые превращают разнородные данные в научные инсайты. Его новая работа переносит эту логику на уровень метода: не «найди ответ», а «обнаружь, в каком пространстве искать».
 
В чем суть?

В качестве примера авторы разработали подход к агентному открытию в материаловедении. В основном режиме система работает внутри заданной схемы. Но для открытия инициируется переход системы в другой режим: полученные новые данные постоянно сравниваются с исходным состоянием для выявления реальной новизны.

Ключевой механизм кроется в «типизированных артефактах»: каждый фрагмент информации несёт метаданные о том, что это за объект и откуда он взялся. Это отслеживание происхождения позволяет системе проверять собственную цепочку рассуждений и точно определять, дает ли её текущий подход сбой или порождает открытие.

Почему это важно для менеджера, а не только для учёного?

Различие «поиск / открытие» описывает не только проблему ИИ — оно описывает разницу между оптимизацией существующего бизнеса и созданием нового.

Большинство ИИ-инструментов, внедряемых в организациях сегодня, работают в режиме поиска: они оптимизируют процессы внутри заданной схемы. Это быстрее, дешевле, точнее. Но прорывные проекты случаются тогда, когда кто-то понимает, что старая схема устарела и нужна другая карта реальности.

Amazon не «искал» лучший способ доставлять книги, он понял, что сама новая логистика — это уже новый бизнес. Netflix не «оптимизировал» прокат DVD — он сменил носитель. Pixar не «улучшил» традиционную анимацию — он изменил инструмент и язык описания пространства.

Фреймворк Бюлера даёт этому явлению математическую форму: момент, когда «карта» устарела, не очевиден изнутри системы. Нужен механизм верификации — проверяемый граф данных, гипотез, провалов и принятых моделей, — который позволяет отличить «мы ищем не там» от «мы ищем не то».

Для менеджера прорывных проектов это означает конкретный вопрос при любом застревании команды: мы застряли потому, что не перебрали достаточно вариантов — или потому, что работаем с устаревшей картой проблемы? Это разные диагнозы и разные способы преодоления.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥2
🖥 Опенсорс как страховка от произвола БигТеха

Неделю назад правительство США впервые в истории приказало Anthropic отключить Fable и Mythos для всех неграждан США. Компания не смогла технически разделить пользователей и закрыла доступ для всего мира. Прецедент создан, и теперь если паттерн повторится для Sonnet или Opus, неамериканские пользователи Claude Code могут мгновенно остаться без инструмента.

На этом фоне три новые открытые модели выглядят как альтернатива или страховка:

1⃣ MiniMax M3: 428 млрд параметров, активных 23 млрд, 1 млн токенов контекста. Главная инновация — это MiniMax Sparse Attention, что дает экономию в 20 раз по вычислениям на больших контекстах, чем это было у предыдущего поколения.

3⃣ Kimi K2.7 Code: 1 трлн параметров, 32 млрд активных, 256 тыс. токенов контекста. Модель от Moonshot AI, реально открытые веса на HuggingFace под лицензией Modified MIT. Тратит на ~30% меньше токенов на размышление, чем у предыдущей версии K2.6.

3⃣ MiMo Code: форк популярного open-source агента OpenCode с собственной моделью MiMo-V2.5-Pro на 1 трлн параметров, временно бесплатной через анонимный режим без настройки. Поддерживает долговременную память проекта, голосовой ввод, совместим с навыками и командами Claude Code.

Что значит «открытые веса» на самом деле?

«Открытые веса» — это файлы с обученными параметрами модели, которые можно скачать и запустить на своём оборудовании без участия компании-разработчика.


Оговорка — для топовых моделей из этой тройки «своё оборудование» означает не домашний компьютер. По тестам независимых обзорщиков, 256-гигабайтный Mac способен запустить ужатую версию с заметной потерей качества, а для практичной интерактивной работы нужны минимум 8 видеокарт уровня H100. Это серверный кластер ценой в десятки тысяч долларов.

Открытые веса дают возможность кому-то развернуть модель и предложить доступ другим. Для обычного человека открытые веса практически означают «появился дешёвый облачный API», а не «можно запустить на ноутбуке».

Что реально доступно прямо сейчас?

Облачный API через агрегаторы вроде OpenRouter — это самый реалистичный путь. MiniMax M3 на старте стоила $0,30 за миллион токенов на входе и $1,20 на выходе. Kimi K2.7 Code — $0,95/$4,00 за миллион токенов. Для сравнения, Claude Sonnet 4.6 стоит $3/$15 за миллион токенов.

MiMo Code — самый простой вариант для старта: команда curl -fsSL https://mimo.xiaomi.com/install | bash ставит инструмент, режим MiMo Auto работает бесплатно и без настройки.

Что говорят бенчмарки?

Здесь данные расходятся в зависимости от того, кто их публикует. MiniMax сама заявляет 59% на SWE-Bench Pro — это ниже, чем у Opus 4.8, но некоторые независимые агрегаторы дают MiniMax M3 80,5% на SWE-bench Verified против 72,7% у Sonnet 4.6. Разброс в 17–21 пункт между разными методиками тестирования — это норма: модель показывает разные результаты в разных обвязках.

Kimi K2.7 по независимому обзору Flowtivity достигла 60,4% на SWE-bench Verified — новый максимум среди открытых моделей, и обогнала Opus 4.8 по точности вызова инструментов через MCP.

Отдельное исследование Kili Technology показало: между лабораторными бенчмарками и реальной работой агентов разрыв в среднем составляет 37%.


Удобство и реальные отзывы

Взгляд независимого теста VentureBeat особенно интересен. Одну и ту же модель MiMo-V2.5-Pro прогнали через два разных движка: фирменный MiMo Code и Claude Code. MiMo Code показал 62% на SWE-bench Pro против 57% у Claude Code. Разница пришла не от модели, а исключительно от того, как агент организует работу. На задачах длиной более 200 шагов MiMo Code, по заявлению Xiaomi, не входит в "петли галлюцинаций", в которые попадает Claude Code.

Вывод

Реалистичный сценарий для нетехнического пользователя — подключить дешёвый API через OpenRouter или поставить MiMo Code и пользоваться бесплатным режимом. Это не равноценная замена Claude Code по качеству на сложных задачах, но это работающая страховка на случай, если завтра доступ к Claude станет недоступен без американского паспорта.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
💥 Зачем выбирать между Claude, GPT, Gemini и DeepSeek, если можно использовать все сразу?

У каждой frontier-модели есть сильные и слабые стороны, и это давно не секрет. Например, некоторые считают, что Claude лучше рассуждает и следует инструкциям, а GPT-5.x сильнее в аналитике данных. При этом мы и сами заметили, что Gemini опережает в работе с длинными документами и поиском в сети. DeepSeek и Kimi неожиданно сильны в математике и стоят в разы дешевле.

Возникает логичный вопрос: а нельзя ли задать вопрос всем сразу и выбрать лучший ответ?

Можно. OpenRouter превратил эту идею в продукт — Fusion API. Система прогоняет запрос через 3–5 моделей одновременно. Пользователь может выбрать преднастроенный вариант Quality или Budget, и модели-участники будут работать параллельно. Также в панели включён web search, то есть каждая модель может найти актуальные данные перед ответом.

Стадии обработки запроса:
1️⃣ Ваш запрос поступает в Опенроутер ▶️ 2️⃣ несколько (от 1 до 8) моделей параллельно исполняют его, также происходит поиск в сети ▶️ 3️⃣ "судья" сравнивает все ответы ▶️ 4️⃣ финальная модель пишет итоговый текст.

Самое интересное — шаг судьи

Судья не просто выбирает лучший ответ. Судья возвращает структурированный JSON с пятью разделами:
➡️ consensus — в чём все модели согласны
➡️ contradictions — где прямо противоречат друг другу
➡️ partial coverage — что одна модель затронула, другая нет
➡️ unique insights — что нашла только одна модель
➡️ blind spots — что никто не заметил

Это уже не выбор победителя, а карта разногласий.

Реальные цифры

OpenRouter тестировал Fusion на бенчмарке DRACO: 100 задач глубокого исследования, разработан Perplexity. Панель Fable 5 + GPT-5.5 с судьёй Opus 4.8 смогла набрала 69,0%. Это выше, чем Fable 5 в одиночку — 65,3%. Бюджетная панель из Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro достигла 64,7% при вдвое меньшей стоимости.

Окупается ли?

Платить нужно за вызов каждой модели в панели плюс вызов судьи. Вариант "Quality" стоит больше чем в 3 раза дороже одного вызова модели Opus 4.8. Но качество превзойдет пока недоступный Fable 5. Если задача требует глубокого анализа, и ошибка обойдётся дорого, то это подходящий вариант.

Если нужен быстрый ответ на простой вопрос — один дешёвый Claude Haiku будет в сотни раз дешевле и достаточен. OpenRouter сам признаёт: Fusion не подходит для realtime-взаимодействий и задач, где важна скорость ответа — параллельный запуск нескольких моделей увеличивает задержку ответа пропорционально.

Можно ли собрать судью самостоятельно?

Технически — да, и это не очень сложно. Основа будет, например, на Python с несколькими API-ключами. Логика такая: один и тот же запрос отправляется параллельно к Claude, GPT и Gemini. Далее все три ответа собираются, формируется мета-промпт:
Вот три ответа на один вопрос. Определи: в чём они согласны, где противоречат, что каждый упустил, выбери лучшие элементы и синтезируй финальный ответ. 

Такой запрос отправляется судье — любой достаточно умной модели.

Это паттерн, давно известный как «mixture of agents» в академической литературе. Идея существует давно, но упаковать её в продуктовый API, чтобы вызывать так же, как любую одну модель - это то, что делает Fusion практически полезным.

Что OpenRouter добавляет сверх самодельной сборки: удобство, web поиск в каждой модели, пресеты из проверенных комбинаций и прозрачность логов. Сколько это стоит? 5.5% сверх стоимости всех вызовов.


Когда имеет смысл, когда нет?

Fusion работает хорошо там, где у моделей разные слепые зоны: юридический анализ, медицинское исследование, стратегические решения, глубокий фактчекинг. Модели галлюцинируют по-разному и ансамбль снижает вероятность того, что ни одна не поймала ошибку.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2💯2