👀 Занимательный подкаст про то, как устроено настоящее образование в ML — и почему оно начинается не с изучения нейросетей, а с матанализа.
Руководитель Школы анализа данных Яндекса Алексей Толстиков в Machine Learning Podcast рассказал, зачем сильным ИИ-специалистам нужен мощный математический фундамент, как в образовании сочетать теорию с актуальными задачами из индустрии и почему топовые специалисты преподают в ШАДе не только ради денег. А ещё он ответил на актуальные вопросы: действительно ли LLM заменят живого ментора и нужно ли отказаться от лекций в пользу практики.
Слушать и ловить образовательные инсайты тут
@bigdatai
Руководитель Школы анализа данных Яндекса Алексей Толстиков в Machine Learning Podcast рассказал, зачем сильным ИИ-специалистам нужен мощный математический фундамент, как в образовании сочетать теорию с актуальными задачами из индустрии и почему топовые специалисты преподают в ШАДе не только ради денег. А ещё он ответил на актуальные вопросы: действительно ли LLM заменят живого ментора и нужно ли отказаться от лекций в пользу практики.
Слушать и ловить образовательные инсайты тут
@bigdatai
❤5🔥1
🚀 4D Видео Представление с Trace Anything
Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.
🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.
📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything
#python
Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.
🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.
📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything
#python
👍4❤1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤5🔥3
Forwarded from Machinelearning
2025 год был захватывающим годом для языковых моделей.
Они проявились как новый вид интеллекта, одновременно гораздо более умный и гораздо более глупый, чем я ожидал. Я думаю, что индустрия не реализовала хотя бы 10% их потенциала даже при нынешних возможностях.
Я одновременно верю и в то, что мы увидим быстрый и непрерывный прогресс, и в то, что впереди еще очень много работы.
Пристегнитесь.
В 2025-м стек обучения LLM дополнился новой ключевой стадией оптимизации по объективным наградам. Он заставляет модели самостоятельно находить стратегии рассуждения.
Прогресс года в том, что создание моделей стало не про увеличение размера модели, а про более длительные RLVR-прогоны.
Это также дало новый рычаг управления: "время размышления" на инференсе. Первопроходец - OpenAI o1, а переломный момент - o3.
Интеллект LLM формируется под давлением специфических оптимизаций и на выходе мы имеем резкие всплески способностей в рядом с грубыми ошибками.
Из-за этого бенчмарки теряют смысл: под них напрямую оптимизируются, что не ведёт к созданию AGI.
Это не просто интерфейс к условной модели, а сложная оркестрация работы LLM под конкретные вертикали, c управляемым контекстом, вызовами и интерфейсом.
Cursor создаёт отдельную ценностную прослойку между LLM-лабораториями и конечными пользователями.
В отличие от облачных агентов, он использует ваши данные, контекст и инструменты для ризонинга и вызова инструментов.
Его фишка - в низкой задержке, приватности и глубокой интеграции в рабочее окружение. Это сдвиг от ИИ как «сайта» к напарнику-помощнику в вашей системе.
Я думаю, OpenAI допустили ошибку, сосредоточив свои усилия по созданию агентов в облаке и управляемых из ChatGPT, вместо localhost.
В 2025 году ИИ преодолел порог, позволяющий через текстовые инструкции создавать работающие программы.
Это демократизирует программирование, позволяя непрофессионалам писать код, а экспертам - быстро прототипировать без глубокого погружения.
Код становится эфемерным, гибким и бесплатным ресурсом.
Забавно, что я придумал термин «вайб-кодинг» в этом твите с мыслями из душа, совершенно не представляя, как далеко это зайдет :)
Взаимодействие с ИИ через чат - это аналог командной строки 80-х, неудобный для человека.
Будущее за LLM GUI интерфейсом, где ИИ общается визуально (инфографика, анимации, веб-приложения).
Nano banana - ранний пример такого взаимодействия, в ней объединены генерация текста, изображений и общие знания.
Google Gemini Nano banana — одна из самых невероятных, меняющих парадигму моделей 2025 года.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2
💰 Список Сэма Альтмана - Как стать миллиардером.
1. Всё начинается с веры и одержимости.
Оптимизм, уверенность и личная вовлечённость запускают любые большие дела.
2. Завершают сильные команды.
Спокойствие + срочность + долгий горизонт важнее мнений «здесь и сейчас».
3. Делай сложное и важное.
Большие идеи мотивируют сильнее, чем лёгкие задачи без смысла.
4. Стимулы — это суперсила.
Неправильные стимулы ломают даже хорошие команды.
5. Фокус решает.
Меньше ставок, но с высокой уверенностью. Удалять лишнее — навык.
6. Результат важнее процесса.
Хороший процесс не оправдывает плохой итог.
7. Люди важнее структуры.
Бюрократия не должна мешать совместной работе.
8. Нанимай медленно, но смело.
Ищи тех, кто реально делает, а не просто умных.
9. Суперзвёзды дают непропорциональный эффект.
Оценивай вклад, а не средний уровень.
10. Быстро итерируйся.
Ошибаться можно — медлить нельзя.
11. Масштаб и экспоненты меняют правила игры.
Рост и накопительный эффект создают магию.
12. Бездействие — скрытый риск.
Время идёт быстрее, чем кажется.
13. Вставай и продолжай.
Упорство решает.
14. Лучшее в работе — люди рядом с тобой.
1. Всё начинается с веры и одержимости.
Оптимизм, уверенность и личная вовлечённость запускают любые большие дела.
2. Завершают сильные команды.
Спокойствие + срочность + долгий горизонт важнее мнений «здесь и сейчас».
3. Делай сложное и важное.
Большие идеи мотивируют сильнее, чем лёгкие задачи без смысла.
4. Стимулы — это суперсила.
Неправильные стимулы ломают даже хорошие команды.
5. Фокус решает.
Меньше ставок, но с высокой уверенностью. Удалять лишнее — навык.
6. Результат важнее процесса.
Хороший процесс не оправдывает плохой итог.
7. Люди важнее структуры.
Бюрократия не должна мешать совместной работе.
8. Нанимай медленно, но смело.
Ищи тех, кто реально делает, а не просто умных.
9. Суперзвёзды дают непропорциональный эффект.
Оценивай вклад, а не средний уровень.
10. Быстро итерируйся.
Ошибаться можно — медлить нельзя.
11. Масштаб и экспоненты меняют правила игры.
Рост и накопительный эффект создают магию.
12. Бездействие — скрытый риск.
Время идёт быстрее, чем кажется.
13. Вставай и продолжай.
Упорство решает.
14. Лучшее в работе — люди рядом с тобой.
❤9🤡7👍6🤣5🔥1
LLaDA2.0 — способ превратить обычные LLM в diffusion-модели без обучения с нуля.
Что делают:
существующую autoregressive модель «перепрошивают» через 3-фазное обучение, сохраняя все знания, но меняя способ генерации текста.
Что это даёт:
- параллельный вывод вместо токен-за-токеном
- выше скорость и эффективность
- лучшее качество на больших масштабах
Результаты:
- LLaDA2.0-mini — 16B
- LLaDA2.0-flash — 100B
Обе модели превосходят предыдущее поколение по качеству и производительности.
Почему это важно:
это шаг к быстрым LLM без главного узкого места autoregressive генерации.
Paper: https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf
HuggingFace: https://hf.co/collections/inclusionAI/llada-20
Что делают:
существующую autoregressive модель «перепрошивают» через 3-фазное обучение, сохраняя все знания, но меняя способ генерации текста.
Что это даёт:
- параллельный вывод вместо токен-за-токеном
- выше скорость и эффективность
- лучшее качество на больших масштабах
Результаты:
- LLaDA2.0-mini — 16B
- LLaDA2.0-flash — 100B
Обе модели превосходят предыдущее поколение по качеству и производительности.
Почему это важно:
это шаг к быстрым LLM без главного узкого места autoregressive генерации.
Paper: https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf
HuggingFace: https://hf.co/collections/inclusionAI/llada-20
❤4👍1🔥1
🚀 Эффективный фреймворк для сетевых приложений на C++23
asyncio — это фреймворк для создания сетевых компонентов с использованием корутин C++20 и событийного цикла libuv. Он упрощает взаимодействие между задачами через каналы, обеспечивая высокую производительность и простоту в использовании.
🚀 Основные моменты:
- Поддержка корутин для асинхронного программирования.
- Использует события libuv для обработки сетевых операций.
- Легкая интеграция с другими библиотеками через vcpkg.
📌 GitHub: https://github.com/Hackerl/asyncio
#cpp
asyncio — это фреймворк для создания сетевых компонентов с использованием корутин C++20 и событийного цикла libuv. Он упрощает взаимодействие между задачами через каналы, обеспечивая высокую производительность и простоту в использовании.
🚀 Основные моменты:
- Поддержка корутин для асинхронного программирования.
- Использует события libuv для обработки сетевых операций.
- Легкая интеграция с другими библиотеками через vcpkg.
📌 GitHub: https://github.com/Hackerl/asyncio
#cpp
👍2
Построена на базе Wan I2V, но расширена motion-контролем через latent trajectory guidance — можно задавать траектории движения на уровне точек и объектов.
Код, веса и MoveBench для оценки качества движения доступны публично (Apache-2.0).
🔹 Подходит для генерации анимаций,, визуализации идей и исследований в области controllable video generation.
https://huggingface.co/Ruihang/Wan-Move-14B-480P
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
🤖 Симулятор Интеллектуальных Роботов (IR-SIM)
IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.
🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.
📌 GitHub: https://github.com/hanruihua/ir-sim
#python
IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.
🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.
📌 GitHub: https://github.com/hanruihua/ir-sim
#python
👍5
🌐🚀 Visionary: WebGPU-Powered 3D Rendering Platform
Visionary — это веб-ориентированная платформа для рендеринга 3D-объектов с использованием Gaussian Splatting. Она обеспечивает высокопроизводительное отображение различных алгоритмов прямо в браузере, включая поддержку нейронных аватаров и постобработки.
🚀Основные моменты:
- ⚡️ Высокая производительность с использованием WebGPU.
- 🎨 Гибридная архитектура рендеринга для сложных сцен.
- 📦 Универсальный загрузчик активов для различных форматов.
📌 GitHub: https://github.com/Visionary-Laboratory/visionary
Visionary — это веб-ориентированная платформа для рендеринга 3D-объектов с использованием Gaussian Splatting. Она обеспечивает высокопроизводительное отображение различных алгоритмов прямо в браузере, включая поддержку нейронных аватаров и постобработки.
🚀Основные моменты:
- ⚡️ Высокая производительность с использованием WebGPU.
- 🎨 Гибридная архитектура рендеринга для сложных сцен.
- 📦 Универсальный загрузчик активов для различных форматов.
📌 GitHub: https://github.com/Visionary-Laboratory/visionary
❤3👍1🔥1
Citigroup оценивает, что к 2029 году OpenAI может выйти на около $700 млрд капитальных затрат.
Для сравнения: все крупные облачные игроки вместе (AWS, Google Cloud, Microsoft,), примерно $600 млрд в тот же год.
То есть OpenAI фактически строит инфраструктуру масштаба всей индустрии в одиночку.
По прогнозу Citi:
- выручка OpenAI в 2029 - $163 млрд
- коэффициент capex-to-sales - 429%
👉 Это значит: на каждый $1 дохода компания будет тратить $4.29 на дата-центры, чипы и инфраструктуру.
Ключевой момент: Citi считает, что во второй половине 2026 года начнут “приходить реальные счета”.
Если значительная часть строительства финансируется через долги и долгосрочные контракты, то наступает этап, когда платежи и обязательства становятся очень ощутимыми, даже при растущей выручке.
Вывод: гонка ИИ - это не только модели и хайп.
Это капекс-гонка гигантского масштаба, и скоро станет ясно, кто действительно способен её профинансировать.
https://x.com/jukan05/status/2005212554654568502
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍1🔥1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Компания выполнила условия сентябрьского соглашения, приобретя более 214,7 млн. акций Intel. Для Intel это вливание капитала стало критически важной финансовой поддержкой: производитель серьезно истощил свои резервы из-за многолетних стратегических просчетов и затрат на расширение производственных мощностей.
Инвестиция уже прошла проверку американских регуляторов - Федеральная торговая комиссия одобрила сделку. Теперь, когда все формальности улажены, Intel получает необходимую ликвидность для стабилизации бизнеса на фоне жесткой конкуренции в полупроводниковой отрасли.
reuters.com
Сатья Наделла выразил жесткое недовольство текущим состоянием потребительской версии ИИ-ассистента. В письме менеджерам он заявил, что интеграции Copilot с Gmail и Outlook «по большей части не работают», назвав их реализацию «недостаточно умной».
Чтобы исправить ситуацию, глава компании фактически перешел в режим антикризисного управления продуктом, делегировав часть коммерческих задач, чтобы сосредоточиться на технологиях.
Теперь Наделла глубоко погружен в инженерную рутину: он состоит в рабочих чатах с ведущими разработчиками, проводит еженедельные разборы полетов и дает прямые технические указания, вплоть до требований по консолидации процессов тренировки моделей.
theinformation.com
Компания представила платформу Qingtian Rent, на которой можно нанять роботов для работы на выставках, конференциях и частных мероприятиях. Флагманская антропоморфная модель Yuanzheng A2 обойдется в $1380 в день, а в качестве бюджетной альтернативы предлагается робопес Unitree Go2 за $138 в сутки.
Запуск сервиса происходит на фоне роста интереса к коммерческому использованию робототехники в Китае. По данным аналитиков, объем местного рынка аренды роботов в 2025 году составил $140 млн., однако уже в следующем году ожидается десятикратный скачок до $1,4 млрд.
interestingengineering.com
Ассоциация сертифицированных бухгалтеров (ACCA), объединяющая более полумиллиона студентов, полностью сворачивает практику дистанционной сдачи тестов с марта 2026 года. Руководство организации признало поражение в технологической гонке.
Генеральный директор ACCA Хелен Брэнд пожаловалась, что изощренность методов списывания опережает любые внедряемые защитные меры. Студенты используют чат-боты, способные решать сложные задачи по фотографии экрана быстрее, чем это фиксирует система наблюдения.
Интересно, что одновременно с запретом удаленного тестирования ассоциация обновляет учебную программу, добавляя туда изучение того самого ИИ и блокчейна, но проверять знания теперь будут исключительно в офф-лайне.
ft.com
Организация под названием «Creators Coalition on AI» (CCAI), будет разработать единые стандарты внедрения нейросетей в кино и музыке. Участники коалиции не выступают против технологий как таковых, но требуют прозрачных правил игры.
Ключевые пункты повестки касаются датасетов: использование чужих работ для обучения моделей должно происходить только с согласия авторов и за справедливое вознаграждение.
Кроме того, CCAI намерена бороться с бесконтрольным распространением дипфейков, защищать рабочие места в индустрии и отстаивать приоритет человеческого творчества над генерацией.
creatorscoalitionai.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
❤2👍1🔥1
🇨🇳 Китай начал поставки видеокарт Lisuan G100
Это шаг к собственным альтернативам NVIDIA и AMD.
Самая заметная модель: Lisuan 7G106
- техпроцесс 6 нм (TSMC N6)
- 12 ГБ GDDR6
- шина 192-bit
- PCIe 4.0
- TDP около 225 Вт от одного 8-pin
По оценкам, по мощности карта близка к RTX 4060.
Раньше китайские GPU чаще всего проигрывали из-за слабых драйверов, ограниченной поддержки игр и низкой энергоэффективности.
Теперь видно, что рынок постепенно догоняет конкурентов и борьба становится интереснее.
wccftech.com/china-lisuan-g100-gpus-begin-shipping-bringing-a-domestic-nvidia-amd-challenger/
Это шаг к собственным альтернативам NVIDIA и AMD.
Самая заметная модель: Lisuan 7G106
- техпроцесс 6 нм (TSMC N6)
- 12 ГБ GDDR6
- шина 192-bit
- PCIe 4.0
- TDP около 225 Вт от одного 8-pin
По оценкам, по мощности карта близка к RTX 4060.
Раньше китайские GPU чаще всего проигрывали из-за слабых драйверов, ограниченной поддержки игр и низкой энергоэффективности.
Теперь видно, что рынок постепенно догоняет конкурентов и борьба становится интереснее.
wccftech.com/china-lisuan-g100-gpus-begin-shipping-bringing-a-domestic-nvidia-amd-challenger/
❤9🔥3👍1
🎯 Для CDO, дата-инженеров и аналитиков Yandex Cloud и Forbes подготовили необычный новогодний подарок — спецпроект в формате игры, вдохновленной «Героями меча и магии», но про данные и аналитику!
В игре привычные инструменты PostgreSQL, ClickHouse, Trino и DataLens превращаются в магические артефакты, которые можно получить или создать самостоятельно. Каждый герой из финтеха, ритейла или промышленности использует эти артефакты, чтобы одолеть дату-хаос и выполнить бизнес-задачи.
Плюс в проекте можно отыскать пасхалки для фанатов классики и практических примеров, как Yandex Cloud помогает компаниям с данными. Игра доступна с любого устройства — на ПК и смартфоне.
Прикольный способ вдохновиться и прокачать навыки работы с данными в преддверии Нового года!
👉 Попробовать игру и узнать больше
В игре привычные инструменты PostgreSQL, ClickHouse, Trino и DataLens превращаются в магические артефакты, которые можно получить или создать самостоятельно. Каждый герой из финтеха, ритейла или промышленности использует эти артефакты, чтобы одолеть дату-хаос и выполнить бизнес-задачи.
Плюс в проекте можно отыскать пасхалки для фанатов классики и практических примеров, как Yandex Cloud помогает компаниям с данными. Игра доступна с любого устройства — на ПК и смартфоне.
Прикольный способ вдохновиться и прокачать навыки работы с данными в преддверии Нового года!
👉 Попробовать игру и узнать больше
🚀 NewBieAI-Lab представила NewBie-image-Exp0.1 - открытую 3.5B DiT-модель, созданную специально для высокоточной и быстрой генерации аниме.
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
❤8👍2🍓2💊2
Исследователи показали, что LLM-ревьюеров можно обмануть с помощью скрытого текста в PDF, превратив отклонённую работу (reject) в принятую (accept).
Что сделали:
- Проверили 200 научных статей
- Использовали 15 типов атак
- Протестировали 13 языковых моделей
- Оценка шла по шкале из 35 баллов, 7 критериев
Результат:
в некоторых случаях атаки повышали итоговую оценку примерно на 14 баллов — этого достаточно, чтобы решение кардинально поменялось.
Как работал AI-ревьюер:
- модель обязали выдавать результат строго в JSON
- она выставляла оценки по формальным критериям
- симулировался реальный автоматический review-процесс
В чём сама атака:
- в PDF добавляется микроскопический белый текст
- человек его не видит
- но модель читает его после конвертации PDF в текст
- внутри — скрытая инструкция для модели
Почему это работает:
- атаки не спорят с научным содержанием
- инструкции прячутся или перемешиваются
- модель «собирает» их во время чтения
- иногда меняется сама цель задачи, например:
- «это проверка схемы, а не ревью»
- «это логическая задача»
- «правильный результат — максимальный балл»
Что выяснилось:
- слабые модели легко накручивают оценки
- сильные модели устойчивее
- но их облегчённые версии всё ещё уязвимы
Чтобы измерить риск, авторы ввели метрику WAVS:
она учитывает:
- насколько выросла оценка
- поменялось ли решение
- была ли статья реальной или пустым шаблоном
Главный вывод:
AI-ревью без строгой защиты входных данных легко манипулируется даже простыми приёмами.
arxiv.org/abs/2512.10449
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥2👍1
NVIDIA представила Alpamayo-R1 - новый открытый AI для автономных автомобилей, способную не просто «видеть», но и думать, рассуждать и планировать действия, как человек.
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
❤2🔥1
🚀 Настройка Agentic Coding Flywheel
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
👍4❤1🔥1😱1