MWS AI
7.67K subscribers
978 photos
151 videos
544 links
Мы разрабатываем решения и продукты на базе технологий NLP, CV и Gen AI. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
Download Telegram
В 2026 передаём рутину ИИ-агентам 🤩

А наше драгоценное время оставляем на приятные встречи, достижение новых вершин и работу, которая поистине приносит удовольствие!

С Новым Годом!
Ваша команда MWS AI
🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
1675🏆22
Т-с-с… это январские 🤫

Редкое время тишины: рабочие чаты стоят на мьюте, а дедлайны исчезли магическим образом.

Тот самый момент, когда хочется включить фильм или сериал, который не перегружает, а оставляет приятное послевкусие.

Собрали подборку таких киношедевров вместе с командой MWS AI — микс обязательной классики и не совсем очевидных хитов.

Сохраняйте, смотрите и наслаждайтесь отдыхом ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
14👀632
👂🦻 Начинаем год с подкаста MWS AI

В этом выпуске поговорили с Вадимом Дудой, генеральным директором Российской государственной библиотеки имени Ленина. Обсудили, ждёт ли нас исчезновение бумажных книг, как библиотекарь и читатель будут меняться в эпоху ИИ, кто сегодня работает в Ленинке и какую роль IT играет в одной из крупнейших библиотек мира.

Выпуск уже доступен на платформах:

➡️ YouTube
➡️ ВКонтакте
➡️ RuTube

Ведущий: @erobubble
Please open Telegram to view this post
VIEW IN TELEGRAM
158🏆611
Соскучились по разговорам про ИИ-агентов?

Поговорили с Максимом Волошиным, CPO MWS AI, о том, каким должен быть ИИ-агент для продакт-менеджера.

«Для продакт-менеджера качественный ИИ-агент — это рабочий партнёр. Он помогает проектировать логику продукта, разбирать требования, запускать эксперименты и понимать, что можно делать в системе, а что нельзя. Я вижу ценность такого агента в возможности превращать продуктовую идею в устойчивую техническую конструкцию через диалог.

При этом важно, чтобы человек сохранял контроль и понимал принципы работы ИИ-агента. То есть, у пользователя должна быть возможность формулировать требования и управлять работой ИИ-помощника, задавать вопросы о том, на каких рассуждениях и данных базируются выдвинутые им предложения, определять зоны ответственности и рамки безопасности. Именно в таком формате агент и становится партнёром».


Эта логика всё больше определяет, как бизнес будет работать с ИИ дальше.

Происходит переход от набора отдельных умных функций к управляемым средам, где люди могут создавать ИИ-агентов для совместных проектов и управлять ими. Именно под эту концепцию сегодня и строятся технологические ИИ-платформы, в том числе MWS AI Agents Platform.
8👀3321
▪️ Дайджест научных исследований MWS AI за 2025 год

2025 год был богатым на достижения ИИ. Не удивительно, что журнал Science назвал большие языковые модели одним из важнейших драйверов науки, а в свежем списке прорывных технологий от MIT Technology Review 4 из 10 пунктов так или иначе относятся к искусственному интеллекту. Но никакие достижения нейросетей были бы невозможны без развития науки о самом ИИ.

Ученые MWS AI в партнерстве с коллегами по рынку проводят исследования, создают новые датасеты и ищут нестандартные подходы к обучению моделей, чтобы усовершенствовать ИИ-продукты и практики их применения. Из десятков научных публикаций, вышедших в соавторстве с нашими экспертами в 2025 году, мы выбрали для этого дайджеста те, что по их мнению, особенно важны для практического использования ИИ.

➡️ Итеративное самообучение для генерации кода
Исследование посвящено улучшению ИИ-генерации кода. Авторы разработали итеративный подход к самообучению, базирующийся на двух моделях — генераторе и верификаторе. В результате LLM на 13 млрд параметров генерирует код лучше и работает втрое быстрее, чем модель в 2,5 раза крупнее.


➡️ Будет ли это правдой завтра?
Работа посвящена проблеме устаревших знаний в LLM. Создан датасет EverGreenQA и классификатор EG-E5 для определения вопросов с меняющимися ответами. Исследование ценно для бизнеса, так как позволяет разрабатывать более точные ИИ-системы и бороться с галлюцинациями.


➡️ Адаптивный RAG, независимый от LLM
Авторы статьи предлагают новый подход к адаптивному поиску во внешних данных (RAG), который исключает использование LLM для оценки неопределённости. Это позволяет сократить вычисления без потери в точности, а значит — ускорить и удешевить работу чат-ботов и упростить масштабирование.


➡️ CCT-Code: поиск семантически похожего кода
Авторы разработали и применили новую процедуру обучения (ССТ – кросс-консистентное обучение), чтобы ИИ мог находить похожий код даже на разных языках программирования. Это помогает в рефакторинге и поиске ошибок, что положительно сказывается на скорости разработки в больших проектах. Исследователям удалось добиться рекордной точности обнаружения клонов на C++ и Python. Эффект: экономия времени на унификацию кода в командах с разными стеками.


➡️ StRuCom: структурированные комментарии к коду на русском
Команда собрала датасет из 153 тысяч примеров, чтобы обучать ИИ писать понятные структурированные комментарии к коду на русском языке. Дообучение небольших моделей на StRuCom даёт прирост в качестве до 50%. Это упрощает поддержку legacy-кода и снижает количество ошибок в распределённых командах.


➡️ SPY: синтетический датасет для детекции персональных данных
Авторы представили новый датасет для детекции персональных данных (ПДН/PII) в текстах. Инновация заключается в применении больших языковых моделей для генерации данных, имитирующих реальные сценарии использования ПДН. Работа подчёркивает важность приватности и контроля данных в ИИ-системах и способствует дальнейшим исследованиям в этой области.


➡️ Использование славянского BERT и перевода для классификации техник убеждения
Исследователи предложили метод на базе трансформенных моделей (XLM RoBERTa и Slavic BERT) для выявления манипулятивных техник в текстах. Из-за дефицита размеченных данных для некоторых языков применена аугментация за счет переведенных примеров. Разработка применима в таких задачах, как анализ текстов, модерация контента, выявление манипуляций/мошенничества в коммуникациях.
Please open Telegram to view this post
VIEW IN TELEGRAM
3722
Новое на Хабре MWS AI 🔥

Кейс VisionLabs: как в России впервые запустили сервис биометрического заселения в гостиницу — без бумажных документов, только по распознаванию лица.

Это не фантастика, а правдивый и подробный рассказ о тернистом инженерном и нормативном пути инновации — от реальной проблемы-катализатора до внедрения. Погружаемся в технологию, вопросы защиты биометрических данных и национальные особенности воплощения проекта в жизнь вместе с техническим директоров VisionLabs Константином Евсеевым.

Читать ➡️
Please open Telegram to view this post
VIEW IN TELEGRAM
1143👀3🏆1
OpenAI представила ChatGPT Health — отдельное пространство внутри ChatGPT, созданное для обсуждения здоровья. Релиз сразу вызвал вопросы:

Это попытка заменить врачей или всего лишь инструмент для первичной консультации и подготовки пациента?

Стоит ли запрещать таких медицинских ИИ-консультантов, чтобы избежать последствий самолечения?

Но если смотреть шире, то запуск ChatGPT Health поднимает еще более фундаментальный вопрос — о направлении развития ИИ-индустрии. Останутся ли универсальные модели «на все случаи жизни» или рынок сместится в сторону специализированных решений, которые учитывают отраслевой и профессиональный контексты.
Спросили мнение у экспертов.

Андрей Кравченко, директор проектного направления МЕДСИ Диджитал:
Как специалист по цифровизации медицины, я воспринимаю ChatGPT Health как хороший пример того, как ИИ может занять свою нишу между человеком и системой здравоохранения. Очевидно, что такой продукт не заменит терапевта — клинические решения, ответственность и работа с рисками остаются за врачом, данный функционал на ИИ невозможно переложить в текущих реалиях.

Думаю, что с точки зрения системы здравоохранения такие решения можно рассматривать как цифровой фильтр и помощник, который повышает медицинскую грамотность населения и рациональнее распределяет поток пациентов. При аккуратном внедрении и чётком разграничении ответственности ИИ может получиться классный продукт, который способен снизить нагрузку на первичное звено, убрав часть типовых и повторяющихся запросов, например, «что означают мои анализы», «стоит ли идти к врачу», «нормально ли это», и так далее.


Валентин Малых, руководитель Центра разработки LLM, MWS AI:

Запрещать такие сценарии бессмысленно. Люди уже используют ИИ для обсуждения вопросов здоровья и будут продолжать это делать. Единственный разумный путь заключается в регулировании и выстраивании механизмов эскалации, когда система умеет вовремя направить человека к специалисту. Это снижает нагрузку и делает систему устойчивее.


Денис Филиппов, CEO MWS AI:
Мы видим устойчивый сдвиг от универсальных ИИ-моделей к отраслевым решениям. Универсальный ИИ может поддержать разговор почти на любую тему, но для реальных бизнес-задач этого недостаточно. В чувствительных сферах, таких как медицина, ценность дают специализированные модели, которые учитывают контекст, требования безопасности и встроены в процессы.

ChatGPT Health хорошо иллюстрирует этот переход. Рынок постепенно уходит от идеи «одного ИИ для всего» к системам, которые усиливают конкретные направления и работают внутри их правил, а не поверх них.
3👀11
Многие компании начинают ИИ-трансформацию, бросая основные силы и средства на технологии и инфраструктуру. Развитие же ИИ-компетенций руководителей и сотрудников, а также перестройка бизнес-процессов откладываются на потом или проводится по остаточному принципу.

Однако успех здесь зависит от ИИ-культуры — людей и процессов — даже в большей степени, чем от технологий и инфраструктуры. Поэтому известный принцип распределения сил и средств 70-20-10 в применении к ИИ-трансформации и модели «Технологии — Инфраструктура — Культура» должен быть перевернут — 10-20-70:

1⃣0⃣% — технологии
Это важная часть, но не доминирующая. Технологии (ИИ-решения, модели, платформы) — это инструменты, а не цель.


2⃣0⃣% — данные и инфраструктура
Без качественных данных и безопасной масштабируемой инфраструктуры ИИ не работает. Но здесь легко переинвестировать, если нет чёткого понимания, зачем всё это строится.


7⃣0⃣% — ИИ-культура
Это перестройка бизнес-модели, обучение сотрудников и вовлечение топ-менеджмента в ИИ-трансформацию. Когда ИИ становится не «фишкой», а естественной частью операционной модели и основных процессов, появляется реальный бизнес-эффект.


Важно помнить, что ИИ-трансформация — это комплексный процесс, который включает запуск ИИ-инициатив, их развитие, встраивание в бизнес-процессы и последующее масштабирование. Именно сочетание сотрудников, процессов и работающих ИИ-решений позволяет переходить от отдельных экспериментов к устойчивому эффекту на уровне всей компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
111843👀2
В 2025 году на Хабре ученые и эксперты MWS AI рассказывали о практическом применении ИИ, новых подходах к оценке и обучению моделей, инфраструктурных ограничениях, решениях и экспериментах для подтверждения бизнес-эффектов и много о чем еще.

Сохраняйте нашу подборку самых интересных публикаций и не забудьте поделиться ею с коллегами.

📌 Как мы учим LLM оценивать друг друга и как это помогло нам улучшить Cotype
Рассказали о нашем новом подходе к оценке больших языковых моделей методом Side-by-Side. Показали, как нам удалось улучшить качество наших моделей Cotype, а значит и корпоративные ИИ-решения на их основе.


📌 Как мы сделали новых ИИ-помощников для программистов компактными и при этом могучими
Объяснили, какие уловки в обучении мы применяли, чтобы наши небольшие кодинг-модели семейства Kodify не уступали в качестве и возможностях более крупным собратьям, оставаясь компактными и менее ресурсозатратными. Это важно для корпоративного использования.


📌 Как мы строим умный «файрвол» для LLM
Представляем AVI — внешний «фильтр» для языковых моделей, который проверяет запросы и ответы, снижая риски галлюцинаций и токсичности в выдаче. Это пример того, как обеспечивать безопасность и качество.


📌 ML глазами практика и препода. Часть 1
📌 ML глазами практика и препода. Часть 2
Дилогия с практическим, философским и преподавательским взглядом на то, как искусственный интеллект меняет ИТ, науку и подходы к получению знаний.


📌 SWE-MERA — новый динамический бенчмарк для моделей агентной генерации кода
Рассказываем, как устроен новый динамический бенчмарк SWE-MERA, предназначенный для оценки кодинг-моделей на реальных сценариях, и как он решает проблему контаминации данных. .


📌 MWS AI Vision Bench: первый русскоязычный бенчмарк для бизнес-OCR
Представляем собственный бенчмарк для оценки ИИ-моделей на реальных бизнес-задачах, предполагающих работу с текстовой и визуальной информацией на русском языке. Открываем код и валидационный сплит, приватный тест — по запросу.


📌 Как сжимать языковые модели без дообучения
Рассказываем о новом методе структурного прунинга, разработанном учеными MWS AI с зарубежными коллегами, который позволяет сделать большие модели менее требовательными в плане памяти и времени выполнения при сохранении качества.


📌 Почему «больше токенов ≠ лучше» или как научить LLM работать с длинным контекстом
Объясняем, почему увеличение контекстного окна часто приводит не к улучшению ответов ИИ, а наоборот — увеличивает галлюцинации. Рассказываем, как RAG, динамические промпты, chanking и их комбинация помогают сдерживать бурную фантазию LLM.


📌 ИИ в праве: генеративные фантазии и законодательные дыры
Статья разбирает, как генеративный ИИ проникает в юридическую практику и с какими правовыми вызовами сталкивается бизнес. Показываем примеры, когда модели действительно помогают, а когда приводят к судебным инцидентам и штрафам.
77👀53