Китайские LLM и не только
433 subscribers
321 photos
105 videos
11 files
89 links
Рассказываем о китайских больших языковых моделях (LLM), их функционале, о событиях в области ИИ в Китае.
Автор канала - Сбоев Александр, доцент кафедры китаеведения Восточного института ДВФУ и Института иностранных языков Университета Циндао
Download Telegram
Результаты запроса на английском языке
#ErnieBot #Doubao #Qwen

Ernie по запросу на русском и английском языках создал себя в образе гуманоида женского пола, тогда как при запросе на китайском языке выдал непонятную сферу на какой-то подставке.


Doubao по запросу на русском и английском языках также создал себя в образе робота, но без ярко выраженных черт определенного пола, а при запросе на китайском языке сгенерировал человекоподобного робота-мужчину.


Qwen же на все три запроса сгенерировал изображения человека, при этом в зависимости от запроса создавал людей разной национальности.
👍21
#DeepSeek

DeepSeek продолжает развитие своих моделей.


1 декабря компания DeepSeek представила новое поколение открытых моделей — DeepSeek-V3.2 и продвинутую версию для длительных цепочек рассуждений DeepSeek-V3.2-Speciale. Как сообщает компания, модель V3.2 демонстрирует уровень логического вывода, сопоставимый с GPT-5 и близкий к Gemini-3.0-Pro, при этом формирует более короткие ответы, чем Kimi-K2-Thinking, что снижает вычислительные затраты и ускоряет работу.


DeepSeek-V3.2доступна в приложении, веб-версии и через API. Модель V3.2-Speciale пока работает только по API.
#Doubao


Команда Doubao представила новый мобильный голосовой ассистент, встроенный в систему смартфона. В отличие от обычного приложения, он интегрирован на уровне ОС: активируется голосом, боковой AI-кнопкой или через наушники, понимает контекст экрана и отвечает на вопросы о фото, локациях и контенте.
Ассистент объединяет функции общения (голосовые и видеозвонки, шэринг экрана), работу с мультимодальными моделями и нативным альбомом: умеет автоматически редактировать фотографии, удалять людей и объекты, оставляя чистый фон.


Doubao способен выполнять рутинные действия в приложениях: сравнивать цены на разных маркетплейсах и готовить заказ, проверять обновления подкастов и добавлять их в плейлист, открывать багажник автомобиля, бронировать столик в ресторане, оформлять командировки, заказывать билеты, устанавливать приложения, проверять логистику, собирать и загружать файлы. В чувствительных сценариях (например, оплата) он запрашивает подтверждение пользователя.


Ассистент также получил функцию памяти: по желанию пользователя он фиксирует важные данные (адреса, коды, расписания, места парковки), преобразует их в заметки и использует для быстрых ответов и напоминаний.


Расширенный режим Pro сочетает GUI-агент и прямой вызов инструментов, работает быстрее и требует меньше уточнений. Сохраненная память позволяет выполнять сложные запросы вроде подготовки путешествия: отмечать сохраненные рестораны на карте, находить выставки по предпочтениям пользователя, бронировать билеты и собирать итоговую информацию в заметку.


В компании подчеркивают, что демонстрации в официальном видеоролике — реальные, при этом разработчики обещают ускоренными темпами улучшать модель. Особое внимание уделено защите данных: на сайте опубликована подробная «Белая книга» по приватности.
На данный момент ассистент работает на инженерном образце, созданном в сотрудничестве с ZTE — модели Nubia M153. Сейчас устройство доступно на официальном сайте Doubao и в магазине ZTE по цене 3499 юаней.

По данным СМИ, ByteDance и Nubia подготовили 30 тысяч подобных устройств.
Сотрудничество ZTE и ByteDance выглядит очень перспективно.

Известно, что в 2018 г. Министерство торговли США объявило о том, что власти США решили возобновить действие 7-летнего экспортного эмбарго против ZTE, что лишило китайскую компанию доступа к американским технологиям. Чтобы снять ограничения, ZTE пришлось выплатить более миллиарда долларов штрафов и полностью обновить менеджмент.


Последние годы ZTE сталкивалась с падением спроса на 5G-оборудование на внутреннем рынке, из-за чего ее основная деятельность оказалась под давлением, а смартфоны - на периферии внимания.


На фоне обострившейся конкуренции и трансформации отрасли ZTE остро нуждалась в новом драйвере. И партнерство с ByteDance стало для нее редким шансом сделать рывок в сегменте ИИ-смартфонов.


Для ByteDance такая кооперация - способ войти в мир системного софта, минуя сверхдорогой и рискованный путь создания собственного железа. Это похоже на стратегию Huawei в автопроме: не строить самим, а давать «мозги» партнерам.


Однако, несмотря на впечатляющую концепцию такой кооперации и создания подобного встроенного в смартфон ИИ-ассистента, потенциальные риски остаются. Прежде всего, это вопросы конфиденциальности и безопасности: для работы искусственному интеллекту необходим доступ ко всему содержимому экрана, а значит, он фактически видит личные переписки, электронную почту, профили и другие чувствительные данные. Даже при строгом соблюдении нормативов сохраняются риски утечек, внутренних злоупотреблений или внешних атак. Кроме того, технология еще недостаточно зрелая: на практике ИИ иногда работает медленнее ручного ввода, поскольку ему требуется время на распознавание экрана, анализ структуры интерфейса и имитацию действий. Локальное выполнение таких задач также потребляет значительные вычислительные ресурсы, что может приводить к перегреву устройства, замедлению работы и ускоренному расходу заряда батареи. Наконец, существует риск возникновения «экосистемных островов»: хотя Doubao позиционируется как системный ИИ, он может демонстрировать лучшую интеграцию и производительность в экосистеме ByteDance (например, в Douyin или Toutiao), тогда как в сторонних сервисах - таких как WeChat, Alipay или Map - его работа может оказаться менее эффективной.
👍1
#рейтинг_LLM

Рейтинг ИИ-приложений по количеству активных пользователей за месяц (MAU) за ноябрь.

В ноябрьском рейтинге китайских ИИ-приложений лишь одно изменение – Ernie от Baidu вылетел из первой десятки и опустился на 11 место, а его место занял Qwen, который поднялся сразу на 8 место, показав прирост за месяц в 149,03%.


Первая пятерка прежняя: Doubao, Quark, Baidu Wangpan, Tencent Yuanbao, DeepSeek.

В глобальном рейтинге ИИ-приложений по MAU из китайских по-прежнему три в пятерке и шесть в десятке: Doubao, Quark и BaiduWangpan (2-4 места), Tencent Yuanbao (6 место), а DeepSeek (7
место). А вот Jimeng опустился
на 11 мест, а вместо него в десятку вошла другая LLM от ByteDance – Cici, которая является глобальной версией Doubao.
LLM перестали быть просто чат-ботами в браузере или телефоне, они мигрировали в физический мир, и одно из их физических воплощений — смарт-очки. В Китае это не просто новая категория гаджетов, а попытка создать новую платформу взаимодействия человека с ИИ.
В последнее время действительно заметно, как китайские компании массово выпускают умные очки с ИИ. Это не единичный случай, свои ИИ-очки выпускают как IT-гиганты вроде Baidu с Alibaba, так и производители электроники вроде Xiaomi и TCL, и целый слой специализированных стартапов. Даже автопроизводитель Li Auto недавно представил свою модель — легкие очки за 1999 юаней, встроенные в экосистему их электромобилей.


Статистика говорит о буме: рынок в Китае вырос больше чем вдвое, а доля в мировом производстве приблизилась к 27%. Цены при этом остаются сравнительно доступными — от тысячи до пяти тысяч юаней, что в разы дешевле западных аналогов. Главный козырь местных брендов — не просто цена, а та самая «глубокая интеграция»: очки легко платят через Alipay, работают с WeChat, показывают уведомления из Douyin и следят за усталостью глаз. Технически они стали почти неотличимы от обычных — весят как оправа, а заряда хватает на целый день.
Но за этим ажиотажем кроются и серьезные вопросы. Многие функции — те же перевод или навигация — пока не выглядят «убийственным аргументом», без которого нельзя жить. Чаще это удобные дополнения, но не замена смартфону. А некоторые возможности, например незаметная съемка фото и видео, и вовсе ставят этические дилеммы — где грань между удобством и вторжением в приватность?


В целом ощущение такое, что рынок переживает фазу экспериментов. Все пробуют, ищут свое применение — кто-то делает ставку на развлечения, кто-то на помощника для водителя, кто-то на здоровье. Прогнозы рисуют огромные суммы к 2030 году, но по-настоящему массовым продукт станет только тогда, когда найдется тот самый сценарий, ради которого эти очки действительно захочется носить каждый день. Пока же это скорее любопытный гибрид технологий, экосистемы и маркетинга, за которым интересно наблюдать, но который еще не доказал свою необходимость.
Media is too big
VIEW IN TELEGRAM
Вот пример использования таких технологий в сфере СМИ:


Во время всекитайских «двух сессий» в 2024 году один из журналистов продемонстрировал своё новое оборудование – ИИ-очки. Оно поддерживает интеллектуальный сбор и обработку материалов, распознавание лиц, прямые трансляции и монтаж контента, что повышает эффективность работы и оптимизирует процесс интервьюирования и подготовки репортажей. Благодаря предварительной загрузке данных о депутатах и членах Народного политического консультативного совета, а также использованию возможностей больших моделей, журналист мог быстро находить нужных собеседников и оперативно делиться динамикой с места событий.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Пример применения смарт-очков в полиции:

Дорожная полиция Ханчжоу использует AR-очки, которые позволяют на расстоянии 5–7 метров быстро определить, оформлена ли у автомобиля пропуск на въезд, а также показывают в реальном времени расстояние до машины и позволяют запрашивать данные через полицейскую информационную систему. Это сокращает время проверки — от нескольких секунд до десятка секунд.
🔥6👍1
#что_китайские_ИИ_знают_о_России

Спросили китайские нейросети, а именно Nano AI, DeepSeek, Doubao, Tencent Yuanbao, Qwen, Ernie 5.0/Ernie 4.5 и Kimi, откуда они берут сведения о России.
#DeepSeek #ErnieBot #Doubao #Kimi #Qwen #NanoAI
Все модели при ответе придерживались схожей схемы объяснения. LLM подчеркивают, что знания формируются на основе больших массивов текстов, включающих книги, научные статьи, учебники, новостные архивы, официальные документы, энциклопедии и открытые интернет-источники. Почти все отмечают отсутствие личного опыта, отсутствие реального доступа к интернету и ограниченность из-за неактуальной текущей базы знаний, что делает их знания статичными и потенциально устаревающими. При этом только четыре нейросети прямо указывают крайнюю дату их БД: Nano AI пишет, что его база знаний актуальна примерно до июля 2024 года. Doubao указывает конец 2023 года. Qwen говорит, что конец даты его обучения - 2024 год. Kimi - конец декабря 2024 года.


Nano AI подчеркнул, что использует архивы статей как из российских СМИ (как государственных, так и независимых), так и международных новостных агентств (Reuters, AP, AFP, BBC и др.) на разных языках, что, как пишет модель, означает, что в сведениях могут присутствовать различные точки зрения (включая официальные, оппозиционные, зарубежные), а также возможные искажения или неточности. «Я стремлюсь к нейтральности, но мои ответы зависят от данных». Также Nano AI добавляет, что эти «данные были собраны и обработаны создателями модели (при этом своим создателем называет компанию OpenAI)».


DeepSeek подчеркивает, что получает информацию также из взаимодействия с пользователями: «В процессе общения с миллионами пользователей из разных стран, в том числе из России, я также анализирую и обобщаю заданные вопросы, темы и контексты».


Doubao отмечает, что помимо данных официальных организаций, а также из научных статей, образовательных материалов, художественной литературы, берет материалы еще и из нейтральных медиа и проверенных информационных ресурсов, которые «публикуют объективную информацию о событиях в России и мире, без выраженной идеологической или политической предвзятости».


Tencent Yuanbao указывает конкретные названия источников: ТАСС, "Россия сегодня", РИА Новости, Gazeta.Ru, Отчеты ISD, NewsGuard, фонда INFO OPS Polska. При этом LLM подчеркивает, что «данные из российских официальных источников и выводы западных аналитических центров могут значительно расходиться в трактовке одних и тех же событий», и модель «старается указывать на эти различия».


Qwen акцентирует внимание на том, что он не получает доступ к интернету в реальном времени и не может проверять актуальность событий.


Ernie 5.0 начинает свой ответ с предложения: «Я — большая языковая модель, разработанная Google». Далее указывает конкретные имена историков, на чьи труды опирается: С.М. Соловьев, В.О. Ключевский, Р. Пайпс, Орландо Файджес. Что касается знаний в области культуры и искусства, то здесь Ernie 5.0 говорит, что получает их из книг по истории русского балета, живописи (от икон до авангарда), музыки (от Глинки до Свиридова). А в конце предупреждает: «По спорным вопросам (например, политика, история) разные источники могут давать разную информацию. Я стараюсь представить сбалансированную картину, но могу непреднамеренно сместить акцент в ту или иную сторону».


Ernie 4.5 вообще написал, что может «общаться с друзьями» и «посещать образовательные курсы, семинары или лекции», таким образом получая знания о России.


Kimi ответил довольно кратко, заключив, что «"знает" о России так же, как студент знает страну по учебникам — через собранные другими людьми слова, но без личного опыта и с фиксированной датой последнего обновления»
👍3😁1
Сегодня состоялся экспертный круглый стол, в рамках которого был представлен наш аналитический доклад, посвященный применению искусственного интеллекта в Китае. Доклад стал основой для содержательного обсуждения с участием представителей академического и экспертного сообщества. В мероприятии приняли участие коллеги из Института востоковедения РАН, Восточного института СПбГУ, Яндекс Образования, Высшей школы экономики, Дальневосточного федерального университета, а также представители Правительства Приморского края и средств массовой информации.


Особый интерес участники проявили к вопросам использования ИИ в сфере образования и научной деятельности в Китае, а также к проблемам и ограничениям переноса китайского опыта в российский контекст. В ходе дискуссии затрагивались вопросы оценки эффективности внедрения ИИ в образовательной сфере, дефицита аналитических и академических исследований, посвященных результатам такого внедрения, а также высокой динамики изменений в сфере ИИ в Китае.


Отдельное внимание было уделено специфике речевого поведения китайских языковых моделей и особенностям взаимодействия с ними, проблеме массового появления научных работ, созданных с использованием ИИ, и мерам, применяемым в Китае для регулирования этой практики. Также обсуждалось влияние крупных ИТ-корпораций на развитие и институционализацию ИИ в образовательной и научной среде.
5👍2🔥1
#ИИ_в_образовании


В Китае в последние годы активно разрабатываются и апробируются цифровые решения, ориентированные на глубокую трансформацию образовательного процесса. Одним из таких примеров стала система интеллектуальной оценки преподавания на основе ИИ, которая в настоящее время функционирует в пилотном режиме на базе Пекинского педагогического университета.


Инженерным исследовательским центром ИИ-технологий и образовательных приложений при Министерстве образования КНР в рамках проекта «Инновационная интеллектуальная оценка преподавания в формате ИИ+» была разработана система комплексного ИИ-мониторинга учебной деятельности. Она основана на совмещении технологий компьютерного зрения, обработки естественного языка, интегративного обучения и статистического моделирования и ориентирована на непрерывное, автоматизированное наблюдение за образовательным процессом в аудитории.
1
В режиме реального времени система осуществляет сбор и анализ данных о деятельности преподавателя, включая его поведение, манеру изложения материала, использование дидактических инструментов, эмоциональные реакции, телодвижения и направление взгляда. Одновременно фиксируются показатели поведения обучающихся: уровень концентрации, степень вовлеченности и активность, а также характеристики учебного содержания, в том числе его соответствие утвержденной программе, выделение ключевых знаний и выявление так называемых «чувствительных тем». На основе совокупности этих данных формируется количественная оценка, визуализируемая в виде 15 индексов по трем направлениям: преподаватель, студент и содержание курса.
😱5🤔1👀1