Вышел новый GigaChat
С релизом GigaChat 2.0 чуда не произошло. Конкретики в анонсе минимум, зато есть утверждение, что эта модель «сильнейшая на русском языке». Основанием стал бенчмарк, где нет моделей Яндекса (да и кучи других).
Можно похвалить команду за увеличение контекстного окна – точный размер токенов не говорят, но теперь вроде как модель воспринимает 200 страниц текста против 48 у предыдущей версии.
Попробовать GigaChat 2 можно в кабинете разработчика. Удручает низкая скорость вывода токенов. Есть надежда, что она увеличится после появления версии 2 на сайте. Сервис бесплатный – пользоваться моделью может любой желающий.
Что с тестами? Задачу из курса алгебры 9 класса он решить не смог. Yandex GPT 5 Pro и Gemma справились. Хотя, возможно, это просто случайность, потому что на другой задаче дали неверный ответ уже все 3 модели – предметы из 9 класса пока даются им с трудом.
С просьбой написать код калькулятора на Питоне он справился не с первого раза – сначала вообще не смог вывести код полностью, потому что не хватило токенов, потом пытался исправить ошибку, и только после просьбы написать всё заново у него получилось.
С изменением стиля, написанием и сокращением текста работает неплохо, хотя не всегда следует задаче, начинает галлюцинировать и придумывать текст от себя. Переводить с английского и обратно умеет – результат не слишком художественный, но смысл сохраняется даже у сложных предложений.
Сейчас главный минус GigaChat – отсутствие доступа в Интернет, из-за чего он имеет весьма ограниченное понимание мира при ответах на вопросы и работе с данными. Возможно, для редактуры и переписывания текста это неплохой инструмент, но пока не совсем понятно, как ещё его использовать и зачем.
С релизом GigaChat 2.0 чуда не произошло. Конкретики в анонсе минимум, зато есть утверждение, что эта модель «сильнейшая на русском языке». Основанием стал бенчмарк, где нет моделей Яндекса (да и кучи других).
Можно похвалить команду за увеличение контекстного окна – точный размер токенов не говорят, но теперь вроде как модель воспринимает 200 страниц текста против 48 у предыдущей версии.
Попробовать GigaChat 2 можно в кабинете разработчика. Удручает низкая скорость вывода токенов. Есть надежда, что она увеличится после появления версии 2 на сайте. Сервис бесплатный – пользоваться моделью может любой желающий.
Что с тестами? Задачу из курса алгебры 9 класса он решить не смог. Yandex GPT 5 Pro и Gemma справились. Хотя, возможно, это просто случайность, потому что на другой задаче дали неверный ответ уже все 3 модели – предметы из 9 класса пока даются им с трудом.
С просьбой написать код калькулятора на Питоне он справился не с первого раза – сначала вообще не смог вывести код полностью, потому что не хватило токенов, потом пытался исправить ошибку, и только после просьбы написать всё заново у него получилось.
С изменением стиля, написанием и сокращением текста работает неплохо, хотя не всегда следует задаче, начинает галлюцинировать и придумывать текст от себя. Переводить с английского и обратно умеет – результат не слишком художественный, но смысл сохраняется даже у сложных предложений.
Сейчас главный минус GigaChat – отсутствие доступа в Интернет, из-за чего он имеет весьма ограниченное понимание мира при ответах на вопросы и работе с данными. Возможно, для редактуры и переписывания текста это неплохой инструмент, но пока не совсем понятно, как ещё его использовать и зачем.
👍2🔥1
ИИ объединяет
МТС и Kokoc Group решили заключить стратегическое партнёрство, и одна из причин – ИИ. Они собираются добавить искусственный интеллект и другие инструменты от МТС AdTech на платформу Vitamin tools, которая нужна для управления рекламными компаниями.
Главная задумка – дать пользователям возможность автоматической генерации и модерации рекламных креативов в Telegram Ads. Хотя, конечно, ещё важнее в данном случае наработки МТС в машинном обучении и больших данных.
Это общий тренд по рынку – на других рекламных площадках в России уже есть похожие функции. В Директе, например, можно генерировать объявление целиком вместе с картинкой. И вроде бы сделанные ИИ объявления на 5% эффективнее обычных… Но нужно понимать, что эта цифра «в среднем по больнице».
МТС и Kokoc Group решили заключить стратегическое партнёрство, и одна из причин – ИИ. Они собираются добавить искусственный интеллект и другие инструменты от МТС AdTech на платформу Vitamin tools, которая нужна для управления рекламными компаниями.
Главная задумка – дать пользователям возможность автоматической генерации и модерации рекламных креативов в Telegram Ads. Хотя, конечно, ещё важнее в данном случае наработки МТС в машинном обучении и больших данных.
Это общий тренд по рынку – на других рекламных площадках в России уже есть похожие функции. В Директе, например, можно генерировать объявление целиком вместе с картинкой. И вроде бы сделанные ИИ объявления на 5% эффективнее обычных… Но нужно понимать, что эта цифра «в среднем по больнице».
👍1
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
👍1
Аишка
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini. 1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini…
Если говорить о полезных возможностях применения новой мультимодальной версии Gemini для тех, кто работает с медиа, то вот несколько (помимо обычной генерации картинок, конечно, что и так умеют другие сервисы).
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
🔥1
#нейродайджест CRAI за неделю
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
👏2
Новые модели Ernie от Baidu – очень интересно, но не сильно полезно
🪱 Baidu представили 2 новых модели для своего ИИ-помощника – Ernie 4.5 (мультимодальную, которая понимает изображения, видео и аудио) и Ernie X1 (рассуждающую).
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
В Ростехе рассказали, что запустили в производство российский мини-компьютер для нейросетей — «Фишт». Зачем он нужен?
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
👍1🔥1