Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
👍1
Аишка
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini. 1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini…
Если говорить о полезных возможностях применения новой мультимодальной версии Gemini для тех, кто работает с медиа, то вот несколько (помимо обычной генерации картинок, конечно, что и так умеют другие сервисы).
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
🔥1
#нейродайджест CRAI за неделю
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
👏2
Новые модели Ernie от Baidu – очень интересно, но не сильно полезно
🪱 Baidu представили 2 новых модели для своего ИИ-помощника – Ernie 4.5 (мультимодальную, которая понимает изображения, видео и аудио) и Ernie X1 (рассуждающую).
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
В Ростехе рассказали, что запустили в производство российский мини-компьютер для нейросетей — «Фишт». Зачем он нужен?
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная коллаборация получилась у сервиса нейропоиска 🧘 Perplexity и корейского актёра Ли Джонджэ.
В промо-ролике обыграна сцена из «Игры в кальмара»: он попадает в ситуацию, где нужно срочно ответить на вопрос, а поисковик Poogle не помогает с ответом и только путает. На выручку сразу приходит Perplexity.
P.S. Это первый прямой укол Perplexity в сторону Google, хотя их продукт существует только по той причине, что Google даёт возможность пользоваться своим поиском сторонним сервисам.
В промо-ролике обыграна сцена из «Игры в кальмара»: он попадает в ситуацию, где нужно срочно ответить на вопрос, а поисковик Poogle не помогает с ответом и только путает. На выручку сразу приходит Perplexity.
P.S. Это первый прямой укол Perplexity в сторону Google, хотя их продукт существует только по той причине, что Google даёт возможность пользоваться своим поиском сторонним сервисам.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3😁3
Google совершает крупнейшую сделку в своей истории
Alphabet (материнская компания Google) официально подтвердили приобретение стартапа Wiz, который специализируется на облачной безопасности. Сумма получилась рекордная – 32 миллиарда долларов.
Самое удивительное, что при такой внушительной сумме Wiz сохранит автономию и будет работать со всеми облачными провайдерами, а сотрудники компании получат по 588 тысяч долларов компенсации на руки.
Что это за компания? Израильский стартап в области облачной безопасности, который разрабатывает платформу для анализа рисков облачной инфраструктуры. Причём это один из самых успешных стартапов в кибербезе, оценка которого составляла 16 миллиардов долларов до сделки. Теперь, благодаря Google, она практически удвоилась.
Зачем они Google? Главная причина покупки – отставание компании от Amazon (AWS) и Microsoft (Azure) на b2b рынке облачных технологий и кибербезопасности. Они надеются, что компетенции работников стартапа и их технологии помогут догнать конкурентов. Финансовые показатели, конечно, тоже сыграли свою роль – сейчас Wiz уже зарабатывает 700 миллионов долларов в год и находится на пути к миллиарду.
Alphabet (материнская компания Google) официально подтвердили приобретение стартапа Wiz, который специализируется на облачной безопасности. Сумма получилась рекордная – 32 миллиарда долларов.
Самое удивительное, что при такой внушительной сумме Wiz сохранит автономию и будет работать со всеми облачными провайдерами, а сотрудники компании получат по 588 тысяч долларов компенсации на руки.
Что это за компания? Израильский стартап в области облачной безопасности, который разрабатывает платформу для анализа рисков облачной инфраструктуры. Причём это один из самых успешных стартапов в кибербезе, оценка которого составляла 16 миллиардов долларов до сделки. Теперь, благодаря Google, она практически удвоилась.
Зачем они Google? Главная причина покупки – отставание компании от Amazon (AWS) и Microsoft (Azure) на b2b рынке облачных технологий и кибербезопасности. Они надеются, что компетенции работников стартапа и их технологии помогут догнать конкурентов. Финансовые показатели, конечно, тоже сыграли свою роль – сейчас Wiz уже зарабатывает 700 миллионов долларов в год и находится на пути к миллиарду.
👍2
Что Nvidia показали на конференции GTC 2025?
Компания продолжает двигаться в направлении, обозначенном на прошлом выступлении CEO Дженсена Хуанга в январе. На этот раз он вещал с трибун конференции GPU Technology Conference, но не о видеокартах (как можно было бы подумать исходя из названия мероприятия), а снова об искусственном интеллекте, благодаря которому Nvidia так стремительно росла последние годы.
Конкретики было меньше, чем философии. Главный посыл: ИИ больше не просто отвечает на вопросы, а становится «полноценным агентом», который думает, планирует и действует. Токены, некогда просто техническая конструкция, теперь стали «строительными блоками интеллекта». Они преобразуются в различные формы – музыку, слова, видео, научные исследования, химические вещества или белки. Такие системы позволят создать по-настоящему мультимодальный ИИ, который будет одинаково понимать любой тип информации.
Поэтому ставку компания делает на переход от обычных AI-помощников к «агентному ИИ» – искусственному интеллекту, который умеет рассуждать, строить планы и применять инструменты, как это делает человек. Кто такие агенты и с чем их есть – пока никто точно не знает, но ставку на них делают буквально все.
Следующим шагом Nvidia видит «физический ИИ», понимающий не только контекст диалога, но и физический мир: трение, инерцию и причинно-следственные связи. Именно такой интеллект ляжет в основу новых роботов и автономных систем.
Правда, для этого нужны колоссальные ресурсы, что вызывает стократный рост потребности в вычислениях. В качестве решения Nvidia предложили новую архитектуру Blackwell: два GPU на одном чипе и сверхэффективное масштабирование. Обещают, что Blackwell в 25 раз производительнее предшественника при тех же энергозатратах. А для задач, где ИИ нужно «думать», прирост достигает 40-крат. Правда, зная подход Nvidia к бенчмаркам и сравнению несравнимого, это ещё предстоит проверить.
На новой архитектуре выйдет и ряд новых ИИ-компьютеров DGX для корпоративного использования. Это «компьютеры эры искусственного интеллекта», разработанные для исследователей.
Компания показала, как строит целые «ИИ-фабрики» — центры обработки данных нового типа, которые вместо хранения и извлечения данных ориентированы на генерацию токенов, упомянутых выше. Управление этими фабриками осуществляет Nvidia Dynamo, открытая операционная система, которая управляет распределением задач, KV-кэшем и другими операционными аспектами ИИ-инфраструктуры.
Хуанг снова позиционировал робототехнику как «крупнейшую индустрию будущего». Экосистема Nvidia для разработки роботов включает платформу Omniverse для симуляции и генерации синтетических данных (Cosmos), физический движок Newton и Groot N1 — генеративную модель для гуманоидных роботов, которая теперь выложена в открытый доступ.
Компания продолжает двигаться в направлении, обозначенном на прошлом выступлении CEO Дженсена Хуанга в январе. На этот раз он вещал с трибун конференции GPU Technology Conference, но не о видеокартах (как можно было бы подумать исходя из названия мероприятия), а снова об искусственном интеллекте, благодаря которому Nvidia так стремительно росла последние годы.
Конкретики было меньше, чем философии. Главный посыл: ИИ больше не просто отвечает на вопросы, а становится «полноценным агентом», который думает, планирует и действует. Токены, некогда просто техническая конструкция, теперь стали «строительными блоками интеллекта». Они преобразуются в различные формы – музыку, слова, видео, научные исследования, химические вещества или белки. Такие системы позволят создать по-настоящему мультимодальный ИИ, который будет одинаково понимать любой тип информации.
Поэтому ставку компания делает на переход от обычных AI-помощников к «агентному ИИ» – искусственному интеллекту, который умеет рассуждать, строить планы и применять инструменты, как это делает человек. Кто такие агенты и с чем их есть – пока никто точно не знает, но ставку на них делают буквально все.
Следующим шагом Nvidia видит «физический ИИ», понимающий не только контекст диалога, но и физический мир: трение, инерцию и причинно-следственные связи. Именно такой интеллект ляжет в основу новых роботов и автономных систем.
Правда, для этого нужны колоссальные ресурсы, что вызывает стократный рост потребности в вычислениях. В качестве решения Nvidia предложили новую архитектуру Blackwell: два GPU на одном чипе и сверхэффективное масштабирование. Обещают, что Blackwell в 25 раз производительнее предшественника при тех же энергозатратах. А для задач, где ИИ нужно «думать», прирост достигает 40-крат. Правда, зная подход Nvidia к бенчмаркам и сравнению несравнимого, это ещё предстоит проверить.
На новой архитектуре выйдет и ряд новых ИИ-компьютеров DGX для корпоративного использования. Это «компьютеры эры искусственного интеллекта», разработанные для исследователей.
Компания показала, как строит целые «ИИ-фабрики» — центры обработки данных нового типа, которые вместо хранения и извлечения данных ориентированы на генерацию токенов, упомянутых выше. Управление этими фабриками осуществляет Nvidia Dynamo, открытая операционная система, которая управляет распределением задач, KV-кэшем и другими операционными аспектами ИИ-инфраструктуры.
Хуанг снова позиционировал робототехнику как «крупнейшую индустрию будущего». Экосистема Nvidia для разработки роботов включает платформу Omniverse для симуляции и генерации синтетических данных (Cosmos), физический движок Newton и Groot N1 — генеративную модель для гуманоидных роботов, которая теперь выложена в открытый доступ.
🔥4
Нейросети играют с нами в испорченный телефон
Недавнее исследование Columbia Journalism Review подтвердило, что проверять факты нейросети всё ещё не умеют и регулярно ошибаются. Более того, делают это с уверенностью эксперта.
Исследователи протестировал восемь популярных ботов, включая ChatGPT, Perplexity, Gemini, Copilot, Grok и другие. Им дали простое задание – найти источник известной цитаты и выдать ссылку, название СМИ и дату публикации. Все статьи в топ-3 выдачи поиска Google, но какие-то из них доступны только по подписке.
Адекватно справились с заданием только ChatGPT Search и Perplexity, и то меньше чем в 40% случаев. В остальных ответах сервисы либо жаловались, что ничего не нашли, либо фантазировали. Причём платные версии ошибались ничуть не хуже, поэтому подписка тоже не спасёт от галлюцинаций в ответах. Даже если доступ к статье был запрещён в robots.txt – чат-боты нашли обходные пути, выдавая чужой контент за оригинал или ссылаясь на пиратские репосты.
Кстати, российские нейросети не исключение – мы протестировали Алису, Нейро и Гигачат на части того же дата-сета. И если Алиса с Гигачатом не смогли найти цитаты из зарубежных платных медиа, то вот Нейро довольно легко определял источник и дату, примерно на уровне Perplexity. Но делал это не на основе оригинала, а на основе копий с сомнительных сайтов.
В другом исследовании Tow Center выяснили, что систематические ошибки обнаружены даже в новостях из тех изданий, которые официально сотрудничают с OpenAI. И дело не в «сырости» данных, а в самой архитектуре нейросетей. Именно поэтому инструменты типа Deep Research ещё долго будут вспомогательными по отношению к поиску.
Какие выводы можно сделать? Всё по-прежнему, не стоит верить чат-ботам на слово. Сейчас много кто говорит про со-творчество с ИИ, но оно требует очень тщательной редактуры и последовательной перепроверки фактов, иногда не повышая, а снижая производительность и делая пользователей ленивее.
Недавнее исследование Columbia Journalism Review подтвердило, что проверять факты нейросети всё ещё не умеют и регулярно ошибаются. Более того, делают это с уверенностью эксперта.
Исследователи протестировал восемь популярных ботов, включая ChatGPT, Perplexity, Gemini, Copilot, Grok и другие. Им дали простое задание – найти источник известной цитаты и выдать ссылку, название СМИ и дату публикации. Все статьи в топ-3 выдачи поиска Google, но какие-то из них доступны только по подписке.
Адекватно справились с заданием только ChatGPT Search и Perplexity, и то меньше чем в 40% случаев. В остальных ответах сервисы либо жаловались, что ничего не нашли, либо фантазировали. Причём платные версии ошибались ничуть не хуже, поэтому подписка тоже не спасёт от галлюцинаций в ответах. Даже если доступ к статье был запрещён в robots.txt – чат-боты нашли обходные пути, выдавая чужой контент за оригинал или ссылаясь на пиратские репосты.
Кстати, российские нейросети не исключение – мы протестировали Алису, Нейро и Гигачат на части того же дата-сета. И если Алиса с Гигачатом не смогли найти цитаты из зарубежных платных медиа, то вот Нейро довольно легко определял источник и дату, примерно на уровне Perplexity. Но делал это не на основе оригинала, а на основе копий с сомнительных сайтов.
В другом исследовании Tow Center выяснили, что систематические ошибки обнаружены даже в новостях из тех изданий, которые официально сотрудничают с OpenAI. И дело не в «сырости» данных, а в самой архитектуре нейросетей. Именно поэтому инструменты типа Deep Research ещё долго будут вспомогательными по отношению к поиску.
Какие выводы можно сделать? Всё по-прежнему, не стоит верить чат-ботам на слово. Сейчас много кто говорит про со-творчество с ИИ, но оно требует очень тщательной редактуры и последовательной перепроверки фактов, иногда не повышая, а снижая производительность и делая пользователей ленивее.
1👍3❤1
У Шедеврума большое обновление: новая версия модели и подписка
Яндекс утверждает, что новая версия модели YandexART 2.5 стала лучше следовать запросам пользователей. Она точнее воспроизводит заданное количество объектов и их параметры: форму, цвет, размер и т. д. Пока эти слова подтверждаются – во всех тестовых генерациях нейросеть почти идеально следовала запросу (минимум на 1 картинке из 6). Генерация надписей на латинице вроде как улучшилась, но картинки без ошибок всё равно получаются редко, как и логотипы или названия компаний.
Подписчики Про теперь могут использовать продвинутую модель YandexART 2.5 Pro, создавать 6 картинок вместо 2 за раз, апскейлить их до разрешения 4К, скачивать без водяного знака и использовать в коммерческих целях. За это Яндекс просит 100 рублей в месяц.
Нужно учитывать, что время генерации модели 2.5 Pro больше, чем у предыдущих версий, да ещё и ждать нужно целых 6 картинок вместо 2. Поэтому сейчас одна генерация занимает 2-3 минуты.
В целом впечатления от модели хорошие – сервис стал лучше понимать, чего ты хочешь, выдавать более резкие и детализированные изображения. Но важно сказать, что Шедеврум, несмотря на появление подписки Про, пока ещё относится скорее к категории полупрофессиональных инструментов. Мы в редакции, например, полностью перейти на него сейчас не сможем.
Шедеврум отлично подходит для генерации художественных иллюстраций, визуальных метафор, интересных ракурсов, а теперь даже и реалистичных фото. Но здесь по-прежнему нельзя точечно редактировать снимки, фиксировать seed генерации, использовать ip-адаптеры или Сontrol net. Если эти термины вам ничего не говорят, значит, скорее всего, Шедеврум отлично решит ваши задачи. И при этом пользоваться из России им можно без всяких танцев с бубном.
Яндекс утверждает, что новая версия модели YandexART 2.5 стала лучше следовать запросам пользователей. Она точнее воспроизводит заданное количество объектов и их параметры: форму, цвет, размер и т. д. Пока эти слова подтверждаются – во всех тестовых генерациях нейросеть почти идеально следовала запросу (минимум на 1 картинке из 6). Генерация надписей на латинице вроде как улучшилась, но картинки без ошибок всё равно получаются редко, как и логотипы или названия компаний.
Подписчики Про теперь могут использовать продвинутую модель YandexART 2.5 Pro, создавать 6 картинок вместо 2 за раз, апскейлить их до разрешения 4К, скачивать без водяного знака и использовать в коммерческих целях. За это Яндекс просит 100 рублей в месяц.
Нужно учитывать, что время генерации модели 2.5 Pro больше, чем у предыдущих версий, да ещё и ждать нужно целых 6 картинок вместо 2. Поэтому сейчас одна генерация занимает 2-3 минуты.
В целом впечатления от модели хорошие – сервис стал лучше понимать, чего ты хочешь, выдавать более резкие и детализированные изображения. Но важно сказать, что Шедеврум, несмотря на появление подписки Про, пока ещё относится скорее к категории полупрофессиональных инструментов. Мы в редакции, например, полностью перейти на него сейчас не сможем.
Шедеврум отлично подходит для генерации художественных иллюстраций, визуальных метафор, интересных ракурсов, а теперь даже и реалистичных фото. Но здесь по-прежнему нельзя точечно редактировать снимки, фиксировать seed генерации, использовать ip-адаптеры или Сontrol net. Если эти термины вам ничего не говорят, значит, скорее всего, Шедеврум отлично решит ваши задачи. И при этом пользоваться из России им можно без всяких танцев с бубном.
👍2