Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
👍1
Аишка
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini. 1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini…
Если говорить о полезных возможностях применения новой мультимодальной версии Gemini для тех, кто работает с медиа, то вот несколько (помимо обычной генерации картинок, конечно, что и так умеют другие сервисы).
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
🔥1
#нейродайджест CRAI за неделю
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
• Разговор, который стирает грань между человеком и машиной
Компания Sesame AI представила речевую модель, которая настолько реалистично имитирует человеческую речь, что грань между человеком и машиной почти стирается.
• Gemini стал доступнее и добавил новые функции для всех пользователей
Google делает свой ИИ Gemini ещё более мощным и доступным. Бесплатными стали персонализация, Deep Research, редактирование изображений прямо в чате и другие полезные функции.
• Manus и ИИ-агенты: просто баловство или технология будущего?
Китайский стартап Monica.im представил Manus – ИИ-агента, который может выполнять задачи в интернете вместо вас. Но так ли это удобно и безопасно?
• GigaChat 2.0: Сильнейший на русском языке?
Сбер выпустил GigaChat 2.0, утверждая, что это сильнейшая модель на русском языке. Оказалось, всё не так однозначно.
• ИИ – это пузырь?
По аналогии с крахом пузыря доткомов, многие задаются вопросом: не является ли ИИ очередным пузырем?
• Мультимодальная модель Gemini для медийщиков
Как мультимодальная модель Gemini может помочь тем, кто работает с медиа? Генерация графики, редактирование изображений, раскадровка и другие возможности
• Microsoft создают своё семейство языковых моделей
Компания стремится снизить зависимость от OpenAI.
• Чипы, созданные ИИ, превосходят человеческие разработки
Искусственный интеллект, отказавшись от традиционных шаблонов, создал чипы для 5G, которые оказались эффективнее сделанных человеком.
• Стратегическое партнёрство МТС и Kokoc Group для применения ИИ в рекламе
МТС и Kokoc Group объединяют усилия, чтобы внедрить ИИ в рекламные кампании, автоматизировав создание и модерацию рекламных креативов.
• Google оказалась крупным инвестором Anthropic с долей в 14%
Google не только разрабатывает собственные передовые ИИ-модели, но и активно инвестирует в конкурентов, получая доступ к их разработкам и предоставляя вычислительные мощности.
• Gemma 3: Мощный ИИ на вашем ноутбуке.
Google выпустил Gemma 3 – модель ИИ, которая может работать даже на обычном ноутбуке, на одном графическом ядре. Это открывает новые возможности для бизнеса и разработчиков, делая ИИ более доступным.
👏2
Новые модели Ernie от Baidu – очень интересно, но не сильно полезно
🪱 Baidu представили 2 новых модели для своего ИИ-помощника – Ernie 4.5 (мультимодальную, которая понимает изображения, видео и аудио) и Ernie X1 (рассуждающую).
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.
Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.
Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие – необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе – интерфейс полностью на китайском языке.
• Третье – специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.
Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).
Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.
Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым – тогда мы обязательно расскажем об этом и поделимся результатами тестов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
В Ростехе рассказали, что запустили в производство российский мини-компьютер для нейросетей — «Фишт». Зачем он нужен?
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
Нейросети имеются в виду не генеративные, а более прикладные, которые отвечают за компьютерное зрение, Интернет вещей, создание цифровых двойников и управление оборудованием.
Отсюда и не самое мощное железо – здесь стоит китайский 4-ядерный чип Rockchip, 8 гигабайт оперативной памяти и 8 встроенной. Нейропроцессор поддерживает 1 триллион операций в секунду, которых как раз должно хватить для распознавания изображений, обработки естественного языка, компьютерного зрения, управления маленькими дронами и так далее (но не для обучения больших моделей нейронных сетей).
Это не аналог Project DIGITS от Nvidia, а небольшое прикладное устройство для производств в России. По словам компании, «Фишт» уже применяют для обработки данных с нефтяных скважин, а в будущем планируют использовать в производстве медицинского оборудования и «роботов» для заводов.
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная коллаборация получилась у сервиса нейропоиска 🧘 Perplexity и корейского актёра Ли Джонджэ.
В промо-ролике обыграна сцена из «Игры в кальмара»: он попадает в ситуацию, где нужно срочно ответить на вопрос, а поисковик Poogle не помогает с ответом и только путает. На выручку сразу приходит Perplexity.
P.S. Это первый прямой укол Perplexity в сторону Google, хотя их продукт существует только по той причине, что Google даёт возможность пользоваться своим поиском сторонним сервисам.
В промо-ролике обыграна сцена из «Игры в кальмара»: он попадает в ситуацию, где нужно срочно ответить на вопрос, а поисковик Poogle не помогает с ответом и только путает. На выручку сразу приходит Perplexity.
P.S. Это первый прямой укол Perplexity в сторону Google, хотя их продукт существует только по той причине, что Google даёт возможность пользоваться своим поиском сторонним сервисам.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3😁3
Google совершает крупнейшую сделку в своей истории
Alphabet (материнская компания Google) официально подтвердили приобретение стартапа Wiz, который специализируется на облачной безопасности. Сумма получилась рекордная – 32 миллиарда долларов.
Самое удивительное, что при такой внушительной сумме Wiz сохранит автономию и будет работать со всеми облачными провайдерами, а сотрудники компании получат по 588 тысяч долларов компенсации на руки.
Что это за компания? Израильский стартап в области облачной безопасности, который разрабатывает платформу для анализа рисков облачной инфраструктуры. Причём это один из самых успешных стартапов в кибербезе, оценка которого составляла 16 миллиардов долларов до сделки. Теперь, благодаря Google, она практически удвоилась.
Зачем они Google? Главная причина покупки – отставание компании от Amazon (AWS) и Microsoft (Azure) на b2b рынке облачных технологий и кибербезопасности. Они надеются, что компетенции работников стартапа и их технологии помогут догнать конкурентов. Финансовые показатели, конечно, тоже сыграли свою роль – сейчас Wiz уже зарабатывает 700 миллионов долларов в год и находится на пути к миллиарду.
Alphabet (материнская компания Google) официально подтвердили приобретение стартапа Wiz, который специализируется на облачной безопасности. Сумма получилась рекордная – 32 миллиарда долларов.
Самое удивительное, что при такой внушительной сумме Wiz сохранит автономию и будет работать со всеми облачными провайдерами, а сотрудники компании получат по 588 тысяч долларов компенсации на руки.
Что это за компания? Израильский стартап в области облачной безопасности, который разрабатывает платформу для анализа рисков облачной инфраструктуры. Причём это один из самых успешных стартапов в кибербезе, оценка которого составляла 16 миллиардов долларов до сделки. Теперь, благодаря Google, она практически удвоилась.
Зачем они Google? Главная причина покупки – отставание компании от Amazon (AWS) и Microsoft (Azure) на b2b рынке облачных технологий и кибербезопасности. Они надеются, что компетенции работников стартапа и их технологии помогут догнать конкурентов. Финансовые показатели, конечно, тоже сыграли свою роль – сейчас Wiz уже зарабатывает 700 миллионов долларов в год и находится на пути к миллиарду.
👍2
Что Nvidia показали на конференции GTC 2025?
Компания продолжает двигаться в направлении, обозначенном на прошлом выступлении CEO Дженсена Хуанга в январе. На этот раз он вещал с трибун конференции GPU Technology Conference, но не о видеокартах (как можно было бы подумать исходя из названия мероприятия), а снова об искусственном интеллекте, благодаря которому Nvidia так стремительно росла последние годы.
Конкретики было меньше, чем философии. Главный посыл: ИИ больше не просто отвечает на вопросы, а становится «полноценным агентом», который думает, планирует и действует. Токены, некогда просто техническая конструкция, теперь стали «строительными блоками интеллекта». Они преобразуются в различные формы – музыку, слова, видео, научные исследования, химические вещества или белки. Такие системы позволят создать по-настоящему мультимодальный ИИ, который будет одинаково понимать любой тип информации.
Поэтому ставку компания делает на переход от обычных AI-помощников к «агентному ИИ» – искусственному интеллекту, который умеет рассуждать, строить планы и применять инструменты, как это делает человек. Кто такие агенты и с чем их есть – пока никто точно не знает, но ставку на них делают буквально все.
Следующим шагом Nvidia видит «физический ИИ», понимающий не только контекст диалога, но и физический мир: трение, инерцию и причинно-следственные связи. Именно такой интеллект ляжет в основу новых роботов и автономных систем.
Правда, для этого нужны колоссальные ресурсы, что вызывает стократный рост потребности в вычислениях. В качестве решения Nvidia предложили новую архитектуру Blackwell: два GPU на одном чипе и сверхэффективное масштабирование. Обещают, что Blackwell в 25 раз производительнее предшественника при тех же энергозатратах. А для задач, где ИИ нужно «думать», прирост достигает 40-крат. Правда, зная подход Nvidia к бенчмаркам и сравнению несравнимого, это ещё предстоит проверить.
На новой архитектуре выйдет и ряд новых ИИ-компьютеров DGX для корпоративного использования. Это «компьютеры эры искусственного интеллекта», разработанные для исследователей.
Компания показала, как строит целые «ИИ-фабрики» — центры обработки данных нового типа, которые вместо хранения и извлечения данных ориентированы на генерацию токенов, упомянутых выше. Управление этими фабриками осуществляет Nvidia Dynamo, открытая операционная система, которая управляет распределением задач, KV-кэшем и другими операционными аспектами ИИ-инфраструктуры.
Хуанг снова позиционировал робототехнику как «крупнейшую индустрию будущего». Экосистема Nvidia для разработки роботов включает платформу Omniverse для симуляции и генерации синтетических данных (Cosmos), физический движок Newton и Groot N1 — генеративную модель для гуманоидных роботов, которая теперь выложена в открытый доступ.
Компания продолжает двигаться в направлении, обозначенном на прошлом выступлении CEO Дженсена Хуанга в январе. На этот раз он вещал с трибун конференции GPU Technology Conference, но не о видеокартах (как можно было бы подумать исходя из названия мероприятия), а снова об искусственном интеллекте, благодаря которому Nvidia так стремительно росла последние годы.
Конкретики было меньше, чем философии. Главный посыл: ИИ больше не просто отвечает на вопросы, а становится «полноценным агентом», который думает, планирует и действует. Токены, некогда просто техническая конструкция, теперь стали «строительными блоками интеллекта». Они преобразуются в различные формы – музыку, слова, видео, научные исследования, химические вещества или белки. Такие системы позволят создать по-настоящему мультимодальный ИИ, который будет одинаково понимать любой тип информации.
Поэтому ставку компания делает на переход от обычных AI-помощников к «агентному ИИ» – искусственному интеллекту, который умеет рассуждать, строить планы и применять инструменты, как это делает человек. Кто такие агенты и с чем их есть – пока никто точно не знает, но ставку на них делают буквально все.
Следующим шагом Nvidia видит «физический ИИ», понимающий не только контекст диалога, но и физический мир: трение, инерцию и причинно-следственные связи. Именно такой интеллект ляжет в основу новых роботов и автономных систем.
Правда, для этого нужны колоссальные ресурсы, что вызывает стократный рост потребности в вычислениях. В качестве решения Nvidia предложили новую архитектуру Blackwell: два GPU на одном чипе и сверхэффективное масштабирование. Обещают, что Blackwell в 25 раз производительнее предшественника при тех же энергозатратах. А для задач, где ИИ нужно «думать», прирост достигает 40-крат. Правда, зная подход Nvidia к бенчмаркам и сравнению несравнимого, это ещё предстоит проверить.
На новой архитектуре выйдет и ряд новых ИИ-компьютеров DGX для корпоративного использования. Это «компьютеры эры искусственного интеллекта», разработанные для исследователей.
Компания показала, как строит целые «ИИ-фабрики» — центры обработки данных нового типа, которые вместо хранения и извлечения данных ориентированы на генерацию токенов, упомянутых выше. Управление этими фабриками осуществляет Nvidia Dynamo, открытая операционная система, которая управляет распределением задач, KV-кэшем и другими операционными аспектами ИИ-инфраструктуры.
Хуанг снова позиционировал робототехнику как «крупнейшую индустрию будущего». Экосистема Nvidia для разработки роботов включает платформу Omniverse для симуляции и генерации синтетических данных (Cosmos), физический движок Newton и Groot N1 — генеративную модель для гуманоидных роботов, которая теперь выложена в открытый доступ.
🔥4