Ритм (13.03.2025)
CR AI
Утренний #нейротрек
Сегодня слушаем «Ритм» – симфонию современного города, где каждый бит рассказывает историю о движении вперёд
Сегодня слушаем «Ритм» – симфонию современного города, где каждый бит рассказывает историю о движении вперёд
Искусственный интеллект – это просто пузырь?
У коллег из WSJ вышла статья, приуроченная к 25-летнему «юбилею» краха пузыря доткомов. Конечно, в контексте сегодняшнего дня – где появился новый потенциальный пузырь в виде технологий ИИ.
Аналогия оправдана – мы писали и про отсутствие ROI от внедрения ИИ, и про растущие на этом фоне год от года инвестиции в ИИ-стартапы (а только в прошлом году 8 из 10 крупнейших раундов привлечения инвестиций в мире достались ИИ-компаниям). Несмотря на отсутствие понимания, как именно внедрить искусственный интеллект и оправдать затраты на обучение и инференс моделей, рынок активно растёт.
Чего только стоят громкие заявления Сэма Альтмана, который, косплея Адама Ньюмана из WeWork, планирует в ближайшем будущем привлекать инвестиции уже не миллиардрами, но триллионами. И это на том фоне, что убыточной остаётся даже подписка за 200 долларов в месяц, а большая часть пользователей ChatGPT (да и других сервисов) пользуются бесплатными версиями продуктов.
В статье WSJ пишут о «хороших» и «плохих» пузырях. В рамках первых финансирование получают революционные технологии, которые по итогу провоцируют трансформацию рынка (пускай и не так быстро, как этого ожидают отдельные компании и инвесторы). Только вряд ли «хорошим» посчитают пузырь компании и государства, которые тратят огромные деньги на проекты по развитию ИИ, делая ставку на будущий рост производительности труда и «просачивание» технологии в другие сферы вместе с ростом спроса.
Множество дата-центров строятся только для того, чтобы компании могли увеличивать число параметров моделей ИИ, которые в свою очередь нужно выпускать для того, чтобы не отстать в технологической гонке и не потерять пользователей на конкурентном и (пока ещё) переоценённом рынке без понятных способов монетизации. Стартапы сейчас думают исключительно о технологии и продуктах, в которые эту технологию можно будет красиво упаковать – а дальше пользователи и бизнес должны уже сами придумывать, как и что с этим сделать. Так появился, например, Operator.
На этом фоне куда более взвешенным кажется подход российских компаний. Тот же Яндекс точечно внедряет ИИ в продукты своей экосистемы, делая ставку не на агентные системы (по крайней мере, пока), а на ИИ как инструмент, облегчающий жизнь пользователям. Делается это в рамках поиска, работы с информацией в Интернете, редактуры текстов. Коллеги недавно писали про УТП Яндекса, который отдаёт приоритет не технологии в вакууме, а опыту пользователя, взаимодействующего с ней.
Пока рано говорить однозначно о том, есть ли пузырь на рынке ИИ или он только надувается. Но можно согласиться с тем, что полученные сейчас инфраструктура и технологии останутся и в перспективе действительно смогут повысить производительность труда во всём мире. Только когда это будет? Одно радует – производительность труда отдельных людей, генерирующих тексты и картинки, ИИ повышает уже сейчас. И над монетизацией технологии пользователям ломать голову не нужно.
У коллег из WSJ вышла статья, приуроченная к 25-летнему «юбилею» краха пузыря доткомов. Конечно, в контексте сегодняшнего дня – где появился новый потенциальный пузырь в виде технологий ИИ.
Аналогия оправдана – мы писали и про отсутствие ROI от внедрения ИИ, и про растущие на этом фоне год от года инвестиции в ИИ-стартапы (а только в прошлом году 8 из 10 крупнейших раундов привлечения инвестиций в мире достались ИИ-компаниям). Несмотря на отсутствие понимания, как именно внедрить искусственный интеллект и оправдать затраты на обучение и инференс моделей, рынок активно растёт.
Чего только стоят громкие заявления Сэма Альтмана, который, косплея Адама Ньюмана из WeWork, планирует в ближайшем будущем привлекать инвестиции уже не миллиардрами, но триллионами. И это на том фоне, что убыточной остаётся даже подписка за 200 долларов в месяц, а большая часть пользователей ChatGPT (да и других сервисов) пользуются бесплатными версиями продуктов.
В статье WSJ пишут о «хороших» и «плохих» пузырях. В рамках первых финансирование получают революционные технологии, которые по итогу провоцируют трансформацию рынка (пускай и не так быстро, как этого ожидают отдельные компании и инвесторы). Только вряд ли «хорошим» посчитают пузырь компании и государства, которые тратят огромные деньги на проекты по развитию ИИ, делая ставку на будущий рост производительности труда и «просачивание» технологии в другие сферы вместе с ростом спроса.
Множество дата-центров строятся только для того, чтобы компании могли увеличивать число параметров моделей ИИ, которые в свою очередь нужно выпускать для того, чтобы не отстать в технологической гонке и не потерять пользователей на конкурентном и (пока ещё) переоценённом рынке без понятных способов монетизации. Стартапы сейчас думают исключительно о технологии и продуктах, в которые эту технологию можно будет красиво упаковать – а дальше пользователи и бизнес должны уже сами придумывать, как и что с этим сделать. Так появился, например, Operator.
На этом фоне куда более взвешенным кажется подход российских компаний. Тот же Яндекс точечно внедряет ИИ в продукты своей экосистемы, делая ставку не на агентные системы (по крайней мере, пока), а на ИИ как инструмент, облегчающий жизнь пользователям. Делается это в рамках поиска, работы с информацией в Интернете, редактуры текстов. Коллеги недавно писали про УТП Яндекса, который отдаёт приоритет не технологии в вакууме, а опыту пользователя, взаимодействующего с ней.
Пока рано говорить однозначно о том, есть ли пузырь на рынке ИИ или он только надувается. Но можно согласиться с тем, что полученные сейчас инфраструктура и технологии останутся и в перспективе действительно смогут повысить производительность труда во всём мире. Только когда это будет? Одно радует – производительность труда отдельных людей, генерирующих тексты и картинки, ИИ повышает уже сейчас. И над монетизацией технологии пользователям ломать голову не нужно.
🔥1😁1
Вышел новый GigaChat
С релизом GigaChat 2.0 чуда не произошло. Конкретики в анонсе минимум, зато есть утверждение, что эта модель «сильнейшая на русском языке». Основанием стал бенчмарк, где нет моделей Яндекса (да и кучи других).
Можно похвалить команду за увеличение контекстного окна – точный размер токенов не говорят, но теперь вроде как модель воспринимает 200 страниц текста против 48 у предыдущей версии.
Попробовать GigaChat 2 можно в кабинете разработчика. Удручает низкая скорость вывода токенов. Есть надежда, что она увеличится после появления версии 2 на сайте. Сервис бесплатный – пользоваться моделью может любой желающий.
Что с тестами? Задачу из курса алгебры 9 класса он решить не смог. Yandex GPT 5 Pro и Gemma справились. Хотя, возможно, это просто случайность, потому что на другой задаче дали неверный ответ уже все 3 модели – предметы из 9 класса пока даются им с трудом.
С просьбой написать код калькулятора на Питоне он справился не с первого раза – сначала вообще не смог вывести код полностью, потому что не хватило токенов, потом пытался исправить ошибку, и только после просьбы написать всё заново у него получилось.
С изменением стиля, написанием и сокращением текста работает неплохо, хотя не всегда следует задаче, начинает галлюцинировать и придумывать текст от себя. Переводить с английского и обратно умеет – результат не слишком художественный, но смысл сохраняется даже у сложных предложений.
Сейчас главный минус GigaChat – отсутствие доступа в Интернет, из-за чего он имеет весьма ограниченное понимание мира при ответах на вопросы и работе с данными. Возможно, для редактуры и переписывания текста это неплохой инструмент, но пока не совсем понятно, как ещё его использовать и зачем.
С релизом GigaChat 2.0 чуда не произошло. Конкретики в анонсе минимум, зато есть утверждение, что эта модель «сильнейшая на русском языке». Основанием стал бенчмарк, где нет моделей Яндекса (да и кучи других).
Можно похвалить команду за увеличение контекстного окна – точный размер токенов не говорят, но теперь вроде как модель воспринимает 200 страниц текста против 48 у предыдущей версии.
Попробовать GigaChat 2 можно в кабинете разработчика. Удручает низкая скорость вывода токенов. Есть надежда, что она увеличится после появления версии 2 на сайте. Сервис бесплатный – пользоваться моделью может любой желающий.
Что с тестами? Задачу из курса алгебры 9 класса он решить не смог. Yandex GPT 5 Pro и Gemma справились. Хотя, возможно, это просто случайность, потому что на другой задаче дали неверный ответ уже все 3 модели – предметы из 9 класса пока даются им с трудом.
С просьбой написать код калькулятора на Питоне он справился не с первого раза – сначала вообще не смог вывести код полностью, потому что не хватило токенов, потом пытался исправить ошибку, и только после просьбы написать всё заново у него получилось.
С изменением стиля, написанием и сокращением текста работает неплохо, хотя не всегда следует задаче, начинает галлюцинировать и придумывать текст от себя. Переводить с английского и обратно умеет – результат не слишком художественный, но смысл сохраняется даже у сложных предложений.
Сейчас главный минус GigaChat – отсутствие доступа в Интернет, из-за чего он имеет весьма ограниченное понимание мира при ответах на вопросы и работе с данными. Возможно, для редактуры и переписывания текста это неплохой инструмент, но пока не совсем понятно, как ещё его использовать и зачем.
👍2🔥1
ИИ объединяет
МТС и Kokoc Group решили заключить стратегическое партнёрство, и одна из причин – ИИ. Они собираются добавить искусственный интеллект и другие инструменты от МТС AdTech на платформу Vitamin tools, которая нужна для управления рекламными компаниями.
Главная задумка – дать пользователям возможность автоматической генерации и модерации рекламных креативов в Telegram Ads. Хотя, конечно, ещё важнее в данном случае наработки МТС в машинном обучении и больших данных.
Это общий тренд по рынку – на других рекламных площадках в России уже есть похожие функции. В Директе, например, можно генерировать объявление целиком вместе с картинкой. И вроде бы сделанные ИИ объявления на 5% эффективнее обычных… Но нужно понимать, что эта цифра «в среднем по больнице».
МТС и Kokoc Group решили заключить стратегическое партнёрство, и одна из причин – ИИ. Они собираются добавить искусственный интеллект и другие инструменты от МТС AdTech на платформу Vitamin tools, которая нужна для управления рекламными компаниями.
Главная задумка – дать пользователям возможность автоматической генерации и модерации рекламных креативов в Telegram Ads. Хотя, конечно, ещё важнее в данном случае наработки МТС в машинном обучении и больших данных.
Это общий тренд по рынку – на других рекламных площадках в России уже есть похожие функции. В Директе, например, можно генерировать объявление целиком вместе с картинкой. И вроде бы сделанные ИИ объявления на 5% эффективнее обычных… Но нужно понимать, что эта цифра «в среднем по больнице».
👍1
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini, оптимизированным для конкретных задач. Готовые шаблоны должны помочь в планировании, карьерном росте, кодинге и учёбе. Прикольно, хотя всего того же можно было добиться и раньше с помощью инструкций в чате.
2) Deep Research тоже теперь доступен всем и работает на обновлённой модели Gemini. Это сервис для углублённого поиска информации в Интернете и подготовке «отчётов» на заданную тему.
3) Интеграция с сервисами Google была доступна и ранее – Gemini могла искать информацию в поиске, Ютубе, музыке и так далее. Функция обновилась, приобрела название Personalization и начала видеть историю поисковых запросов пользователей. Это должно сделать ответы Gemini более персонализированными и релевантными. Как и в Алисе Яндекса, можно спрашивать погоду, последние новости и получать более «личную» выдачу.
4) Отдельно стоит отметить экспериментальную версию Gemini 2.0 Flash с мультимодальными возможностями, позволяющую редактировать изображения прямо в чате. Можно заменить фон, добавить надпись, сделать раскадровку, изменить цвет одежды, прическу и т.д. – получается не слишком деструктивный редактор, который вносит изменения точечно. Функция пока экспериментальная, но в будущем, вероятно, заменит привычную обработку фотографий.
5) Не забыли про разработчиков – теперь можно просто загрузить скриншот приложения в Gemini in Android Studio и конвертировать его в код. Это должно облегчить прототипирование и разработку под Android.
P.S. Кратко стоит упомянуть про Gemini Robotics. Если верить бенчмаркам, это лучшая моделью для робототехники. Роботы теперь могут общаться, анализировать ситуацию, делать даже те задачи, которым их не обучали, и совершать требующие мелкой моторики действия.
👍1
Аишка
Уже немного надоело писать про Google, но они сейчас главные ньюсмейкеры в мире ИИ. Компания представила очередное масштабное обновление экосистемы Gemini. 1) Теперь все аккаунты, даже без подписки, получают доступ к Gems — персонализированным версиям Gemini…
Если говорить о полезных возможностях применения новой мультимодальной версии Gemini для тех, кто работает с медиа, то вот несколько (помимо обычной генерации картинок, конечно, что и так умеют другие сервисы).
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
• Можно просить её генерировать графику в нужном стиле – постеры, баннеры, логотипы и так далее.
• Раскрашивать и восстанавливать изображения (правда, пока работает не идеально)
• Делать раскадровки роликов или покадровые истории на заданную тему
• Переделывать неудачные фотографии. Манипуляции пока работают только на больших разрешениях — добавить шапку можно, а вот логотип компании в угол картинки нет, модели не хватает информации и начинаются искажения с галлюцинациями.
🔥1