Forwarded from Content Review
Сегодня всем нам хотелось бы услышать, что прошедший год стал самым сложным, и дальше будет легче. Мы все эти годы старались не давать ложных надежд, и если посмотреть на тексты почившей в Бозе рубрики «утренняя реплика», то, в принципе, обо всем мы уже предупреждали. И, увы, не можем сказать, что следующий год (годы) будет легче. Нет, все будет только хуже.
Вне зависимости от геополитической ситуации, ничего хорошего от наших депутатов и чиновников ждать не стоит. Более того, если в прошлом их деятельность хоть как-то была прогнозируема, а инициативы являлись скорее способом прощупать пределы горизонта, то черная дыра, раскрывшаяся в августе, показала, что если горизонт и был нащупан, то это горизонт событий. За которым, как известно, неведомое нечто, никто оттуда пока еще не возвращался.
Сообразно изменилась и риторика нашего профильного ведомства. Все хорошо, надои растут, приступаем к посеву озимых. На этом фоне депутат, открывший для себя приставку на AOSP с накатанным на нее APK с сервисом облачных игр, и упорно называющий ее игровой консолью – меньшее из зол. Куда мрачнее выглядят те, кто стоит за спиной и строчит очередные удивительные инициативы. Ведь у них еще столько разных идей.
С другой стороны, во весь рост разворачивается кризис доверия всех ко всем. Декабрь 2024 года стал если не рекордным по количеству хайпожорских интерпретаций информационных поводов, то точно вехой в этом направлении. Если раньше официальные информационные агентства еще хоть как-то держали себя в руках, то теперь формулировки, искажающие суть события, проникли и в эти ленты. Самое страшное заключается в том, что согласно закону о СМИ, что прошло по лентам официальных агентств, то является, условно говоря, истиной. Является ли истиной утверждение «IP телефонию запретили»? Вопрос риторический. Так и хочется крикнуть: «только не ешь желтый снег». Но чем дальше, тем больше понимаем, что это крик в пустоту.
Но если вам кажется, что это просто у нас тут все на взводе, то вы глубоко ошибаетесь. Нейросети уже развились до достаточного уровня, чтобы наполнить сеть текстами с той или иной степенью галюцинаций. Судя по тому, как радостно вещают на профильных конференциях о том, как здорово использовать GPT (не важно чей) в контентной работе, нас ждет масса удивительных открытий, а скандалы, связанные с дезинформацией из-за того, что какой-то журналист подсел на нейросервисы, станут обычным делом.
В результате медиапространство все больше будет напоминать островное государство, которое в виде небольших островков зиждется в огромном океане сгенерированных текстов, где правда и вымысел густо перемешаны, и верить, увы, никому нельзя. Персонаж «Мастера и Маргариты», утверждавший, что не бывает «второй свежести», потеряет свой шарм и актуальность: нас ждут тексты третьей и четвертой свежести, прошедшие через несколько процессов «обогащения», пересказа и обработки GPT. Анекдот про Пушкина, сидящего на столбе и всех посылающего известно куда, перестанет быть анекдотом.
Вглядываясь в густой туман галюционирующих нейросетей и видя в этом тумане лишь горящие глаза депутатов, сложно сохранять оптимизм. Но мы все же считаем, что нам с вами очень повезло. Мы находимся в самом центре стремительно меняющегося мира. Нейросети – это не только галюцинации, но и уникальные инструменты, сильно облегчающие нам жизнь. А депутаты – ну, в 90-е были и похуже. Ничего, пережили. И этих переживем.
Так что выше нос. Все будет ровно. Будем держаться вместе, так победим. Этот год будет до ужаса интересным. С праздником.
Вне зависимости от геополитической ситуации, ничего хорошего от наших депутатов и чиновников ждать не стоит. Более того, если в прошлом их деятельность хоть как-то была прогнозируема, а инициативы являлись скорее способом прощупать пределы горизонта, то черная дыра, раскрывшаяся в августе, показала, что если горизонт и был нащупан, то это горизонт событий. За которым, как известно, неведомое нечто, никто оттуда пока еще не возвращался.
Сообразно изменилась и риторика нашего профильного ведомства. Все хорошо, надои растут, приступаем к посеву озимых. На этом фоне депутат, открывший для себя приставку на AOSP с накатанным на нее APK с сервисом облачных игр, и упорно называющий ее игровой консолью – меньшее из зол. Куда мрачнее выглядят те, кто стоит за спиной и строчит очередные удивительные инициативы. Ведь у них еще столько разных идей.
С другой стороны, во весь рост разворачивается кризис доверия всех ко всем. Декабрь 2024 года стал если не рекордным по количеству хайпожорских интерпретаций информационных поводов, то точно вехой в этом направлении. Если раньше официальные информационные агентства еще хоть как-то держали себя в руках, то теперь формулировки, искажающие суть события, проникли и в эти ленты. Самое страшное заключается в том, что согласно закону о СМИ, что прошло по лентам официальных агентств, то является, условно говоря, истиной. Является ли истиной утверждение «IP телефонию запретили»? Вопрос риторический. Так и хочется крикнуть: «только не ешь желтый снег». Но чем дальше, тем больше понимаем, что это крик в пустоту.
Но если вам кажется, что это просто у нас тут все на взводе, то вы глубоко ошибаетесь. Нейросети уже развились до достаточного уровня, чтобы наполнить сеть текстами с той или иной степенью галюцинаций. Судя по тому, как радостно вещают на профильных конференциях о том, как здорово использовать GPT (не важно чей) в контентной работе, нас ждет масса удивительных открытий, а скандалы, связанные с дезинформацией из-за того, что какой-то журналист подсел на нейросервисы, станут обычным делом.
В результате медиапространство все больше будет напоминать островное государство, которое в виде небольших островков зиждется в огромном океане сгенерированных текстов, где правда и вымысел густо перемешаны, и верить, увы, никому нельзя. Персонаж «Мастера и Маргариты», утверждавший, что не бывает «второй свежести», потеряет свой шарм и актуальность: нас ждут тексты третьей и четвертой свежести, прошедшие через несколько процессов «обогащения», пересказа и обработки GPT. Анекдот про Пушкина, сидящего на столбе и всех посылающего известно куда, перестанет быть анекдотом.
Вглядываясь в густой туман галюционирующих нейросетей и видя в этом тумане лишь горящие глаза депутатов, сложно сохранять оптимизм. Но мы все же считаем, что нам с вами очень повезло. Мы находимся в самом центре стремительно меняющегося мира. Нейросети – это не только галюцинации, но и уникальные инструменты, сильно облегчающие нам жизнь. А депутаты – ну, в 90-е были и похуже. Ничего, пережили. И этих переживем.
Так что выше нос. Все будет ровно. Будем держаться вместе, так победим. Этот год будет до ужаса интересным. С праздником.
🔥2
Яндекс Клавиатура пробует поздравить собеседника за вас
В приложение добавили кнопку «Поздравить», которая подключает YandexGPT и генерит текст поздравления в заданном стиле
Нашлась замена открыткам с блестками в Вотсапе?
В приложение добавили кнопку «Поздравить», которая подключает YandexGPT и генерит текст поздравления в заданном стиле
Нашлась замена открыткам с блестками в Вотсапе?
😁2🤨1👻1
Настало время подводить итоги 2024 года в сфере ИИ. Поговорить об этом нам помогут 2 доклада о положении вещей в мире, и 1 — в России (подробности об источниках в конце)
2024 год стал поворотной точкой в развитии искусственного интеллекта, что подтверждает почти 100 миллиардов долларов инвестиций в компании этого сектора. Лидером года стала OpenAI: создатель ChatGPT привлек 6,6 миллиарда долларов, а её оценка в октябре достигла 157 миллиардов. Генеративные модели, такие как GPT-4o от OpenAI, Gemini от Google, a также Claude, Deepseek и так далее задали новый стандарт качества — эти системы не только обрабатывают текст, но и работают с видео, аудио и другими мультимодальными данными в реальном времени. Google даже считают развитие мультимодальных моделей главным трендом 2025 года.
Интересно, что средняя компания, занимающаяся ИИ и достигшая более 30 миллионов долларов годового дохода, потратила на это всего 20 месяцев (по сравнению с 65 месяцами для столь же перспективных SaaS-компаний).
ИИ в реальных отраслях
Технологии искусственного интеллекта продолжили находить применение в самых разных сферах. В здравоохранении ИИ помогал разрабатывать персонализированные терапии, в образовании улучшал образовательные программы, а в производстве оптимизировал рабочие процессы. Финансовые компании автоматизировали операции с помощью ИИ, а медиаиндустрия использовала технологии для создания контента. Рынок наполнился специализированными решениями: от AI-powered developer tools для программистов до legal tech для юристов.
Рост конкуренции и технологическая гонка
Доминирование NVIDIA в производстве чипов для ИИ остаётся непреложным, однако компании Google (чип Axion), Meta (экстремисты в РФ, чип MTIA) и Amazon (чип Trainium2) активно наращивают производство своих решений. Хотя рыночная капитализация NVIDIA достигла 3 триллионов долларов как раз за счёт GPU для тренировки ИИ-моделей, и потеря этого рынка будет для компании очень неприятным ударом. В то же время модели Gemini 2.0, Claude 3.5 Sonnet и Grok 2 догоняют GPT-4. Правда, выпущенная под Новый год GPT o3 смогла удивить всех и на какое-то время подтвердить лидерство OpenAI, но Google и Deepseek уже дышат в спину, выпустив следом свои reasoning решения.
Регулирование
Вопросы регулирования и безопасности технологий выходят на первый план. Государства обсуждают новые правила защиты данных, предотвращения предвзятости алгоритмов и минимизации рисков от злоупотребления ИИ. Компании сталкиваются с растущим вниманием к вопросам ответственности за действия ИИ-систем.
Проблемы и риски по итогам 2024
Искусственный интеллект сталкивается с рядом вызовов в области безопасности, этики и экономики. Модели ИИ требуют более сложных протоколов защиты, а их использование сопровождается этическими дилеммами — предвзятостью, вопросами авторских прав и рисками дезинформации. Особую тревогу вызывают дипфейки, используемые в мошенничестве. В экономике ИИ порождает высокие расходы, нехватку кадров и вопросы о рентабельности, а на международной арене усиливается борьба между США и Китаем за технологическое лидерство.
Ситуация в России
В России развитие ИИ идёт медленнее, чем в США или Китае. Исследования показывают, что уровень готовности страны к внедрению ИИ оценивается в 3,5 из 10 баллов. Лидерами внедрения остаются ИКТ, финансы, ТЭК и высшее образование. А вот культура, спорт и социальная сфера, только начинают этот путь. Основные барьеры — нехватка кадров, недостаток финансирования и низкая осведомлённость о возможностях технологий. Тем не менее, Россия может войти в пятёрку стран лидеров по технологиям ИИ. В 2024 году 43% организаций уже использовали его в той или иной форме, а 36% из них получили существенный или многократный экономический эффект.
Источники: State of AI Report от Air Street Capital, Global AI Report от Rackspace и доклад о готовности приоритетных отраслей российской экономики к внедрению искусственного интеллекта в 2024 году от Национального центра развития искусственного интеллекта при Правительстве РФ.
2024 год стал поворотной точкой в развитии искусственного интеллекта, что подтверждает почти 100 миллиардов долларов инвестиций в компании этого сектора. Лидером года стала OpenAI: создатель ChatGPT привлек 6,6 миллиарда долларов, а её оценка в октябре достигла 157 миллиардов. Генеративные модели, такие как GPT-4o от OpenAI, Gemini от Google, a также Claude, Deepseek и так далее задали новый стандарт качества — эти системы не только обрабатывают текст, но и работают с видео, аудио и другими мультимодальными данными в реальном времени. Google даже считают развитие мультимодальных моделей главным трендом 2025 года.
Интересно, что средняя компания, занимающаяся ИИ и достигшая более 30 миллионов долларов годового дохода, потратила на это всего 20 месяцев (по сравнению с 65 месяцами для столь же перспективных SaaS-компаний).
ИИ в реальных отраслях
Технологии искусственного интеллекта продолжили находить применение в самых разных сферах. В здравоохранении ИИ помогал разрабатывать персонализированные терапии, в образовании улучшал образовательные программы, а в производстве оптимизировал рабочие процессы. Финансовые компании автоматизировали операции с помощью ИИ, а медиаиндустрия использовала технологии для создания контента. Рынок наполнился специализированными решениями: от AI-powered developer tools для программистов до legal tech для юристов.
Рост конкуренции и технологическая гонка
Доминирование NVIDIA в производстве чипов для ИИ остаётся непреложным, однако компании Google (чип Axion), Meta (экстремисты в РФ, чип MTIA) и Amazon (чип Trainium2) активно наращивают производство своих решений. Хотя рыночная капитализация NVIDIA достигла 3 триллионов долларов как раз за счёт GPU для тренировки ИИ-моделей, и потеря этого рынка будет для компании очень неприятным ударом. В то же время модели Gemini 2.0, Claude 3.5 Sonnet и Grok 2 догоняют GPT-4. Правда, выпущенная под Новый год GPT o3 смогла удивить всех и на какое-то время подтвердить лидерство OpenAI, но Google и Deepseek уже дышат в спину, выпустив следом свои reasoning решения.
Регулирование
Вопросы регулирования и безопасности технологий выходят на первый план. Государства обсуждают новые правила защиты данных, предотвращения предвзятости алгоритмов и минимизации рисков от злоупотребления ИИ. Компании сталкиваются с растущим вниманием к вопросам ответственности за действия ИИ-систем.
Проблемы и риски по итогам 2024
Искусственный интеллект сталкивается с рядом вызовов в области безопасности, этики и экономики. Модели ИИ требуют более сложных протоколов защиты, а их использование сопровождается этическими дилеммами — предвзятостью, вопросами авторских прав и рисками дезинформации. Особую тревогу вызывают дипфейки, используемые в мошенничестве. В экономике ИИ порождает высокие расходы, нехватку кадров и вопросы о рентабельности, а на международной арене усиливается борьба между США и Китаем за технологическое лидерство.
Ситуация в России
В России развитие ИИ идёт медленнее, чем в США или Китае. Исследования показывают, что уровень готовности страны к внедрению ИИ оценивается в 3,5 из 10 баллов. Лидерами внедрения остаются ИКТ, финансы, ТЭК и высшее образование. А вот культура, спорт и социальная сфера, только начинают этот путь. Основные барьеры — нехватка кадров, недостаток финансирования и низкая осведомлённость о возможностях технологий. Тем не менее, Россия может войти в пятёрку стран лидеров по технологиям ИИ. В 2024 году 43% организаций уже использовали его в той или иной форме, а 36% из них получили существенный или многократный экономический эффект.
Источники: State of AI Report от Air Street Capital, Global AI Report от Rackspace и доклад о готовности приоритетных отраслей российской экономики к внедрению искусственного интеллекта в 2024 году от Национального центра развития искусственного интеллекта при Правительстве РФ.
👍3
В обновлении iOS 18.1 появилась возможность получать короткие сообщения с новостными сводками, которые готовил искусственный интеллект. Однако практически сразу к этим сводкам возникли вопросы у тех, чья информация в них использовалась. В декабре 2024 года BBC возмутилась тем, что Apple разослал новостное уведомление о том, что Луиджи Манджоне, убивший генерального директора United Healthcare, застрелился. Это было абсолютной дезинформацией, но BBC возмутило то, что Apple подписал сводку брендом BBC. Выходило так, как будто это BBC распространяет недостоверную информацию.
Apple не стала реагировать, сделав вид, что это просто случайность. Но журналисты продолжили следить за тем, как AI Apple работает с информацией. Выяснилось, что Apple продолжает рассылать новостные уведомления с враньем, подписывая его как информацию от BBC.
В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
Главной проблемой в BBC и других медиа считают не то, что Apple коряво обрабатывает доступные ей новостные источники, а то, что она подписывает эту информацию чужим брендом. Пользователь получает уведомление от условного BBC Sport, хотя BBC Sport не имеет никакого отношения к этой информации, это всего лишь источник, на основе которого ИИ Apple сделал какие-то собственные выводы.
BBC призывает отключить Apple AI до тех пор, пока ИИ не научится обрабатывать информацию так, чтобы не превращать ее в дезинформацию. Apple отмалчивается. Тем временем все больше медиа прописывают в robot.txt прямой запрет нейросетям использовать их контент для обучения и использования в обогащенных ответах на поисковые запросы.
Apple не стала реагировать, сделав вид, что это просто случайность. Но журналисты продолжили следить за тем, как AI Apple работает с информацией. Выяснилось, что Apple продолжает рассылать новостные уведомления с враньем, подписывая его как информацию от BBC.
В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
Главной проблемой в BBC и других медиа считают не то, что Apple коряво обрабатывает доступные ей новостные источники, а то, что она подписывает эту информацию чужим брендом. Пользователь получает уведомление от условного BBC Sport, хотя BBC Sport не имеет никакого отношения к этой информации, это всего лишь источник, на основе которого ИИ Apple сделал какие-то собственные выводы.
BBC призывает отключить Apple AI до тех пор, пока ИИ не научится обрабатывать информацию так, чтобы не превращать ее в дезинформацию. Apple отмалчивается. Тем временем все больше медиа прописывают в robot.txt прямой запрет нейросетям использовать их контент для обучения и использования в обогащенных ответах на поисковые запросы.
🔥3
OpenAI не хватает Интернета? Релиз GPT-5 откладывается
OpenAI продолжает разработку больших языковых моделей. GPT-5 (с кодовым названием Orion), со слов генерального директора Сэма Альтмана, может быть похожа на «виртуальный мозг» с «более глубокими мыслительными способностями» и станет значительно более мощной, функциональной и «разумной», чем GPT-4. Однако на пути к созданию этой модели компания столкнулась с множеством препятствий, которые могут как затормозить выпуск модели, так и поставить под вопрос её эффективность.
Создание моделей уровня GPT-5 требует колоссальных вычислительных мощностей. Шестимесячная тренировка может обойтись OpenAI примерно в 500 миллионов долларов. Общие затраты на создание и запуск модели могут превысить миллиард долларов (и это при том, что за 2024 год они привлекли в сумме 6,6 миллиардов долларов инвестиций).
Ещё одна важная проблема — нехватка качественных данных для обучения. OpenAI уже использовала большую часть доступной информации из открытых источников. Они нанимают специалистов в программировании, математике, физике и так далее, чтобы те создавали синтетические данные, расписывали пошагово решение задач и создавали рассуждения, на которых обучают модель. Этот подход, хотя и эффективный, очень дорогой и трудоемкий. Коллеги из WSJ пишут, что «в мире может не хватить данных, чтобы сделать Orion достаточно умным».
Поиск и создание данных для обучения Orion — одна из ключевых проблем, с которыми сталкивается OpenAI. Ещё одна проблема — внутренняя конкуренция за ресурсы. Например, Sora, генератор видео на основе ИИ, развивается параллельно с Orion и отбирает часть команды и мощностей.
Внутренние проблемы компании также усугубляют ситуацию. Уход соучредителей, ведущих инженеров и даже временное увольнение Сэма Альтмана создали напряжённую атмосферу в команде.
Несмотря на все трудности, потенциал у GPT-5 остаётся впечатляющим. Ожидается, что эта версия будет многократно мощнее GPT-4. Помимо большего числа параметров у модели будет улучшенная память — она сможет запоминать больше информации из предыдущих взаимодействий.
Однако конкуренция в сфере ИИ растёт. Те же Google и Anthropic активно разрабатывают свои языковые модели. Илон Маск недавно анонсировал Grok 3, претрейн которого стал самым масштабным в истории: более 200 миллионов часов работы H100 GPU, в 10 раз больше Grok 2.
OpenAI продолжает разработку больших языковых моделей. GPT-5 (с кодовым названием Orion), со слов генерального директора Сэма Альтмана, может быть похожа на «виртуальный мозг» с «более глубокими мыслительными способностями» и станет значительно более мощной, функциональной и «разумной», чем GPT-4. Однако на пути к созданию этой модели компания столкнулась с множеством препятствий, которые могут как затормозить выпуск модели, так и поставить под вопрос её эффективность.
Создание моделей уровня GPT-5 требует колоссальных вычислительных мощностей. Шестимесячная тренировка может обойтись OpenAI примерно в 500 миллионов долларов. Общие затраты на создание и запуск модели могут превысить миллиард долларов (и это при том, что за 2024 год они привлекли в сумме 6,6 миллиардов долларов инвестиций).
Ещё одна важная проблема — нехватка качественных данных для обучения. OpenAI уже использовала большую часть доступной информации из открытых источников. Они нанимают специалистов в программировании, математике, физике и так далее, чтобы те создавали синтетические данные, расписывали пошагово решение задач и создавали рассуждения, на которых обучают модель. Этот подход, хотя и эффективный, очень дорогой и трудоемкий. Коллеги из WSJ пишут, что «в мире может не хватить данных, чтобы сделать Orion достаточно умным».
Поиск и создание данных для обучения Orion — одна из ключевых проблем, с которыми сталкивается OpenAI. Ещё одна проблема — внутренняя конкуренция за ресурсы. Например, Sora, генератор видео на основе ИИ, развивается параллельно с Orion и отбирает часть команды и мощностей.
Внутренние проблемы компании также усугубляют ситуацию. Уход соучредителей, ведущих инженеров и даже временное увольнение Сэма Альтмана создали напряжённую атмосферу в команде.
Несмотря на все трудности, потенциал у GPT-5 остаётся впечатляющим. Ожидается, что эта версия будет многократно мощнее GPT-4. Помимо большего числа параметров у модели будет улучшенная память — она сможет запоминать больше информации из предыдущих взаимодействий.
Однако конкуренция в сфере ИИ растёт. Те же Google и Anthropic активно разрабатывают свои языковые модели. Илон Маск недавно анонсировал Grok 3, претрейн которого стал самым масштабным в истории: более 200 миллионов часов работы H100 GPU, в 10 раз больше Grok 2.
1🔥2❤1🍾1
В Китае создали экспериментальную сеть для быстрой передачи данных, обучения ИИ и не только
Китай завершил этап создания экспериментальной суперсети CENI (China Environment for Network Innovations) — уникальной платформы для тестирования технологий интернета будущего. Это масштабный национальный проект, который объединяет инновационные разработки в области оптической связи, детерминированных сетей и больших данных.
CENI была запущена в 2021 году под руководством Университета Цинхуа с целью стать «песочницей» для испытания технологий, способствующих созданию интернета нового поколения. Ученые планируют использовать её для проверки устойчивости систем к кибератакам, оптимизации передачи данных и разработки новых бизнес-моделей.
Сегодня сеть охватывает 40 ведущих университетов Китая, крупнейшие города и 13 провинций, а её протяжённость — 13000 километров. В ближайшем будущем планируется расширить сеть и увеличить количество подключенных вузов и компаний до 100.
CENI основана на передовых технологиях, обеспечивающих рекордные показатели передачи данных, нулевую потерю пакетов и задержку менее 20 микросекунд даже при пиковой нагрузке. Она способна передавать данные на расстояние более 2000 километров без необходимости в усилителях сигнала. По словам Лю Юньцзе, одного из главных разработчиков сети, её можно сравнить с «высокоскоростной железной дорогой для компьютеров», обеспечивающей стабильную передачу больших данных.
Новая сеть станет основой для обучения моделей ИИ, требующих обработки огромных массивов данных, создания промышленных интернет-приложений, разработки технологий для «умных городов» и формирования единой вычислительной инфраструктуры страны. В ходе эксперимента удалось с точностью до сантиметров и без задержек контролировать робота в 500 километрах от отеля, где был оператор.
CENI — не только инструмент укрепления кибербезопасности, но и ключевой элемент для реализации стратегии «Данные с востока — вычисления на западе», направленной на передачу данных из восточных регионов Китая в западные центры обработки. Это позволяет использовать возобновляемую энергию в ЦОДах, сократить затраты и улучшить экологические показатели. Также CENI — часть интегрированной национальной вычислительной сети, которая должна стать основой для «цифрового Китая». В долгосрочной перспективе эта инфраструктура должна ускорить развитие ИИ, поддержать рост цифровой экономики и повысить глобальную конкурентоспособность страны.
Китай завершил этап создания экспериментальной суперсети CENI (China Environment for Network Innovations) — уникальной платформы для тестирования технологий интернета будущего. Это масштабный национальный проект, который объединяет инновационные разработки в области оптической связи, детерминированных сетей и больших данных.
CENI была запущена в 2021 году под руководством Университета Цинхуа с целью стать «песочницей» для испытания технологий, способствующих созданию интернета нового поколения. Ученые планируют использовать её для проверки устойчивости систем к кибератакам, оптимизации передачи данных и разработки новых бизнес-моделей.
Сегодня сеть охватывает 40 ведущих университетов Китая, крупнейшие города и 13 провинций, а её протяжённость — 13000 километров. В ближайшем будущем планируется расширить сеть и увеличить количество подключенных вузов и компаний до 100.
CENI основана на передовых технологиях, обеспечивающих рекордные показатели передачи данных, нулевую потерю пакетов и задержку менее 20 микросекунд даже при пиковой нагрузке. Она способна передавать данные на расстояние более 2000 километров без необходимости в усилителях сигнала. По словам Лю Юньцзе, одного из главных разработчиков сети, её можно сравнить с «высокоскоростной железной дорогой для компьютеров», обеспечивающей стабильную передачу больших данных.
Новая сеть станет основой для обучения моделей ИИ, требующих обработки огромных массивов данных, создания промышленных интернет-приложений, разработки технологий для «умных городов» и формирования единой вычислительной инфраструктуры страны. В ходе эксперимента удалось с точностью до сантиметров и без задержек контролировать робота в 500 километрах от отеля, где был оператор.
CENI — не только инструмент укрепления кибербезопасности, но и ключевой элемент для реализации стратегии «Данные с востока — вычисления на западе», направленной на передачу данных из восточных регионов Китая в западные центры обработки. Это позволяет использовать возобновляемую энергию в ЦОДах, сократить затраты и улучшить экологические показатели. Также CENI — часть интегрированной национальной вычислительной сети, которая должна стать основой для «цифрового Китая». В долгосрочной перспективе эта инфраструктура должна ускорить развитие ИИ, поддержать рост цифровой экономики и повысить глобальную конкурентоспособность страны.
🔥2
NVIDIA решили начать год красиво — с кучи анонсов на конференции CES 2025. Главной темой, как это водится в последнее время, стал ИИ
Ключевым анонсом была новая линейка графических процессоров GeForce RTX 50 серии, основанная на архитектуре Blackwell. RTX 5090, флагман этой серии, содержит 92 миллиарда транзисторов и обеспечивает производительность ИИ в 3352 триллиона операций в секунду (TOPS), что делает его самым мощным графическим процессором GeForce на сегодняшний день. Этот скачок производительности, по словам NVIDIA, обусловлен оптимизацией для нейронного рендеринга, новыми потоковыми мультипроцессорами, оптимизированными для нейронных шейдеров, и пятым поколением тензорных ядер. Внедрение вычислений FP4 обещает значительное увеличение производительности в играх и других приложениях, использующих ИИ.
Однако NVIDIA не ограничилась аппаратными решениями. Компания представила анонсы и обновления ПО и платформ, основанных на ИИ: Cosmos, RTX Neural Shaders, DLSS 4, Reflex 2, NVIDIA ACE, Project G-Assist, Project R2X, AI Blueprints и NIM.
Подробно про всё рассказывать не будем, но ИИ используется примерно везде:
• DLSS 4 генерирует до 3 дополнительных кадров на каждый отрисованный благодаря трансформерам.
• ACE нужен для создания реалистичных цифровых персонажей с помощью генеративного ИИ (они могут воспринимать окружение, планировать и действовать как живые игроки).
• Project G-Assist — экспериментальный ИИ-помощник для ПК.
• Project R2X — управляемый зрением аватар для ПК, предоставляющий информацию, помогающий с приложениями, видеоконференциями, чтением и обобщением документов.
• AI Blueprints — шаблоны для создания, тестирования и запуска ИИ-агентов.
• NIM — микросервисы для создания ИИ-агентов для поддержки клиентов, обнаружения мошенничества и оптимизации цепочек поставок.
Особого внимания заслуживает платформа NVIDIA Cosmos, предназначенная для разработки моделей мира, которые помогут в создании роботов и автономных транспортных средств (AV) следующего поколения. Cosmos — модель для генерации физически аккуратного видео, обученная на 9000 триллионах токенов из 20 миллионов часов реального взаимодействия. Она предоставляет разработчикам возможность генерировать огромные объемы синтетических данных, необходимых для обучения физического ИИ, и находится в открытом доступе.
Другой важный анонс — Project DIGITS, настольный компьютер с ИИ, основанный на суперчипе NVIDIA GB10 Grace Blackwell. GB10 обеспечивает производительность ИИ до 1 петафлопс с точностью FP4 и включает графический процессор Blackwell с ядрами CUDA последнего поколения и тензорными ядрами пятого поколения. Project DIGITS по цене от 3000 долларов предоставит разработчикам доступ к мощностям, ранее доступным только в крупных дата-центрах. На одном ПК можно запустить модели вплоть до 200 млрд параметров, если соединить два — даже 405B модель.
Технология RTX Neural Shaders, позволяющая обучать и использовать небольшие нейронные сети внутри шейдеров, обещает революцию в графике. Сжатие текстур до 7 раз, ускорение обработки материалов до 5 раз и улучшенное непрямое освещение — лишь некоторые из возможностей этой технологии.
Анонсы NVIDIA на CES 2025 показывают стратегию укрепления их доминирования в сфере ИИ, где компания уже контролирует значительную долю рынка и получает от ИИ-ускорителей на порядок больше прибыли (в 10 раз), чем от игровых видеокарт. NVIDIA предлагает не только мощнейшее железо, но и развитую программную экосистему для различных ИИ-задач, от создания цифровых персонажей до тренировки роботов. Сейчас компания осознанно демократизирует доступ к передовым ИИ-технологиям, чтобы расширить рынок и укрепить свои позиции.
Ключевым анонсом была новая линейка графических процессоров GeForce RTX 50 серии, основанная на архитектуре Blackwell. RTX 5090, флагман этой серии, содержит 92 миллиарда транзисторов и обеспечивает производительность ИИ в 3352 триллиона операций в секунду (TOPS), что делает его самым мощным графическим процессором GeForce на сегодняшний день. Этот скачок производительности, по словам NVIDIA, обусловлен оптимизацией для нейронного рендеринга, новыми потоковыми мультипроцессорами, оптимизированными для нейронных шейдеров, и пятым поколением тензорных ядер. Внедрение вычислений FP4 обещает значительное увеличение производительности в играх и других приложениях, использующих ИИ.
Однако NVIDIA не ограничилась аппаратными решениями. Компания представила анонсы и обновления ПО и платформ, основанных на ИИ: Cosmos, RTX Neural Shaders, DLSS 4, Reflex 2, NVIDIA ACE, Project G-Assist, Project R2X, AI Blueprints и NIM.
Подробно про всё рассказывать не будем, но ИИ используется примерно везде:
• DLSS 4 генерирует до 3 дополнительных кадров на каждый отрисованный благодаря трансформерам.
• ACE нужен для создания реалистичных цифровых персонажей с помощью генеративного ИИ (они могут воспринимать окружение, планировать и действовать как живые игроки).
• Project G-Assist — экспериментальный ИИ-помощник для ПК.
• Project R2X — управляемый зрением аватар для ПК, предоставляющий информацию, помогающий с приложениями, видеоконференциями, чтением и обобщением документов.
• AI Blueprints — шаблоны для создания, тестирования и запуска ИИ-агентов.
• NIM — микросервисы для создания ИИ-агентов для поддержки клиентов, обнаружения мошенничества и оптимизации цепочек поставок.
Особого внимания заслуживает платформа NVIDIA Cosmos, предназначенная для разработки моделей мира, которые помогут в создании роботов и автономных транспортных средств (AV) следующего поколения. Cosmos — модель для генерации физически аккуратного видео, обученная на 9000 триллионах токенов из 20 миллионов часов реального взаимодействия. Она предоставляет разработчикам возможность генерировать огромные объемы синтетических данных, необходимых для обучения физического ИИ, и находится в открытом доступе.
Другой важный анонс — Project DIGITS, настольный компьютер с ИИ, основанный на суперчипе NVIDIA GB10 Grace Blackwell. GB10 обеспечивает производительность ИИ до 1 петафлопс с точностью FP4 и включает графический процессор Blackwell с ядрами CUDA последнего поколения и тензорными ядрами пятого поколения. Project DIGITS по цене от 3000 долларов предоставит разработчикам доступ к мощностям, ранее доступным только в крупных дата-центрах. На одном ПК можно запустить модели вплоть до 200 млрд параметров, если соединить два — даже 405B модель.
Технология RTX Neural Shaders, позволяющая обучать и использовать небольшие нейронные сети внутри шейдеров, обещает революцию в графике. Сжатие текстур до 7 раз, ускорение обработки материалов до 5 раз и улучшенное непрямое освещение — лишь некоторые из возможностей этой технологии.
Анонсы NVIDIA на CES 2025 показывают стратегию укрепления их доминирования в сфере ИИ, где компания уже контролирует значительную долю рынка и получает от ИИ-ускорителей на порядок больше прибыли (в 10 раз), чем от игровых видеокарт. NVIDIA предлагает не только мощнейшее железо, но и развитую программную экосистему для различных ИИ-задач, от создания цифровых персонажей до тренировки роботов. Сейчас компания осознанно демократизирует доступ к передовым ИИ-технологиям, чтобы расширить рынок и укрепить свои позиции.
👍2
На днях все обсуждали заметку Сэма Альтмана «Reflections». Он написал, что OpenAI придумали, как создать AGI. Но что это за зверь и почему все о нём говорят?
Определение AGI (Artificial general intelligence) остаётся предметом обсуждений. Пока не существует единого, универсального подхода, но эксперты в целом сходятся в одном: AGI – это искусственный интеллект с когнитивными способностями, сравнимыми или даже превосходящими человеческие в самых разных областях.
Ключевые характеристики AGI обычно включают:
• общий характер — возможность выполнять широкий спектр задач, а не только те, которые были в данных для обучения;
• производительность — уровень мастерства, равный или выше человеческого;
• ориентацию на результат, а не метод — важно, что задача выполнена, а не как это сделано;
• и потенциал — возможность справляться с задачами, даже если они не были изначально предусмотрены.
При этом AGI не обязательно должен быть «сильным ИИ» с сознанием или эмоциями, да и физического воплощения ему тоже не требуется.
Любопытный и практичный подход к определению AGI предложили Microsoft и OpenAI — компании связывают достижение AGI со способностью ИИ-решений приносить не менее $100 млрд прибыли в год. Такой подход, конечно, хорош для бизнеса, но вызывает вопросы: при чём тут когнитивные способности, если твой KPI — это деньги?
Ещё один вопрос — почему все так мечтают об AGI? Ответ прост: он обещает решить «всё». От изменения климата до поиска новых источников энергии или лечения рака. Это в теории. А если говорить о более приземлённых вещах, то такой ИИ поможет автоматизировать рутинные задачи и повысить производительность труда предприятий, которые и так сегодня массово внедряют искусственный интеллект. Коммерческая выгода тоже довольно очевидна – компании, которые первыми добьются AGI, будут как минимум диктовать условия игры на рынке технологий.
Но за этими перспективами скрываются серьёзные вызовы. Развитие AGI сулит множество рисков: от попадания технологии «не в те руки» до ситуаций, где ИИ начнёт развивать собственные цели, далекие от человеческих. Стоит также помнить про социальные потрясения, которые могут быть вызваны массовой автоматизацией труда — такой себе сюжет антиутопии.
Сэм Альтман, генеральный директор OpenAI, не скрывает амбиций и утверждает: компания знает, как создать AGI. Альтман приводит в пример GPT o3, которая, по его утверждениям, прошла тест ARC-AGI с результатом 87,5% и превысила проходной балл в 85%. Хотя бенчмарк почти невозможно повторить из-за его высокой стоимости, да и само прохождение теста ещё не свидетельствует о соответствии модели критериям AGI.
А что в России? Мы тоже ведём работу в этом направлении. Стоит вспомнить и созданный недавно САПФИР, и русскоязычное сообщество AGI-разработчиков (РуССИИ), и планируемую третью волну отбора исследовательских центров с фокусом на развитии «сильного ИИ» для выделения грантов.
Впрочем, как и во всём мире, здесь осознают необходимость регулирования и придерживаются осторожного подхода — отсюда и призывы отдельных депутатов ввести регулирование AGI после слов Сэма Альтмана. Главные страхи – злоупотребление технологией и отсутствие контроля над её развитием.
Запрос на исследования в этой области есть и уже в ближайшие несколько месяцев, возможно, мы узнаем подробности. Пока — к сожалению или к счастью — AGI остаётся амбициозной, но недостижимой целью.
Определение AGI (Artificial general intelligence) остаётся предметом обсуждений. Пока не существует единого, универсального подхода, но эксперты в целом сходятся в одном: AGI – это искусственный интеллект с когнитивными способностями, сравнимыми или даже превосходящими человеческие в самых разных областях.
Ключевые характеристики AGI обычно включают:
• общий характер — возможность выполнять широкий спектр задач, а не только те, которые были в данных для обучения;
• производительность — уровень мастерства, равный или выше человеческого;
• ориентацию на результат, а не метод — важно, что задача выполнена, а не как это сделано;
• и потенциал — возможность справляться с задачами, даже если они не были изначально предусмотрены.
При этом AGI не обязательно должен быть «сильным ИИ» с сознанием или эмоциями, да и физического воплощения ему тоже не требуется.
Любопытный и практичный подход к определению AGI предложили Microsoft и OpenAI — компании связывают достижение AGI со способностью ИИ-решений приносить не менее $100 млрд прибыли в год. Такой подход, конечно, хорош для бизнеса, но вызывает вопросы: при чём тут когнитивные способности, если твой KPI — это деньги?
Ещё один вопрос — почему все так мечтают об AGI? Ответ прост: он обещает решить «всё». От изменения климата до поиска новых источников энергии или лечения рака. Это в теории. А если говорить о более приземлённых вещах, то такой ИИ поможет автоматизировать рутинные задачи и повысить производительность труда предприятий, которые и так сегодня массово внедряют искусственный интеллект. Коммерческая выгода тоже довольно очевидна – компании, которые первыми добьются AGI, будут как минимум диктовать условия игры на рынке технологий.
Но за этими перспективами скрываются серьёзные вызовы. Развитие AGI сулит множество рисков: от попадания технологии «не в те руки» до ситуаций, где ИИ начнёт развивать собственные цели, далекие от человеческих. Стоит также помнить про социальные потрясения, которые могут быть вызваны массовой автоматизацией труда — такой себе сюжет антиутопии.
Сэм Альтман, генеральный директор OpenAI, не скрывает амбиций и утверждает: компания знает, как создать AGI. Альтман приводит в пример GPT o3, которая, по его утверждениям, прошла тест ARC-AGI с результатом 87,5% и превысила проходной балл в 85%. Хотя бенчмарк почти невозможно повторить из-за его высокой стоимости, да и само прохождение теста ещё не свидетельствует о соответствии модели критериям AGI.
А что в России? Мы тоже ведём работу в этом направлении. Стоит вспомнить и созданный недавно САПФИР, и русскоязычное сообщество AGI-разработчиков (РуССИИ), и планируемую третью волну отбора исследовательских центров с фокусом на развитии «сильного ИИ» для выделения грантов.
Впрочем, как и во всём мире, здесь осознают необходимость регулирования и придерживаются осторожного подхода — отсюда и призывы отдельных депутатов ввести регулирование AGI после слов Сэма Альтмана. Главные страхи – злоупотребление технологией и отсутствие контроля над её развитием.
Запрос на исследования в этой области есть и уже в ближайшие несколько месяцев, возможно, мы узнаем подробности. Пока — к сожалению или к счастью — AGI остаётся амбициозной, но недостижимой целью.
Мы не будем себе принадлежать? Дипфейки и кража личности становятся «нормальным» явлением
Дипфейки, изначально созданные для развлечения, превратились в эффективный инструмент манипуляции, шантажа и мошенничества. Они стирают границы между реальностью и вымыслом. Это может показаться преувеличением, но статистика свидетельствует об обратном: за последние годы рынок дипфейков вырос примерно до 0,82 миллиарда долларов с CAGR около 26%.
По данным Regula, из-за атак с использованием дипфейков компании теряют около 450000 долларов в год, а в банковском секторе эта сумма достигает 630000. Примерно 15% руководителей компаний сталкивались с попытками киберпреступников получить доступ к финансовым данным с помощью дипфейков. В России по итогам прошлого года количество мошенничеств с использованием дипфейков выросло более чем на 10%. Коллеги из «Ъ» отмечают, что в финансовом секторе число атак в 2024 году увеличилось на 13%, а их успешность достигает 15–20%.
Но самая тревожная тенденция – это распространение угрозы дипфейков на обычных людей.
Исследователи из Google и Стэнфордского университета разработали «агентов симуляции» — ИИ-копии 1052 человек, основанные на данных двухчасовых интервью. Эти интервью использовались для обучения модели генеративного ИИ, которая способна имитировать человеческое поведение.
Цель проекта заключалась в создании модели, максимально точно отражающей многообразие американского общества, включая демографические различия, политические взгляды и психологические особенности. Модель планируется использовать для исследований и прогнозирования реакции общества на различные триггеры и события. Точность ответов составила 85%. И хотя это ещё не оцифрованные личности людей, как в игре Soma — это уже шаг к созданию цифрового двойника, который будет мыслить так же, как мы.
Почти одновременно с этим появилась новость о другой крупной компании — Meta (признана экстремистской в России), которая начала тестировать в Instagram функцию автоматического создания изображений с лицом пользователей. Цифровые аватары создаются на основе сервиса Imagine. Возникает вопрос: почему бы не использовать эту технологию для добавления в ленту рекламы с лицами пользователей? Или сюжетов, которые формируют для них определённый, персонифицированный нарратив? Влияние таких постов будет гораздо сильнее, чем от обычной «безликой» рекламы.
В ответ на создание дипфейков развиваются и сервисы для борьбы с ними. Разработчики заходят с разных сторон — сами используют ИИ, анализируют морфинг лица, p-фреймы и вектора движения пикселей, результаты обработки и компрессии медиафайлов, придумывают маркировки и даже ищут на видео пульсацию вен. Компании в России — МТС (Дипфейк-детектор), Cбер, Wink, NtechLab и так далее — разрабатывают собственные решения для борьбы с дипфейками.
Но будет ли этого достаточно? Или в итоге цифровые копии наших личностей будут жить в цифровых симуляциях иных миров от Nvidia? Кажется, совсем скоро мы это и узнаем.
Дипфейки, изначально созданные для развлечения, превратились в эффективный инструмент манипуляции, шантажа и мошенничества. Они стирают границы между реальностью и вымыслом. Это может показаться преувеличением, но статистика свидетельствует об обратном: за последние годы рынок дипфейков вырос примерно до 0,82 миллиарда долларов с CAGR около 26%.
По данным Regula, из-за атак с использованием дипфейков компании теряют около 450000 долларов в год, а в банковском секторе эта сумма достигает 630000. Примерно 15% руководителей компаний сталкивались с попытками киберпреступников получить доступ к финансовым данным с помощью дипфейков. В России по итогам прошлого года количество мошенничеств с использованием дипфейков выросло более чем на 10%. Коллеги из «Ъ» отмечают, что в финансовом секторе число атак в 2024 году увеличилось на 13%, а их успешность достигает 15–20%.
Но самая тревожная тенденция – это распространение угрозы дипфейков на обычных людей.
Исследователи из Google и Стэнфордского университета разработали «агентов симуляции» — ИИ-копии 1052 человек, основанные на данных двухчасовых интервью. Эти интервью использовались для обучения модели генеративного ИИ, которая способна имитировать человеческое поведение.
Цель проекта заключалась в создании модели, максимально точно отражающей многообразие американского общества, включая демографические различия, политические взгляды и психологические особенности. Модель планируется использовать для исследований и прогнозирования реакции общества на различные триггеры и события. Точность ответов составила 85%. И хотя это ещё не оцифрованные личности людей, как в игре Soma — это уже шаг к созданию цифрового двойника, который будет мыслить так же, как мы.
Почти одновременно с этим появилась новость о другой крупной компании — Meta (признана экстремистской в России), которая начала тестировать в Instagram функцию автоматического создания изображений с лицом пользователей. Цифровые аватары создаются на основе сервиса Imagine. Возникает вопрос: почему бы не использовать эту технологию для добавления в ленту рекламы с лицами пользователей? Или сюжетов, которые формируют для них определённый, персонифицированный нарратив? Влияние таких постов будет гораздо сильнее, чем от обычной «безликой» рекламы.
В ответ на создание дипфейков развиваются и сервисы для борьбы с ними. Разработчики заходят с разных сторон — сами используют ИИ, анализируют морфинг лица, p-фреймы и вектора движения пикселей, результаты обработки и компрессии медиафайлов, придумывают маркировки и даже ищут на видео пульсацию вен. Компании в России — МТС (Дипфейк-детектор), Cбер, Wink, NtechLab и так далее — разрабатывают собственные решения для борьбы с дипфейками.
Но будет ли этого достаточно? Или в итоге цифровые копии наших личностей будут жить в цифровых симуляциях иных миров от Nvidia? Кажется, совсем скоро мы это и узнаем.
❤2👍2👻1
Аишка
Неплохой вариант понять, насколько сложно устроена LLM — посмотреть визуализацию всех этапов работы нейросети Брендан Байкрофт подготовил наглядную 3Д-модель LLM и сделал гайд по всем этапам её работы (именно inference) с пояснениями. Здесь мы видим и обработку…
А у нас есть очередная визуализация. На этот раз — для моделей, которые генерируют для вас (или, по крайней мере, для нас) картинки — диффузий. Чтобы вы лучше могли понять процесс
Диффузионные модели показывают впечатляющие результаты в самых разных областях, от создания изображений и видео до разработки лекарств. В отличие от GAN (генеративно-состязательные сети, другой принцип генерации), диффузионные модели работают по принципу постепенного разрушения данных с последующим восстановлением.
В основе диффузионных моделей лежат два процесса.
Первый – прямой процесс, или диффузия. На этом этапе к исходному изображению постепенно добавляется шум. Этот процесс повторяется до тех пор, пока изображение полностью не превратится в случайный шум.
Второй процесс – обратный, или обратная диффузия. Здесь нейронная сеть учится восстанавливать исходные данные, шаг за шагом убирая шум. Цель – научить модель предсказывать предыдущее состояние, основываясь на текущем.
Сейчас немного «духоты» для тех, у кого тоже стоит ComfyUI или Automatic. Процесс генерации в Stable Diffusion выглядит следующим образом: сначала текстовый запрос токенизируется и кодируется в векторное представление с помощью модели CLIP; затем, начиная со случайного шума, картинка постепенно уточняется с помощью U-Net, опираясь на текст; и, наконец, изображение масштабируется в высокое разрешение с помощью VAE.
Диффузионные модели более стабильны в обучении, но GAN, как правило, быстрее. Качество генерации у обоих подходов высокое, но диффузионные модели отличаются большей универсальностью.
Как мы видим из визуализации, диффузионные модели — это мощный инструмент. Благодаря своей стабильности, качеству и универсальности, они успешно применяются в разных областях. Пускай они медленнее GAN, перенос генерации в облако или оптимизация на уровне железа (у видеокарт Nvidia, например) сделала их по итогу доминирующим вариантом генеративных нейросетей на сегодняшний день. Все популярные опции для генерации изображений — Stable Diffusion, Midjourney, imagen и другие — используют именно этот подход.
Диффузионные модели показывают впечатляющие результаты в самых разных областях, от создания изображений и видео до разработки лекарств. В отличие от GAN (генеративно-состязательные сети, другой принцип генерации), диффузионные модели работают по принципу постепенного разрушения данных с последующим восстановлением.
В основе диффузионных моделей лежат два процесса.
Первый – прямой процесс, или диффузия. На этом этапе к исходному изображению постепенно добавляется шум. Этот процесс повторяется до тех пор, пока изображение полностью не превратится в случайный шум.
Второй процесс – обратный, или обратная диффузия. Здесь нейронная сеть учится восстанавливать исходные данные, шаг за шагом убирая шум. Цель – научить модель предсказывать предыдущее состояние, основываясь на текущем.
Сейчас немного «духоты» для тех, у кого тоже стоит ComfyUI или Automatic. Процесс генерации в Stable Diffusion выглядит следующим образом: сначала текстовый запрос токенизируется и кодируется в векторное представление с помощью модели CLIP; затем, начиная со случайного шума, картинка постепенно уточняется с помощью U-Net, опираясь на текст; и, наконец, изображение масштабируется в высокое разрешение с помощью VAE.
Диффузионные модели более стабильны в обучении, но GAN, как правило, быстрее. Качество генерации у обоих подходов высокое, но диффузионные модели отличаются большей универсальностью.
Как мы видим из визуализации, диффузионные модели — это мощный инструмент. Благодаря своей стабильности, качеству и универсальности, они успешно применяются в разных областях. Пускай они медленнее GAN, перенос генерации в облако или оптимизация на уровне железа (у видеокарт Nvidia, например) сделала их по итогу доминирующим вариантом генеративных нейросетей на сегодняшний день. Все популярные опции для генерации изображений — Stable Diffusion, Midjourney, imagen и другие — используют именно этот подход.
👍4🔥2🐳1
Не успели мы толком привыкнуть к большим языковым моделям, а крупные компании на рынке ИИ уже обещают нам новую волну хайпа — агентов. Гугл, когда прогнозировал тренды ИИ в 2025 году, поставил их на 2 место.
В отличие от своих предшественников, которые способны были лишь пассивно генерировать поток подходящих токенов, агенты могут демонстрировать большую активность, планируя, действуя автономно и даже «обучаясь» — получая доступ к сторонним инструментам и API. Что-то вроде промежуточного этапа перед AGI. Собственно, в утёкшем плане OpenAI это 3 шаг на пути к «сильному» ИИ.
В агенте помимо модели (часто LLM) есть и инструменты, и целый уровень оркестратора. Модель, как мозг, обрабатывает информацию и принимает решения, инструменты служат руками, взаимодействуя с внешним миром, а оркестратор, словно дирижер, управляет всем этим действом. Для улучшения мыслительного процесса модели используются техники вроде «цепочки мыслей» (CoT) и «древа мыслей» (ToT), а память позволяет этим агентам учиться на своих ошибках.
Применять ИИ-агентов можно в самых разных сферах: от разработки ПО (сервисы вроде OpenHands), робототехники (LM-Nav) до здравоохранения (LLaVA-Med), социальных наук (Social Simulacra) и так далее. Они автоматизируют задачи, анализируют данные, моделируют взаимодействия и дают советы. Однако тут есть и свои подводные камни, вроде галлюцинаций, ограниченной обучаемости и сложности с бенчмарками.
Что мы имеем сегодня? Anthropic недавно первыми выпустили Claude 3.5 Sonnet с функцией «использования компьютера» — теперь ИИ может смотреть на экран пользователя, перемещать курсор, нажимать кнопки и печатать текст. Google уже тестирует подобного агента — Project Mariner — который может управлять браузером за пользователя, искать авиабилеты или делать покупки. Microsoft развивает свой Copilot для ПК с Windows для того же, а Amazon мечтаетоб электроовцах о своём агенте, который дополнит функции ассистента Rufus и будет делать покупки вместо пользователей по их запросу.
Но сделать тему агентов «хайповой» в начале 2025 года помогли 2 других компании — OpenAI и Nvidia.
Для начала Сэм Альтман заявил, что предвидит запуск ИИ-агентов уже в 2025 году. По сведениям Bloomberg, OpenAI уже разрабатывают агента под названием Operator, способного выполнять действия от имени пользователя. Сразу после этого они появились с другой новостью — вроде как OpenAI собираются производить собственных роботов, датчики и вычислительные элементы, хотя раньше ограничивались только инвестициями в эту сферу (5 миллионов вложили в Figure AI, например, и возглавили раунд инвестиций 1X).
Вероятно, шевелиться их заставили слова директора Nvidia Дженсена Хуанга, который на CES 2025 заявил о переходе от генеративного ИИ к интеллектуальным цифровым агентам и анонсировал соответствующие инструменты и платформы (Project G-Assist, Project R2X, AI Blueprints, NIM и так далее). Платформа NVIDIA Cosmos вообще предназначена для разработки моделей мира, необходимых для тренировки роботов и автономных транспортных средств с ИИ в основе — то бишь агентов. А недавно Nvidia купили Run:ai, которые отвечают за оркестрацию ИИ-моделей и оптимизацию их работы — компания стремится захватить не только рынок железа, но и рынок физических симуляций с помощью ИИ, создания синтетических данных и тренировки роботов-агентов.
Тренд любопытный, хотя тот же Copilot от Microsoft прославился не тем, что облегчает жизнь пользователям Виндоус, а тем, что съедал под 2 гига оперативной памяти и переставал работать. Поэтому польза ИИ-агентов на ПК или телефонах не очевидна и ими ещё предстоить научиться пользоваться, возможно, даже заставляя себя менять привычный паттерн взаимодействия с устройством. А вот в случае с роботами всё иначе, и там агенты с интеграцией мультимодального ИИ способны подарить роботу возможность «видеть», «думать» и «принимать решения» почти в реальном времени, что расширит список доступных им для освоения занятий.
В отличие от своих предшественников, которые способны были лишь пассивно генерировать поток подходящих токенов, агенты могут демонстрировать большую активность, планируя, действуя автономно и даже «обучаясь» — получая доступ к сторонним инструментам и API. Что-то вроде промежуточного этапа перед AGI. Собственно, в утёкшем плане OpenAI это 3 шаг на пути к «сильному» ИИ.
В агенте помимо модели (часто LLM) есть и инструменты, и целый уровень оркестратора. Модель, как мозг, обрабатывает информацию и принимает решения, инструменты служат руками, взаимодействуя с внешним миром, а оркестратор, словно дирижер, управляет всем этим действом. Для улучшения мыслительного процесса модели используются техники вроде «цепочки мыслей» (CoT) и «древа мыслей» (ToT), а память позволяет этим агентам учиться на своих ошибках.
Применять ИИ-агентов можно в самых разных сферах: от разработки ПО (сервисы вроде OpenHands), робототехники (LM-Nav) до здравоохранения (LLaVA-Med), социальных наук (Social Simulacra) и так далее. Они автоматизируют задачи, анализируют данные, моделируют взаимодействия и дают советы. Однако тут есть и свои подводные камни, вроде галлюцинаций, ограниченной обучаемости и сложности с бенчмарками.
Что мы имеем сегодня? Anthropic недавно первыми выпустили Claude 3.5 Sonnet с функцией «использования компьютера» — теперь ИИ может смотреть на экран пользователя, перемещать курсор, нажимать кнопки и печатать текст. Google уже тестирует подобного агента — Project Mariner — который может управлять браузером за пользователя, искать авиабилеты или делать покупки. Microsoft развивает свой Copilot для ПК с Windows для того же, а Amazon мечтает
Но сделать тему агентов «хайповой» в начале 2025 года помогли 2 других компании — OpenAI и Nvidia.
Для начала Сэм Альтман заявил, что предвидит запуск ИИ-агентов уже в 2025 году. По сведениям Bloomberg, OpenAI уже разрабатывают агента под названием Operator, способного выполнять действия от имени пользователя. Сразу после этого они появились с другой новостью — вроде как OpenAI собираются производить собственных роботов, датчики и вычислительные элементы, хотя раньше ограничивались только инвестициями в эту сферу (5 миллионов вложили в Figure AI, например, и возглавили раунд инвестиций 1X).
Вероятно, шевелиться их заставили слова директора Nvidia Дженсена Хуанга, который на CES 2025 заявил о переходе от генеративного ИИ к интеллектуальным цифровым агентам и анонсировал соответствующие инструменты и платформы (Project G-Assist, Project R2X, AI Blueprints, NIM и так далее). Платформа NVIDIA Cosmos вообще предназначена для разработки моделей мира, необходимых для тренировки роботов и автономных транспортных средств с ИИ в основе — то бишь агентов. А недавно Nvidia купили Run:ai, которые отвечают за оркестрацию ИИ-моделей и оптимизацию их работы — компания стремится захватить не только рынок железа, но и рынок физических симуляций с помощью ИИ, создания синтетических данных и тренировки роботов-агентов.
Тренд любопытный, хотя тот же Copilot от Microsoft прославился не тем, что облегчает жизнь пользователям Виндоус, а тем, что съедал под 2 гига оперативной памяти и переставал работать. Поэтому польза ИИ-агентов на ПК или телефонах не очевидна и ими ещё предстоить научиться пользоваться, возможно, даже заставляя себя менять привычный паттерн взаимодействия с устройством. А вот в случае с роботами всё иначе, и там агенты с интеграцией мультимодального ИИ способны подарить роботу возможность «видеть», «думать» и «принимать решения» почти в реальном времени, что расширит список доступных им для освоения занятий.
👍2✍1🙈1
ИИ вдохнул жизнь в спуфинг
Спуфинг — старый как мир способ обмана, обретший новую жизнь благодаря ИИ. Если раньше мошенникам приходилось вручную рассылать электронные письма или выманивать телефонные номера, то теперь искусственный интеллект сделал их работу проще, быстрее и изощреннее.
Практика LLM Lettering помогает прекрасно писать фишинговые письма, которые сложно отличить от подлинных. А рост качества дипфейков, в том числе возможность изменения голоса в реальном времени — угроза даже для крупных компаний, где «украденная» личность директора становится поводом перевести деньги или принять нерациональное решение.
В итоге проблема перестала быть точечной. То, что когда-то ограничивалось единичными атаками, сегодня разрослось до масштабов небольшой войны. По данным Sumsub, за 2024 год использование дипфейков в мошеннических схемах выросло в четыре раза, составив 7% от всех атак. На первый взгляд цифра не выглядит угрожающей, но важно учитывать динамику. Технологии становятся доступнее, а стоимость создания дипфейков — ниже.
В России пока всё не так плохо, но проблема тоже вышла за рамки гипотетической угрозы. В исследовании MTS AI и Б1 выяснили, что 21% компаний на рынке уже сталкивались с атаками в комбинации спуфинг+дипфейк, хотя пока урон и не слишком существенный. При этом 92% российских компаний видят в спуфинге и дипфейках реальную опасность (что не удивительно на фоне громких новостей об украденных 25 миллионах долларов с помощью дипфейка у компании в Гонконге или 35 миллионах долларов у банка в ОАЭ). Последнее — типичный пример голосового спуфинга, подделки голоса руководства — таких атак боятся 79% респондентов.
Причём для того, чтобы заменить лицо в реальном времени и синхронизировать движения губ, сегодня даже не нужны какие-то проприетарные или закрытые решения — тот же DeepFaceLive легко доступен на Гитхабе и не требует мощного железа. Хотя, конечно, и результат не даёт идеальный — но более чем достаточный для участия злоумышленника в конференции или бизнес-созвоне с подключением якобы «через вебку» с плохим разрешением. На этом фоне интересно было почитать, что 33% компаний в России вообще не выделяют бюджет на борьбу с дипфейк-спуфингом и проверку видео/аудио во внутренней коммуникации.
На российском рынке в последнее время появляются и различные решения для борьбы с угрозами — они есть у МТС (Дипфейк-детектор от дочки MTS AI VisionLabs), Cбера, Wink, NtechLab и так далее. Но проблема в том, что 100% защиту гарантировать невозможно.
А вот стоит ли винить за это ИИ и делать его крайним? Вряд ли логично надеяться только на технологии защиты, не обращая внимание на механизм принятия решений, иерархию внутри бизнеса, процесс подтверждения транзакций и так далее — ведь именно они и стали итоговой причиной потерь компаний, о которых мы упомянули раннее. А дипфейк и спуфинг в данном случае — только инструменты, которые эксплуатируют существующие уязвимости.
Спуфинг — старый как мир способ обмана, обретший новую жизнь благодаря ИИ. Если раньше мошенникам приходилось вручную рассылать электронные письма или выманивать телефонные номера, то теперь искусственный интеллект сделал их работу проще, быстрее и изощреннее.
Практика LLM Lettering помогает прекрасно писать фишинговые письма, которые сложно отличить от подлинных. А рост качества дипфейков, в том числе возможность изменения голоса в реальном времени — угроза даже для крупных компаний, где «украденная» личность директора становится поводом перевести деньги или принять нерациональное решение.
В итоге проблема перестала быть точечной. То, что когда-то ограничивалось единичными атаками, сегодня разрослось до масштабов небольшой войны. По данным Sumsub, за 2024 год использование дипфейков в мошеннических схемах выросло в четыре раза, составив 7% от всех атак. На первый взгляд цифра не выглядит угрожающей, но важно учитывать динамику. Технологии становятся доступнее, а стоимость создания дипфейков — ниже.
В России пока всё не так плохо, но проблема тоже вышла за рамки гипотетической угрозы. В исследовании MTS AI и Б1 выяснили, что 21% компаний на рынке уже сталкивались с атаками в комбинации спуфинг+дипфейк, хотя пока урон и не слишком существенный. При этом 92% российских компаний видят в спуфинге и дипфейках реальную опасность (что не удивительно на фоне громких новостей об украденных 25 миллионах долларов с помощью дипфейка у компании в Гонконге или 35 миллионах долларов у банка в ОАЭ). Последнее — типичный пример голосового спуфинга, подделки голоса руководства — таких атак боятся 79% респондентов.
Причём для того, чтобы заменить лицо в реальном времени и синхронизировать движения губ, сегодня даже не нужны какие-то проприетарные или закрытые решения — тот же DeepFaceLive легко доступен на Гитхабе и не требует мощного железа. Хотя, конечно, и результат не даёт идеальный — но более чем достаточный для участия злоумышленника в конференции или бизнес-созвоне с подключением якобы «через вебку» с плохим разрешением. На этом фоне интересно было почитать, что 33% компаний в России вообще не выделяют бюджет на борьбу с дипфейк-спуфингом и проверку видео/аудио во внутренней коммуникации.
На российском рынке в последнее время появляются и различные решения для борьбы с угрозами — они есть у МТС (Дипфейк-детектор от дочки MTS AI VisionLabs), Cбера, Wink, NtechLab и так далее. Но проблема в том, что 100% защиту гарантировать невозможно.
А вот стоит ли винить за это ИИ и делать его крайним? Вряд ли логично надеяться только на технологии защиты, не обращая внимание на механизм принятия решений, иерархию внутри бизнеса, процесс подтверждения транзакций и так далее — ведь именно они и стали итоговой причиной потерь компаний, о которых мы упомянули раннее. А дипфейк и спуфинг в данном случае — только инструменты, которые эксплуатируют существующие уязвимости.
1❤2
Аишка
Яндекс Клавиатура пробует поздравить собеседника за вас В приложение добавили кнопку «Поздравить», которая подключает YandexGPT и генерит текст поздравления в заданном стиле Нашлась замена открыткам с блестками в Вотсапе?
Ещё недавно мы писали про Яндекс Клавиатуру, которая добавила функцию генерации поздравлений с помощью YandexGPT перед Новым годом. Возможно, пытаясь занять нишу открыток для дальних родственников.
А сегодня посмотрели на статистику от приложения Почты Mail, которые тоже предлагали такую функцию на базе генеративной сети ВК.
Оказывается, генерация поздравлений была самой востребованной функцией перед Новым годом и в начале января🤷♂️
Ещё аналитики говорят, что популярность использования ИИ выросла на 68% по сравнению с предыдущим кварталом — что не удивительно, ведь генеративные функции в бете были запущены не так давно, в феврале 2024 года, и сейчас люди как раз осваивают эти инструменты.
На втором месте после поздравлений — генерация откликов на вакансии. Видимо, русский человек даже в новогодние каникулы не перестаёт искать работу.
Правда, учитывая некоторые текущие «особенности» модели — например, нейросеть от ВК упорно считает себя «Алисой», которая может «отвечать на вопросы о погоде, маршрутах, новостях» — использовать её для тех же откликов на вакансии, наверное, рановато, и лучше ограничиться поздравлениями.
Если говорить про другие интересные кейсы применения ИИ для поздравлений, то отдельные зарубежные умельцы вроде Gan ai дали возможность сгенерировать видео с озвучкой текста пользователей от ИИ-Санты. Посмотрим, появятся ли такие сервисы в России перед следующим Новым годом, но уже есть ощущение, что профессия составителя текстов для поздравительных открыток из фильма «500 дней лета» больше не актуальна.
А сегодня посмотрели на статистику от приложения Почты Mail, которые тоже предлагали такую функцию на базе генеративной сети ВК.
Оказывается, генерация поздравлений была самой востребованной функцией перед Новым годом и в начале января
Ещё аналитики говорят, что популярность использования ИИ выросла на 68% по сравнению с предыдущим кварталом — что не удивительно, ведь генеративные функции в бете были запущены не так давно, в феврале 2024 года, и сейчас люди как раз осваивают эти инструменты.
На втором месте после поздравлений — генерация откликов на вакансии. Видимо, русский человек даже в новогодние каникулы не перестаёт искать работу.
Правда, учитывая некоторые текущие «особенности» модели — например, нейросеть от ВК упорно считает себя «Алисой», которая может «отвечать на вопросы о погоде, маршрутах, новостях» — использовать её для тех же откликов на вакансии, наверное, рановато, и лучше ограничиться поздравлениями.
Если говорить про другие интересные кейсы применения ИИ для поздравлений, то отдельные зарубежные умельцы вроде Gan ai дали возможность сгенерировать видео с озвучкой текста пользователей от ИИ-Санты. Посмотрим, появятся ли такие сервисы в России перед следующим Новым годом, но уже есть ощущение, что профессия составителя текстов для поздравительных открыток из фильма «500 дней лета» больше не актуальна.
Please open Telegram to view this post
VIEW IN TELEGRAM
☃2😁1
Почему просто не скопировать мозг?
Зачем нам огромные ЦОДы с малыми ядерными реакторами для питания, на которых запускаются удалённо модельки с сотнями миллиардов параметров — если есть мозг? Мозг человека маленький, энергоёмкий, помещается в голове и практически идеально справляется с любыми задачами, от распознавания объектов и запахов до генерации связного текста или решения сложных уравнений. Почему бы просто его не скопировать?
«Скопировать» мозг как раз призваны нейроморфные технологии. Они могут привести нас к энергоэффективному и автономному будущему — если получится преодолеть огромные сложности по разработке платформ и алгоритмов.
Вместо привычной для архитектуры фон Неймана схемы «память — процессор» нейроморфные системы соединяют вычислительные элементы и память в единую сеть, как нейроны и синапсы в мозге. Запоминание в спайковых (импульсных) нейроных сетях происходит через параллельную активацию определённых нейронов, и данные не записываются куда-то в хранилище, а сохраняются «во времени» через цепочку последовательных активаций.
Такие системы идеально подойдут для автономных устройств, потому что вычисления будут происходить локально, энергоэффективно и без задержек. Уже сейчас они используются для определения запахов, создания искусственной кожи с тактильными сенсорами и определения объектов на видео. Правда, есть нюансы — для их запуска нужно создавать новое железо и алгоритмы, обучать разработчиков, а это всё требует огромных вложений. Да и алгоритмов, которые в полной мере раскроют возможности таких систем, на сегодняшний день нет.
Но зато есть понимание, насколько много заработает компания, которая первой сможет сделать рабочий нейроморфный чип и предложит варианты его внедрения в производство. Свои разработки есть как у крупных компаний — IBM (чип NorthPole) и Intel (Loihi) — так и у более маленьких. Ещё в 2021 году на рынке появился первый коммерческий нейроморфный чип Akida от компании BrainChip. Правда, данных о количестве продаж нет, а годовая чистая прибыль компании остаётся отрицательной с 2019 года.
Россия пока отстаёт за зарубежных конкурентов, но ведёт разработку своих нейроморфных чипов. В 2020 году компания Мотив НТ вместе с Лабораторией Касперского выпустила чип Алтай, через 2 года — создали программно-аппаратную платформу KNP (Kaspersky Neuromorphic Platform) для разработки и исследования импульсных нейронных сетей. Код платформы выложили в открытый доступ на Гитхаб. А в октябре 2024 года учёные из Университета ИТМО, СПбГУ и Тунцзи разработали нейроморфный вычислительный элемент на базе кристалла.
Сейчас на фоне недостатка данных, роста нагрузок на ЦОДы и крупные инвестиции ведущих ИИ-компаний в разработку агентов и роботов интерес к нейроморфным системам растёт. И важно, что подобные разработки есть у очень небольшого числа «игроков» — США, Китая, России и ЕС. Поэтому Россия вполне может получить преимущество (хотя бы региональное) на рынке нейроморфных технологий, если получится преодолеть текущие ограничения.
Зачем нам огромные ЦОДы с малыми ядерными реакторами для питания, на которых запускаются удалённо модельки с сотнями миллиардов параметров — если есть мозг? Мозг человека маленький, энергоёмкий, помещается в голове и практически идеально справляется с любыми задачами, от распознавания объектов и запахов до генерации связного текста или решения сложных уравнений. Почему бы просто его не скопировать?
«Скопировать» мозг как раз призваны нейроморфные технологии. Они могут привести нас к энергоэффективному и автономному будущему — если получится преодолеть огромные сложности по разработке платформ и алгоритмов.
Вместо привычной для архитектуры фон Неймана схемы «память — процессор» нейроморфные системы соединяют вычислительные элементы и память в единую сеть, как нейроны и синапсы в мозге. Запоминание в спайковых (импульсных) нейроных сетях происходит через параллельную активацию определённых нейронов, и данные не записываются куда-то в хранилище, а сохраняются «во времени» через цепочку последовательных активаций.
Такие системы идеально подойдут для автономных устройств, потому что вычисления будут происходить локально, энергоэффективно и без задержек. Уже сейчас они используются для определения запахов, создания искусственной кожи с тактильными сенсорами и определения объектов на видео. Правда, есть нюансы — для их запуска нужно создавать новое железо и алгоритмы, обучать разработчиков, а это всё требует огромных вложений. Да и алгоритмов, которые в полной мере раскроют возможности таких систем, на сегодняшний день нет.
Но зато есть понимание, насколько много заработает компания, которая первой сможет сделать рабочий нейроморфный чип и предложит варианты его внедрения в производство. Свои разработки есть как у крупных компаний — IBM (чип NorthPole) и Intel (Loihi) — так и у более маленьких. Ещё в 2021 году на рынке появился первый коммерческий нейроморфный чип Akida от компании BrainChip. Правда, данных о количестве продаж нет, а годовая чистая прибыль компании остаётся отрицательной с 2019 года.
Россия пока отстаёт за зарубежных конкурентов, но ведёт разработку своих нейроморфных чипов. В 2020 году компания Мотив НТ вместе с Лабораторией Касперского выпустила чип Алтай, через 2 года — создали программно-аппаратную платформу KNP (Kaspersky Neuromorphic Platform) для разработки и исследования импульсных нейронных сетей. Код платформы выложили в открытый доступ на Гитхаб. А в октябре 2024 года учёные из Университета ИТМО, СПбГУ и Тунцзи разработали нейроморфный вычислительный элемент на базе кристалла.
Сейчас на фоне недостатка данных, роста нагрузок на ЦОДы и крупные инвестиции ведущих ИИ-компаний в разработку агентов и роботов интерес к нейроморфным системам растёт. И важно, что подобные разработки есть у очень небольшого числа «игроков» — США, Китая, России и ЕС. Поэтому Россия вполне может получить преимущество (хотя бы региональное) на рынке нейроморфных технологий, если получится преодолеть текущие ограничения.
👍1🍾1
Японцы проснулись и начали думать про ИИ
Началось всё с обещания золотых гор от правительства Японии Rapidus, Sony, Panasonic и другим компаниям на развитие ИИ. А теперь Panasonic объявили о партнерстве с Anthropic, создателями Claude AI, и хотят к 2035 году получать 30% выручки от продуктов с ИИ.
Первым шагом на этом пути стал Umi — умный семейный помощник и фитнес-тренер с Claude. Он будет помогать семьям поддерживать здоровье, создавать индивидуальное расписание для тренировок и приёмов пищи, достигать целей в фитнесе и ПП. Чем он принципиально отличается от других бесконечных ассистентов, не совсем понятно.
Но это только начало. Panasonic собирается добавить Claude в целый ряд систем, от обслуживания клиентов до маркетинга. А дальше под шумок запустить помощника в США и скооперироваться с Well’s Partner Collective (сеть брендов, ориентированных на здоровый образ жизни).
Несмотря на амбиции, Panasonic и Anthropic предстоит решить ряд инфраструктурных проблем. Совсем недавно сервера Antrophic не смогли обработать запросы пользователей Cursor AI, умного редактора кода — им просто не хватило видеокарт. Claude популярен у пользователей, потому что стоит дешевле решений OpenAI и работает на сопоставимом уровне. Им пользуются, в частности, Perplexity и GitHub Copilot — также ведущие ИИ-сервисы с большой аудиторией.
Anthropic пытаются решить проблему нехватки мощностей за счёт партнёрства с AWS (Amazon Web Services) и переноса вычислений к ним в облако, но эту проблему вряд ли удастся решить окончательно — точно не с архитектурой трансформеров, где учеличение числа параметров становится причиной бесконечного роста требований к железу. С учётом потенциальной новой аудитории из японцев и других пользователей сервисов Panasonic, компанию ждёт интересный вызов по наращиванию производительности серверов.
Началось всё с обещания золотых гор от правительства Японии Rapidus, Sony, Panasonic и другим компаниям на развитие ИИ. А теперь Panasonic объявили о партнерстве с Anthropic, создателями Claude AI, и хотят к 2035 году получать 30% выручки от продуктов с ИИ.
Первым шагом на этом пути стал Umi — умный семейный помощник и фитнес-тренер с Claude. Он будет помогать семьям поддерживать здоровье, создавать индивидуальное расписание для тренировок и приёмов пищи, достигать целей в фитнесе и ПП. Чем он принципиально отличается от других бесконечных ассистентов, не совсем понятно.
Но это только начало. Panasonic собирается добавить Claude в целый ряд систем, от обслуживания клиентов до маркетинга. А дальше под шумок запустить помощника в США и скооперироваться с Well’s Partner Collective (сеть брендов, ориентированных на здоровый образ жизни).
Несмотря на амбиции, Panasonic и Anthropic предстоит решить ряд инфраструктурных проблем. Совсем недавно сервера Antrophic не смогли обработать запросы пользователей Cursor AI, умного редактора кода — им просто не хватило видеокарт. Claude популярен у пользователей, потому что стоит дешевле решений OpenAI и работает на сопоставимом уровне. Им пользуются, в частности, Perplexity и GitHub Copilot — также ведущие ИИ-сервисы с большой аудиторией.
Anthropic пытаются решить проблему нехватки мощностей за счёт партнёрства с AWS (Amazon Web Services) и переноса вычислений к ним в облако, но эту проблему вряд ли удастся решить окончательно — точно не с архитектурой трансформеров, где учеличение числа параметров становится причиной бесконечного роста требований к железу. С учётом потенциальной новой аудитории из японцев и других пользователей сервисов Panasonic, компанию ждёт интересный вызов по наращиванию производительности серверов.
👍2🔥1
Forwarded from Content Review
Apple изолировала галлюцинирующий новостной ИИ
В новой публичной версии iOS 18.3 beta 3 внесены важные изменения
После многочисленных жалоб СМИ и, в частности BBC, на искажение новостей и указание СМИ как источника в уведомлениях Apple Intelligence, Apple наконец-то внесла значительные корректировки в вышедшей публичной iOS 18.3 beta 3. Пользователям стало доступным управление «придуманными» уведомлениями, которые формируются «искусственным интеллектом» Apple Intelligence.
Во-первых, теперь при активации «коротких уведомлений», iOS будет уведомлять, что эта функция является экспериментальной (получая таким образом информирование согласие пользователя). Во-вторых, отключать такие уведомления можно будет с экрана блокировки или в «Центре уведомлений», выбрав в параметрах опцию «Отключить краткие уведомления». Также сами уведомления, формируемые Apple Intelligence, будут использовать наклонный шрифт, что будет выделять их на фоне стандартных, контролируемых самим приложением, уведомлений. Наконец, в приложении «Настройки» Apple будет предупреждать, что краткие описания уведомлений «могут содержать ошибки».
Но главное обновление заключается в том, что эти «сводки» будут полностью отключены для категории приложений «Новости и развлечения». Они вернутся в будущих обновлениях, очевидно после того, как Apple придумает, как исключить из них дезинформацию.
Больше всего от внедрения «кратких уведомлений», в которых Apple с помощью ИИ переписывала новости и приписывала их источнику, пострадала новостная служба BBC. В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
В новой публичной версии iOS 18.3 beta 3 внесены важные изменения
После многочисленных жалоб СМИ и, в частности BBC, на искажение новостей и указание СМИ как источника в уведомлениях Apple Intelligence, Apple наконец-то внесла значительные корректировки в вышедшей публичной iOS 18.3 beta 3. Пользователям стало доступным управление «придуманными» уведомлениями, которые формируются «искусственным интеллектом» Apple Intelligence.
Во-первых, теперь при активации «коротких уведомлений», iOS будет уведомлять, что эта функция является экспериментальной (получая таким образом информирование согласие пользователя). Во-вторых, отключать такие уведомления можно будет с экрана блокировки или в «Центре уведомлений», выбрав в параметрах опцию «Отключить краткие уведомления». Также сами уведомления, формируемые Apple Intelligence, будут использовать наклонный шрифт, что будет выделять их на фоне стандартных, контролируемых самим приложением, уведомлений. Наконец, в приложении «Настройки» Apple будет предупреждать, что краткие описания уведомлений «могут содержать ошибки».
Но главное обновление заключается в том, что эти «сводки» будут полностью отключены для категории приложений «Новости и развлечения». Они вернутся в будущих обновлениях, очевидно после того, как Apple придумает, как исключить из них дезинформацию.
Больше всего от внедрения «кратких уведомлений», в которых Apple с помощью ИИ переписывала новости и приписывала их источнику, пострадала новостная служба BBC. В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
Forwarded from TechnoME: Multimediamind
#лонгриднавыходные
Очень занятная аналогия выпрыгнула на меня из глобальной информационной сети: ИИ как фея Динь-Динь.
Улавливаете? 🤌
В истории про Питера Пэна фея Tinkerbell (Динь-Динь) существует, только если люди верят в нее. И хлопают ей. Как только мы перестаем верить в магию феи, она начинает исчезать. И в этот момент фея умоляет всех вокруг хлопать как можно громче. Динь-Динь необходимо наше внимание, чтобы жить!
Джатан Садовски — старший преподаватель факультета информационных технологий Университета Монаша (Австралия), — написал для издания Fururism необыкновенно увлекательный текст про ИИ. Именно такой, которого мне не хватало.
Как размышляет Садовски, развивающаяся технология очень похожа на фею Tinkerbell. Когда она пытается перейти от фантазий на тему «как это должно работать» к практическому применению в повседневной жизни и работе, её существование зависит от нашей веры в магию её возможностей. А они воплощаются только тогда, когда мы достаточно сильно верим и достаточно громко хлопаем.
Если мы перестанем верить и хлопать, то весь «прогресс» может раствориться в воздухе. Так уже не раз бывало со многими «перспективными» разработками.
Будущее ИИ зависит от нашей с вами веры и от поддержки тех людей, которые трудятся на фабрике футуризма. Это руководители компаний, консультанты, журналисты, визионеры, которые формируют видение конкретного будущего — например, такого, в котором модели ИИ, созданные OpenAI или Microsoft, являются неоспоримыми силами прогресса. Они создают ожидания общественности относительно возможностей и результатов применения технологических продуктов.
Нет, Садовски не пишет, что ИИ — очередной пузырь. Он просто отмечает, что технологиям ИИ придётся пройти немало препятствий на пути своего развития. Уже в этом году станет труднее, ожидания инвесторов должны чем-то подкрепляться.
И я, несмотря на некоторые выступления в этом канале, тоже не считаю, что ИИ — это пузырь, который искусственно надувается. Видела возможности применения, слышала от гораздо более умных, чем я, людей расчёты и прогнозы. Всё вполне весомо и уже работает, а дальше — больше. Шелуха спадёт, останется важное.
Но помните тот манифест Сэма Альтмана про новую эру и всю эту ИИ-утопию? Вот это, думаю я, так и останется в головах энтузиастов. А настоящие люди слать хотели весь этот ИИ куда подальше. Земля — она гораздо больше, чем бигтехи. И людей на ней 8 миллиардов. Интернет ещё не везде провели, да что там, голод не везде победили. А они нам про повсеместный ИИ рассказывают. Попробуйте, да, внедрите.
Не говоря уже о том, что сама OpenAI терпит огромные убытки (ок, несёт издержки) — даже со своими двухсотлолларовыми подписками. И чем больше людей веруют в магию чат джипити, тем больше затрат несёт компания-создатель. Вот такой вот парадокс.
А дальше… Дальше порешает рыночная экономика 🤷🏻♀️
Очень занятная аналогия выпрыгнула на меня из глобальной информационной сети: ИИ как фея Динь-Динь.
Улавливаете? 🤌
В истории про Питера Пэна фея Tinkerbell (Динь-Динь) существует, только если люди верят в нее. И хлопают ей. Как только мы перестаем верить в магию феи, она начинает исчезать. И в этот момент фея умоляет всех вокруг хлопать как можно громче. Динь-Динь необходимо наше внимание, чтобы жить!
Джатан Садовски — старший преподаватель факультета информационных технологий Университета Монаша (Австралия), — написал для издания Fururism необыкновенно увлекательный текст про ИИ. Именно такой, которого мне не хватало.
Как размышляет Садовски, развивающаяся технология очень похожа на фею Tinkerbell. Когда она пытается перейти от фантазий на тему «как это должно работать» к практическому применению в повседневной жизни и работе, её существование зависит от нашей веры в магию её возможностей. А они воплощаются только тогда, когда мы достаточно сильно верим и достаточно громко хлопаем.
Если мы перестанем верить и хлопать, то весь «прогресс» может раствориться в воздухе. Так уже не раз бывало со многими «перспективными» разработками.
Будущее ИИ зависит от нашей с вами веры и от поддержки тех людей, которые трудятся на фабрике футуризма. Это руководители компаний, консультанты, журналисты, визионеры, которые формируют видение конкретного будущего — например, такого, в котором модели ИИ, созданные OpenAI или Microsoft, являются неоспоримыми силами прогресса. Они создают ожидания общественности относительно возможностей и результатов применения технологических продуктов.
Нет, Садовски не пишет, что ИИ — очередной пузырь. Он просто отмечает, что технологиям ИИ придётся пройти немало препятствий на пути своего развития. Уже в этом году станет труднее, ожидания инвесторов должны чем-то подкрепляться.
И я, несмотря на некоторые выступления в этом канале, тоже не считаю, что ИИ — это пузырь, который искусственно надувается. Видела возможности применения, слышала от гораздо более умных, чем я, людей расчёты и прогнозы. Всё вполне весомо и уже работает, а дальше — больше. Шелуха спадёт, останется важное.
Но помните тот манифест Сэма Альтмана про новую эру и всю эту ИИ-утопию? Вот это, думаю я, так и останется в головах энтузиастов. А настоящие люди слать хотели весь этот ИИ куда подальше. Земля — она гораздо больше, чем бигтехи. И людей на ней 8 миллиардов. Интернет ещё не везде провели, да что там, голод не везде победили. А они нам про повсеместный ИИ рассказывают. Попробуйте, да, внедрите.
Не говоря уже о том, что сама OpenAI терпит огромные убытки (ок, несёт издержки) — даже со своими двухсотлолларовыми подписками. И чем больше людей веруют в магию чат джипити, тем больше затрат несёт компания-создатель. Вот такой вот парадокс.
А дальше… Дальше порешает рыночная экономика 🤷🏻♀️
Futurism
AI Is Like Tinkerbell: It Only Works If We Believe in It
AI is like the fairy Tinkerbell: in the story of "Peter Pan," she only continues to exist if people believe in her and clap for her.
Чтобы ИИ перестал быть абстрактным «инструментом» и стал настоящей движущей силой экономики и безопасности, требуется нечто большее, чем алгоритмы и амбиции — нужна инфраструктура. В преддверии своего ухода с поста президента Джо Байден подписал указ, направленный на укрепление лидерства США в области инфраструктуры для искусственного интеллекта. И в этом документе есть несколько любопытных моментов.
Например, создание ЦОДов стало задачей национальной безопасности. Для этого были задействованы федеральные земли, участки которых должны быть отданы в аренду частным компаниям.
Не забыл президент и про «экологическое лобби» — упомянутые выше арендаторы должны строить для своих ЦОДов автономные источники чистой энергии. Принято такое решение с целью предотвращения роста цен на электроэнергию для живущих вокруг центров потребителей, но получится ли этого избежать — вопрос открытый (тем более что фильм «Планета людей», спродюссированный Майклом Муром, отлично показал легкость, с которой можно обходить подобные ограничения).
Есть и другие нюансы. Центры требуют для охлаждения воды, а с водой в некоторых регионах США вроде Аризоны, Нью-Мексико, Колорадо, Калифорнии и так далее — проблемы. При этом проект не предполагает напрямую выделение льгот или субсидий, так что все траты ложатся на плечи операторов.
Все эти решения приняты ради безопасности данных — американцы прекрасно понимают, что отдавать свои секреты за границу не стоит. Инфраструктура также станет основой для реализации других планов из указов, вышедших одновременно с этим — по укреплению кибербезопасности и развитию ИИ.
Россия выбрала немного иной подход к развитию ЦОДов и активно вкладывает в это бюджетные средства.
До 2030 года на два федеральных проекта в этом направлении* выделено около 136 миллиардов рублей. Это вполне логично, учитывая, что стоимость доставки западных компонентов в Россию выросла из-за санкций, и государство будет частично компенсировать компаниям эти затраты. Некоторые депутаты даже предлагали строить ЦОДы на севере, чтобы экономить на охлаждении, хотя в таком случае остаётся вопрос о скорости доставки данных до потребителей.
Читаем указ и ещё раз вспоминаем, что дата-центры стали за последние несколько лет объектами стратегического значения, от которых зависят технологии и национальная безопасность.
*Упомянутые федеральные проекты — «Развитие инфраструктуры использования ИИ и работы с большими данными» и «Поддержка новых разработок программных решений и их внедрения в отраслях экономики»
Например, создание ЦОДов стало задачей национальной безопасности. Для этого были задействованы федеральные земли, участки которых должны быть отданы в аренду частным компаниям.
Не забыл президент и про «экологическое лобби» — упомянутые выше арендаторы должны строить для своих ЦОДов автономные источники чистой энергии. Принято такое решение с целью предотвращения роста цен на электроэнергию для живущих вокруг центров потребителей, но получится ли этого избежать — вопрос открытый (тем более что фильм «Планета людей», спродюссированный Майклом Муром, отлично показал легкость, с которой можно обходить подобные ограничения).
Есть и другие нюансы. Центры требуют для охлаждения воды, а с водой в некоторых регионах США вроде Аризоны, Нью-Мексико, Колорадо, Калифорнии и так далее — проблемы. При этом проект не предполагает напрямую выделение льгот или субсидий, так что все траты ложатся на плечи операторов.
Все эти решения приняты ради безопасности данных — американцы прекрасно понимают, что отдавать свои секреты за границу не стоит. Инфраструктура также станет основой для реализации других планов из указов, вышедших одновременно с этим — по укреплению кибербезопасности и развитию ИИ.
Россия выбрала немного иной подход к развитию ЦОДов и активно вкладывает в это бюджетные средства.
До 2030 года на два федеральных проекта в этом направлении* выделено около 136 миллиардов рублей. Это вполне логично, учитывая, что стоимость доставки западных компонентов в Россию выросла из-за санкций, и государство будет частично компенсировать компаниям эти затраты. Некоторые депутаты даже предлагали строить ЦОДы на севере, чтобы экономить на охлаждении, хотя в таком случае остаётся вопрос о скорости доставки данных до потребителей.
Читаем указ и ещё раз вспоминаем, что дата-центры стали за последние несколько лет объектами стратегического значения, от которых зависят технологии и национальная безопасность.
*Упомянутые федеральные проекты — «Развитие инфраструктуры использования ИИ и работы с большими данными» и «Поддержка новых разработок программных решений и их внедрения в отраслях экономики»
👍2🔥1🙈1
Что за DeepSeek и почему их новая модель — прорыв в ИИ?
Мы и раньше видели новости о достижениях китайских компаний в области LLM, но вышедшая на днях модель DeepSeek-R1 удивляет даже на фоне предыдущих громких релизов. Компания не только бросила вызов лидерам индустрии на Западе, но и подтвердила высокий уровень китайских разработок. Обо всём по порядку.
R1 — это «думающая» модель с 671 миллиардом параметров, одна из самых больших на рынке. Бенчмарки и тесты показывают, что по качеству она сравнима с одной из самых продвинутых моделей от OpenAI — o1 (правда, та уже относится к предыдущему поколению), с особенно сильными результатами в математике и кодинге.
Достижения модели — результат в том числе необычного и инновационного подхода к обучению. R1 обучалась исключительно методом обучения с подкреплением (Reinforcement Learning), без привычного этапа предварительного обучения на огромном массиве данных. Это позволило R1 развить эмерджентные свойства, то есть экспериментировать и действовать не так, как задумали авторы. Она способна к «самоанализу» и произвольно увеличивает время «размышлений», Chain of Thought, для решения сложных задач (её этому не учили).
Ключевыми преимуществами R1 являются низкая стоимость — API DeepSeek стоит примерно на 90% дешевле OpenAI и Anthropic, и открытый исходный код. Это позволяет пользователям адаптировать модель под свои задачи и использовать её в коммерческих проектах, что особенно важно для стартапов и бизнеса. Отдельно стоит отметить перевод на китайский — вроде как пока она показывает лучший результат в этой области. Единственный нюанс — стоит иметь в виду при работе с моделью, что на вопросы про Китай она либо не отвечает, либо поддерживает официальную позицию КПК.
Откуда вообще взялись DeepSeek? Компания была основана в 2023 году в Ханчжоу, став частью хедж-фонда High-Flyer. Генеральный директор DeepSeek — Лян Вэнфэн, выпускник факультета компьютерных наук, «китайский Сэм Альтман». Откуда конкретно они получают финансирование — загадка. Однако известно, что компанию спонсируют разные фонды: конкретного списка нет, как и известных источников государственного финансирования. Сам Лян Вэнфэн заявил об отсутствии проблем с деньгами, зато пожаловался на недостаток чипов для обучения из-за санкций США.
После релиза R1 CEO DeepSeek встретился с премьер-министром Китая. Делать выводы пока рано, но это может свидетельствовать об официальной государственной поддержке компании со стороны КПК. Хотя уже понятно, что DeepSeek, с её демпинговыми ценами, прорывными идеями в разработке ИИ и философией продвижения продуктов с открытым исходным кодом — стала одной из самых значимых компаний Китая и мира в сфере искусственного интеллекта.
А ведь год только начался…
Мы и раньше видели новости о достижениях китайских компаний в области LLM, но вышедшая на днях модель DeepSeek-R1 удивляет даже на фоне предыдущих громких релизов. Компания не только бросила вызов лидерам индустрии на Западе, но и подтвердила высокий уровень китайских разработок. Обо всём по порядку.
R1 — это «думающая» модель с 671 миллиардом параметров, одна из самых больших на рынке. Бенчмарки и тесты показывают, что по качеству она сравнима с одной из самых продвинутых моделей от OpenAI — o1 (правда, та уже относится к предыдущему поколению), с особенно сильными результатами в математике и кодинге.
Достижения модели — результат в том числе необычного и инновационного подхода к обучению. R1 обучалась исключительно методом обучения с подкреплением (Reinforcement Learning), без привычного этапа предварительного обучения на огромном массиве данных. Это позволило R1 развить эмерджентные свойства, то есть экспериментировать и действовать не так, как задумали авторы. Она способна к «самоанализу» и произвольно увеличивает время «размышлений», Chain of Thought, для решения сложных задач (её этому не учили).
Ключевыми преимуществами R1 являются низкая стоимость — API DeepSeek стоит примерно на 90% дешевле OpenAI и Anthropic, и открытый исходный код. Это позволяет пользователям адаптировать модель под свои задачи и использовать её в коммерческих проектах, что особенно важно для стартапов и бизнеса. Отдельно стоит отметить перевод на китайский — вроде как пока она показывает лучший результат в этой области. Единственный нюанс — стоит иметь в виду при работе с моделью, что на вопросы про Китай она либо не отвечает, либо поддерживает официальную позицию КПК.
Откуда вообще взялись DeepSeek? Компания была основана в 2023 году в Ханчжоу, став частью хедж-фонда High-Flyer. Генеральный директор DeepSeek — Лян Вэнфэн, выпускник факультета компьютерных наук, «китайский Сэм Альтман». Откуда конкретно они получают финансирование — загадка. Однако известно, что компанию спонсируют разные фонды: конкретного списка нет, как и известных источников государственного финансирования. Сам Лян Вэнфэн заявил об отсутствии проблем с деньгами, зато пожаловался на недостаток чипов для обучения из-за санкций США.
После релиза R1 CEO DeepSeek встретился с премьер-министром Китая. Делать выводы пока рано, но это может свидетельствовать об официальной государственной поддержке компании со стороны КПК. Хотя уже понятно, что DeepSeek, с её демпинговыми ценами, прорывными идеями в разработке ИИ и философией продвижения продуктов с открытым исходным кодом — стала одной из самых значимых компаний Китая и мира в сфере искусственного интеллекта.
А ведь год только начался…
🔥3💘2
Аишка
Если вам не нравится перспектива платить за ChatGPT Plus или ждать анонса поддержки русского языка в Apple Intelligence (которая не факт, что будет) — есть возможность пользоваться похожими функциями уже сейчас, бесплатно и на своём устройстве. Причём даже…
This media is not supported in your browser
VIEW IN TELEGRAM
Настало время обновления нашего небольшого гайда по локальному запуску ИИ-моделей.
На этот раз речь пойдёт о «думающей» модели, специально дообученной для русского языка.
Разработчик с канала Pavel Zloi натренировал модель GigaChat 20B-A3B от Сбера. Кстати, как раз сделанную на основе DeepSeek, да ещё и с MoE архитектурой, которая позволяет не задействовать сразу все параметры модели и экономить ресурсы.
Он использовал для этого специальный переведённый дата-сет, активирующий у модели возможность «думать» (ту самую цепочку рассуждений).
В итоге «думающую» модель на 20 миллиардов параметров, адаптированную для русского языка, можно запустить даже на не самом мощном компьютере — и получить неплохой результат в задачах, связанных с кодом, логикой, математикой и анализом текста. При желании её можно развернуть на собственном сервере и использовать в любом месте даже с телефона — при этом никто не будет иметь доступа к вашим данным.
Конечно, есть нюансы — не самое удобное форматирование вывода, периодические случаи, когда модель зацикливается и выдаёт бесконечно одни и те же токены. Ну и важно понимать, что в данном случае «размышляет» модель не идеально. Хотя для бытовых задач по суммаризации информации, изменению стиля текста, его анализа и переписывания — модель подходит неплохо.
Но самое главное: такие проекты дают надежду, что совсем скоро практически любые устройства локально смогут запускать мощные модели — или даже агентов —которые будут помогать пользователям с обработкой фото, видео, текста, планированием задач и так далее.
На этот раз речь пойдёт о «думающей» модели, специально дообученной для русского языка.
Разработчик с канала Pavel Zloi натренировал модель GigaChat 20B-A3B от Сбера. Кстати, как раз сделанную на основе DeepSeek, да ещё и с MoE архитектурой, которая позволяет не задействовать сразу все параметры модели и экономить ресурсы.
Он использовал для этого специальный переведённый дата-сет, активирующий у модели возможность «думать» (ту самую цепочку рассуждений).
В итоге «думающую» модель на 20 миллиардов параметров, адаптированную для русского языка, можно запустить даже на не самом мощном компьютере — и получить неплохой результат в задачах, связанных с кодом, логикой, математикой и анализом текста. При желании её можно развернуть на собственном сервере и использовать в любом месте даже с телефона — при этом никто не будет иметь доступа к вашим данным.
Конечно, есть нюансы — не самое удобное форматирование вывода, периодические случаи, когда модель зацикливается и выдаёт бесконечно одни и те же токены. Ну и важно понимать, что в данном случае «размышляет» модель не идеально. Хотя для бытовых задач по суммаризации информации, изменению стиля текста, его анализа и переписывания — модель подходит неплохо.
Но самое главное: такие проекты дают надежду, что совсем скоро практически любые устройства локально смогут запускать мощные модели — или даже агентов —которые будут помогать пользователям с обработкой фото, видео, текста, планированием задач и так далее.
👍2