Аишка
Яндекс Клавиатура пробует поздравить собеседника за вас В приложение добавили кнопку «Поздравить», которая подключает YandexGPT и генерит текст поздравления в заданном стиле Нашлась замена открыткам с блестками в Вотсапе?
Ещё недавно мы писали про Яндекс Клавиатуру, которая добавила функцию генерации поздравлений с помощью YandexGPT перед Новым годом. Возможно, пытаясь занять нишу открыток для дальних родственников.
А сегодня посмотрели на статистику от приложения Почты Mail, которые тоже предлагали такую функцию на базе генеративной сети ВК.
Оказывается, генерация поздравлений была самой востребованной функцией перед Новым годом и в начале января🤷♂️
Ещё аналитики говорят, что популярность использования ИИ выросла на 68% по сравнению с предыдущим кварталом — что не удивительно, ведь генеративные функции в бете были запущены не так давно, в феврале 2024 года, и сейчас люди как раз осваивают эти инструменты.
На втором месте после поздравлений — генерация откликов на вакансии. Видимо, русский человек даже в новогодние каникулы не перестаёт искать работу.
Правда, учитывая некоторые текущие «особенности» модели — например, нейросеть от ВК упорно считает себя «Алисой», которая может «отвечать на вопросы о погоде, маршрутах, новостях» — использовать её для тех же откликов на вакансии, наверное, рановато, и лучше ограничиться поздравлениями.
Если говорить про другие интересные кейсы применения ИИ для поздравлений, то отдельные зарубежные умельцы вроде Gan ai дали возможность сгенерировать видео с озвучкой текста пользователей от ИИ-Санты. Посмотрим, появятся ли такие сервисы в России перед следующим Новым годом, но уже есть ощущение, что профессия составителя текстов для поздравительных открыток из фильма «500 дней лета» больше не актуальна.
А сегодня посмотрели на статистику от приложения Почты Mail, которые тоже предлагали такую функцию на базе генеративной сети ВК.
Оказывается, генерация поздравлений была самой востребованной функцией перед Новым годом и в начале января
Ещё аналитики говорят, что популярность использования ИИ выросла на 68% по сравнению с предыдущим кварталом — что не удивительно, ведь генеративные функции в бете были запущены не так давно, в феврале 2024 года, и сейчас люди как раз осваивают эти инструменты.
На втором месте после поздравлений — генерация откликов на вакансии. Видимо, русский человек даже в новогодние каникулы не перестаёт искать работу.
Правда, учитывая некоторые текущие «особенности» модели — например, нейросеть от ВК упорно считает себя «Алисой», которая может «отвечать на вопросы о погоде, маршрутах, новостях» — использовать её для тех же откликов на вакансии, наверное, рановато, и лучше ограничиться поздравлениями.
Если говорить про другие интересные кейсы применения ИИ для поздравлений, то отдельные зарубежные умельцы вроде Gan ai дали возможность сгенерировать видео с озвучкой текста пользователей от ИИ-Санты. Посмотрим, появятся ли такие сервисы в России перед следующим Новым годом, но уже есть ощущение, что профессия составителя текстов для поздравительных открыток из фильма «500 дней лета» больше не актуальна.
Please open Telegram to view this post
VIEW IN TELEGRAM
☃2😁1
Почему просто не скопировать мозг?
Зачем нам огромные ЦОДы с малыми ядерными реакторами для питания, на которых запускаются удалённо модельки с сотнями миллиардов параметров — если есть мозг? Мозг человека маленький, энергоёмкий, помещается в голове и практически идеально справляется с любыми задачами, от распознавания объектов и запахов до генерации связного текста или решения сложных уравнений. Почему бы просто его не скопировать?
«Скопировать» мозг как раз призваны нейроморфные технологии. Они могут привести нас к энергоэффективному и автономному будущему — если получится преодолеть огромные сложности по разработке платформ и алгоритмов.
Вместо привычной для архитектуры фон Неймана схемы «память — процессор» нейроморфные системы соединяют вычислительные элементы и память в единую сеть, как нейроны и синапсы в мозге. Запоминание в спайковых (импульсных) нейроных сетях происходит через параллельную активацию определённых нейронов, и данные не записываются куда-то в хранилище, а сохраняются «во времени» через цепочку последовательных активаций.
Такие системы идеально подойдут для автономных устройств, потому что вычисления будут происходить локально, энергоэффективно и без задержек. Уже сейчас они используются для определения запахов, создания искусственной кожи с тактильными сенсорами и определения объектов на видео. Правда, есть нюансы — для их запуска нужно создавать новое железо и алгоритмы, обучать разработчиков, а это всё требует огромных вложений. Да и алгоритмов, которые в полной мере раскроют возможности таких систем, на сегодняшний день нет.
Но зато есть понимание, насколько много заработает компания, которая первой сможет сделать рабочий нейроморфный чип и предложит варианты его внедрения в производство. Свои разработки есть как у крупных компаний — IBM (чип NorthPole) и Intel (Loihi) — так и у более маленьких. Ещё в 2021 году на рынке появился первый коммерческий нейроморфный чип Akida от компании BrainChip. Правда, данных о количестве продаж нет, а годовая чистая прибыль компании остаётся отрицательной с 2019 года.
Россия пока отстаёт за зарубежных конкурентов, но ведёт разработку своих нейроморфных чипов. В 2020 году компания Мотив НТ вместе с Лабораторией Касперского выпустила чип Алтай, через 2 года — создали программно-аппаратную платформу KNP (Kaspersky Neuromorphic Platform) для разработки и исследования импульсных нейронных сетей. Код платформы выложили в открытый доступ на Гитхаб. А в октябре 2024 года учёные из Университета ИТМО, СПбГУ и Тунцзи разработали нейроморфный вычислительный элемент на базе кристалла.
Сейчас на фоне недостатка данных, роста нагрузок на ЦОДы и крупные инвестиции ведущих ИИ-компаний в разработку агентов и роботов интерес к нейроморфным системам растёт. И важно, что подобные разработки есть у очень небольшого числа «игроков» — США, Китая, России и ЕС. Поэтому Россия вполне может получить преимущество (хотя бы региональное) на рынке нейроморфных технологий, если получится преодолеть текущие ограничения.
Зачем нам огромные ЦОДы с малыми ядерными реакторами для питания, на которых запускаются удалённо модельки с сотнями миллиардов параметров — если есть мозг? Мозг человека маленький, энергоёмкий, помещается в голове и практически идеально справляется с любыми задачами, от распознавания объектов и запахов до генерации связного текста или решения сложных уравнений. Почему бы просто его не скопировать?
«Скопировать» мозг как раз призваны нейроморфные технологии. Они могут привести нас к энергоэффективному и автономному будущему — если получится преодолеть огромные сложности по разработке платформ и алгоритмов.
Вместо привычной для архитектуры фон Неймана схемы «память — процессор» нейроморфные системы соединяют вычислительные элементы и память в единую сеть, как нейроны и синапсы в мозге. Запоминание в спайковых (импульсных) нейроных сетях происходит через параллельную активацию определённых нейронов, и данные не записываются куда-то в хранилище, а сохраняются «во времени» через цепочку последовательных активаций.
Такие системы идеально подойдут для автономных устройств, потому что вычисления будут происходить локально, энергоэффективно и без задержек. Уже сейчас они используются для определения запахов, создания искусственной кожи с тактильными сенсорами и определения объектов на видео. Правда, есть нюансы — для их запуска нужно создавать новое железо и алгоритмы, обучать разработчиков, а это всё требует огромных вложений. Да и алгоритмов, которые в полной мере раскроют возможности таких систем, на сегодняшний день нет.
Но зато есть понимание, насколько много заработает компания, которая первой сможет сделать рабочий нейроморфный чип и предложит варианты его внедрения в производство. Свои разработки есть как у крупных компаний — IBM (чип NorthPole) и Intel (Loihi) — так и у более маленьких. Ещё в 2021 году на рынке появился первый коммерческий нейроморфный чип Akida от компании BrainChip. Правда, данных о количестве продаж нет, а годовая чистая прибыль компании остаётся отрицательной с 2019 года.
Россия пока отстаёт за зарубежных конкурентов, но ведёт разработку своих нейроморфных чипов. В 2020 году компания Мотив НТ вместе с Лабораторией Касперского выпустила чип Алтай, через 2 года — создали программно-аппаратную платформу KNP (Kaspersky Neuromorphic Platform) для разработки и исследования импульсных нейронных сетей. Код платформы выложили в открытый доступ на Гитхаб. А в октябре 2024 года учёные из Университета ИТМО, СПбГУ и Тунцзи разработали нейроморфный вычислительный элемент на базе кристалла.
Сейчас на фоне недостатка данных, роста нагрузок на ЦОДы и крупные инвестиции ведущих ИИ-компаний в разработку агентов и роботов интерес к нейроморфным системам растёт. И важно, что подобные разработки есть у очень небольшого числа «игроков» — США, Китая, России и ЕС. Поэтому Россия вполне может получить преимущество (хотя бы региональное) на рынке нейроморфных технологий, если получится преодолеть текущие ограничения.
👍1🍾1
Японцы проснулись и начали думать про ИИ
Началось всё с обещания золотых гор от правительства Японии Rapidus, Sony, Panasonic и другим компаниям на развитие ИИ. А теперь Panasonic объявили о партнерстве с Anthropic, создателями Claude AI, и хотят к 2035 году получать 30% выручки от продуктов с ИИ.
Первым шагом на этом пути стал Umi — умный семейный помощник и фитнес-тренер с Claude. Он будет помогать семьям поддерживать здоровье, создавать индивидуальное расписание для тренировок и приёмов пищи, достигать целей в фитнесе и ПП. Чем он принципиально отличается от других бесконечных ассистентов, не совсем понятно.
Но это только начало. Panasonic собирается добавить Claude в целый ряд систем, от обслуживания клиентов до маркетинга. А дальше под шумок запустить помощника в США и скооперироваться с Well’s Partner Collective (сеть брендов, ориентированных на здоровый образ жизни).
Несмотря на амбиции, Panasonic и Anthropic предстоит решить ряд инфраструктурных проблем. Совсем недавно сервера Antrophic не смогли обработать запросы пользователей Cursor AI, умного редактора кода — им просто не хватило видеокарт. Claude популярен у пользователей, потому что стоит дешевле решений OpenAI и работает на сопоставимом уровне. Им пользуются, в частности, Perplexity и GitHub Copilot — также ведущие ИИ-сервисы с большой аудиторией.
Anthropic пытаются решить проблему нехватки мощностей за счёт партнёрства с AWS (Amazon Web Services) и переноса вычислений к ним в облако, но эту проблему вряд ли удастся решить окончательно — точно не с архитектурой трансформеров, где учеличение числа параметров становится причиной бесконечного роста требований к железу. С учётом потенциальной новой аудитории из японцев и других пользователей сервисов Panasonic, компанию ждёт интересный вызов по наращиванию производительности серверов.
Началось всё с обещания золотых гор от правительства Японии Rapidus, Sony, Panasonic и другим компаниям на развитие ИИ. А теперь Panasonic объявили о партнерстве с Anthropic, создателями Claude AI, и хотят к 2035 году получать 30% выручки от продуктов с ИИ.
Первым шагом на этом пути стал Umi — умный семейный помощник и фитнес-тренер с Claude. Он будет помогать семьям поддерживать здоровье, создавать индивидуальное расписание для тренировок и приёмов пищи, достигать целей в фитнесе и ПП. Чем он принципиально отличается от других бесконечных ассистентов, не совсем понятно.
Но это только начало. Panasonic собирается добавить Claude в целый ряд систем, от обслуживания клиентов до маркетинга. А дальше под шумок запустить помощника в США и скооперироваться с Well’s Partner Collective (сеть брендов, ориентированных на здоровый образ жизни).
Несмотря на амбиции, Panasonic и Anthropic предстоит решить ряд инфраструктурных проблем. Совсем недавно сервера Antrophic не смогли обработать запросы пользователей Cursor AI, умного редактора кода — им просто не хватило видеокарт. Claude популярен у пользователей, потому что стоит дешевле решений OpenAI и работает на сопоставимом уровне. Им пользуются, в частности, Perplexity и GitHub Copilot — также ведущие ИИ-сервисы с большой аудиторией.
Anthropic пытаются решить проблему нехватки мощностей за счёт партнёрства с AWS (Amazon Web Services) и переноса вычислений к ним в облако, но эту проблему вряд ли удастся решить окончательно — точно не с архитектурой трансформеров, где учеличение числа параметров становится причиной бесконечного роста требований к железу. С учётом потенциальной новой аудитории из японцев и других пользователей сервисов Panasonic, компанию ждёт интересный вызов по наращиванию производительности серверов.
👍2🔥1
Forwarded from Content Review
Apple изолировала галлюцинирующий новостной ИИ
В новой публичной версии iOS 18.3 beta 3 внесены важные изменения
После многочисленных жалоб СМИ и, в частности BBC, на искажение новостей и указание СМИ как источника в уведомлениях Apple Intelligence, Apple наконец-то внесла значительные корректировки в вышедшей публичной iOS 18.3 beta 3. Пользователям стало доступным управление «придуманными» уведомлениями, которые формируются «искусственным интеллектом» Apple Intelligence.
Во-первых, теперь при активации «коротких уведомлений», iOS будет уведомлять, что эта функция является экспериментальной (получая таким образом информирование согласие пользователя). Во-вторых, отключать такие уведомления можно будет с экрана блокировки или в «Центре уведомлений», выбрав в параметрах опцию «Отключить краткие уведомления». Также сами уведомления, формируемые Apple Intelligence, будут использовать наклонный шрифт, что будет выделять их на фоне стандартных, контролируемых самим приложением, уведомлений. Наконец, в приложении «Настройки» Apple будет предупреждать, что краткие описания уведомлений «могут содержать ошибки».
Но главное обновление заключается в том, что эти «сводки» будут полностью отключены для категории приложений «Новости и развлечения». Они вернутся в будущих обновлениях, очевидно после того, как Apple придумает, как исключить из них дезинформацию.
Больше всего от внедрения «кратких уведомлений», в которых Apple с помощью ИИ переписывала новости и приписывала их источнику, пострадала новостная служба BBC. В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
В новой публичной версии iOS 18.3 beta 3 внесены важные изменения
После многочисленных жалоб СМИ и, в частности BBC, на искажение новостей и указание СМИ как источника в уведомлениях Apple Intelligence, Apple наконец-то внесла значительные корректировки в вышедшей публичной iOS 18.3 beta 3. Пользователям стало доступным управление «придуманными» уведомлениями, которые формируются «искусственным интеллектом» Apple Intelligence.
Во-первых, теперь при активации «коротких уведомлений», iOS будет уведомлять, что эта функция является экспериментальной (получая таким образом информирование согласие пользователя). Во-вторых, отключать такие уведомления можно будет с экрана блокировки или в «Центре уведомлений», выбрав в параметрах опцию «Отключить краткие уведомления». Также сами уведомления, формируемые Apple Intelligence, будут использовать наклонный шрифт, что будет выделять их на фоне стандартных, контролируемых самим приложением, уведомлений. Наконец, в приложении «Настройки» Apple будет предупреждать, что краткие описания уведомлений «могут содержать ошибки».
Но главное обновление заключается в том, что эти «сводки» будут полностью отключены для категории приложений «Новости и развлечения». Они вернутся в будущих обновлениях, очевидно после того, как Apple придумает, как исключить из них дезинформацию.
Больше всего от внедрения «кратких уведомлений», в которых Apple с помощью ИИ переписывала новости и приписывала их источнику, пострадала новостная служба BBC. В частности, в одной из сводок Apple AI написал (подписав информацию как BBC), что теннисист Рафаэль Надаль объявил о том, что он гей. Другой галлюцинацией нейросети Apple стала информация о том, что Люк Литтлер выиграл чемпионат мира по дартсу, с тем нюансом, что новостное оповещение владельцам iPhone пришло еще до начала финала турнира.
Forwarded from TechnoME: Multimediamind
#лонгриднавыходные
Очень занятная аналогия выпрыгнула на меня из глобальной информационной сети: ИИ как фея Динь-Динь.
Улавливаете? 🤌
В истории про Питера Пэна фея Tinkerbell (Динь-Динь) существует, только если люди верят в нее. И хлопают ей. Как только мы перестаем верить в магию феи, она начинает исчезать. И в этот момент фея умоляет всех вокруг хлопать как можно громче. Динь-Динь необходимо наше внимание, чтобы жить!
Джатан Садовски — старший преподаватель факультета информационных технологий Университета Монаша (Австралия), — написал для издания Fururism необыкновенно увлекательный текст про ИИ. Именно такой, которого мне не хватало.
Как размышляет Садовски, развивающаяся технология очень похожа на фею Tinkerbell. Когда она пытается перейти от фантазий на тему «как это должно работать» к практическому применению в повседневной жизни и работе, её существование зависит от нашей веры в магию её возможностей. А они воплощаются только тогда, когда мы достаточно сильно верим и достаточно громко хлопаем.
Если мы перестанем верить и хлопать, то весь «прогресс» может раствориться в воздухе. Так уже не раз бывало со многими «перспективными» разработками.
Будущее ИИ зависит от нашей с вами веры и от поддержки тех людей, которые трудятся на фабрике футуризма. Это руководители компаний, консультанты, журналисты, визионеры, которые формируют видение конкретного будущего — например, такого, в котором модели ИИ, созданные OpenAI или Microsoft, являются неоспоримыми силами прогресса. Они создают ожидания общественности относительно возможностей и результатов применения технологических продуктов.
Нет, Садовски не пишет, что ИИ — очередной пузырь. Он просто отмечает, что технологиям ИИ придётся пройти немало препятствий на пути своего развития. Уже в этом году станет труднее, ожидания инвесторов должны чем-то подкрепляться.
И я, несмотря на некоторые выступления в этом канале, тоже не считаю, что ИИ — это пузырь, который искусственно надувается. Видела возможности применения, слышала от гораздо более умных, чем я, людей расчёты и прогнозы. Всё вполне весомо и уже работает, а дальше — больше. Шелуха спадёт, останется важное.
Но помните тот манифест Сэма Альтмана про новую эру и всю эту ИИ-утопию? Вот это, думаю я, так и останется в головах энтузиастов. А настоящие люди слать хотели весь этот ИИ куда подальше. Земля — она гораздо больше, чем бигтехи. И людей на ней 8 миллиардов. Интернет ещё не везде провели, да что там, голод не везде победили. А они нам про повсеместный ИИ рассказывают. Попробуйте, да, внедрите.
Не говоря уже о том, что сама OpenAI терпит огромные убытки (ок, несёт издержки) — даже со своими двухсотлолларовыми подписками. И чем больше людей веруют в магию чат джипити, тем больше затрат несёт компания-создатель. Вот такой вот парадокс.
А дальше… Дальше порешает рыночная экономика 🤷🏻♀️
Очень занятная аналогия выпрыгнула на меня из глобальной информационной сети: ИИ как фея Динь-Динь.
Улавливаете? 🤌
В истории про Питера Пэна фея Tinkerbell (Динь-Динь) существует, только если люди верят в нее. И хлопают ей. Как только мы перестаем верить в магию феи, она начинает исчезать. И в этот момент фея умоляет всех вокруг хлопать как можно громче. Динь-Динь необходимо наше внимание, чтобы жить!
Джатан Садовски — старший преподаватель факультета информационных технологий Университета Монаша (Австралия), — написал для издания Fururism необыкновенно увлекательный текст про ИИ. Именно такой, которого мне не хватало.
Как размышляет Садовски, развивающаяся технология очень похожа на фею Tinkerbell. Когда она пытается перейти от фантазий на тему «как это должно работать» к практическому применению в повседневной жизни и работе, её существование зависит от нашей веры в магию её возможностей. А они воплощаются только тогда, когда мы достаточно сильно верим и достаточно громко хлопаем.
Если мы перестанем верить и хлопать, то весь «прогресс» может раствориться в воздухе. Так уже не раз бывало со многими «перспективными» разработками.
Будущее ИИ зависит от нашей с вами веры и от поддержки тех людей, которые трудятся на фабрике футуризма. Это руководители компаний, консультанты, журналисты, визионеры, которые формируют видение конкретного будущего — например, такого, в котором модели ИИ, созданные OpenAI или Microsoft, являются неоспоримыми силами прогресса. Они создают ожидания общественности относительно возможностей и результатов применения технологических продуктов.
Нет, Садовски не пишет, что ИИ — очередной пузырь. Он просто отмечает, что технологиям ИИ придётся пройти немало препятствий на пути своего развития. Уже в этом году станет труднее, ожидания инвесторов должны чем-то подкрепляться.
И я, несмотря на некоторые выступления в этом канале, тоже не считаю, что ИИ — это пузырь, который искусственно надувается. Видела возможности применения, слышала от гораздо более умных, чем я, людей расчёты и прогнозы. Всё вполне весомо и уже работает, а дальше — больше. Шелуха спадёт, останется важное.
Но помните тот манифест Сэма Альтмана про новую эру и всю эту ИИ-утопию? Вот это, думаю я, так и останется в головах энтузиастов. А настоящие люди слать хотели весь этот ИИ куда подальше. Земля — она гораздо больше, чем бигтехи. И людей на ней 8 миллиардов. Интернет ещё не везде провели, да что там, голод не везде победили. А они нам про повсеместный ИИ рассказывают. Попробуйте, да, внедрите.
Не говоря уже о том, что сама OpenAI терпит огромные убытки (ок, несёт издержки) — даже со своими двухсотлолларовыми подписками. И чем больше людей веруют в магию чат джипити, тем больше затрат несёт компания-создатель. Вот такой вот парадокс.
А дальше… Дальше порешает рыночная экономика 🤷🏻♀️
Futurism
AI Is Like Tinkerbell: It Only Works If We Believe in It
AI is like the fairy Tinkerbell: in the story of "Peter Pan," she only continues to exist if people believe in her and clap for her.
Чтобы ИИ перестал быть абстрактным «инструментом» и стал настоящей движущей силой экономики и безопасности, требуется нечто большее, чем алгоритмы и амбиции — нужна инфраструктура. В преддверии своего ухода с поста президента Джо Байден подписал указ, направленный на укрепление лидерства США в области инфраструктуры для искусственного интеллекта. И в этом документе есть несколько любопытных моментов.
Например, создание ЦОДов стало задачей национальной безопасности. Для этого были задействованы федеральные земли, участки которых должны быть отданы в аренду частным компаниям.
Не забыл президент и про «экологическое лобби» — упомянутые выше арендаторы должны строить для своих ЦОДов автономные источники чистой энергии. Принято такое решение с целью предотвращения роста цен на электроэнергию для живущих вокруг центров потребителей, но получится ли этого избежать — вопрос открытый (тем более что фильм «Планета людей», спродюссированный Майклом Муром, отлично показал легкость, с которой можно обходить подобные ограничения).
Есть и другие нюансы. Центры требуют для охлаждения воды, а с водой в некоторых регионах США вроде Аризоны, Нью-Мексико, Колорадо, Калифорнии и так далее — проблемы. При этом проект не предполагает напрямую выделение льгот или субсидий, так что все траты ложатся на плечи операторов.
Все эти решения приняты ради безопасности данных — американцы прекрасно понимают, что отдавать свои секреты за границу не стоит. Инфраструктура также станет основой для реализации других планов из указов, вышедших одновременно с этим — по укреплению кибербезопасности и развитию ИИ.
Россия выбрала немного иной подход к развитию ЦОДов и активно вкладывает в это бюджетные средства.
До 2030 года на два федеральных проекта в этом направлении* выделено около 136 миллиардов рублей. Это вполне логично, учитывая, что стоимость доставки западных компонентов в Россию выросла из-за санкций, и государство будет частично компенсировать компаниям эти затраты. Некоторые депутаты даже предлагали строить ЦОДы на севере, чтобы экономить на охлаждении, хотя в таком случае остаётся вопрос о скорости доставки данных до потребителей.
Читаем указ и ещё раз вспоминаем, что дата-центры стали за последние несколько лет объектами стратегического значения, от которых зависят технологии и национальная безопасность.
*Упомянутые федеральные проекты — «Развитие инфраструктуры использования ИИ и работы с большими данными» и «Поддержка новых разработок программных решений и их внедрения в отраслях экономики»
Например, создание ЦОДов стало задачей национальной безопасности. Для этого были задействованы федеральные земли, участки которых должны быть отданы в аренду частным компаниям.
Не забыл президент и про «экологическое лобби» — упомянутые выше арендаторы должны строить для своих ЦОДов автономные источники чистой энергии. Принято такое решение с целью предотвращения роста цен на электроэнергию для живущих вокруг центров потребителей, но получится ли этого избежать — вопрос открытый (тем более что фильм «Планета людей», спродюссированный Майклом Муром, отлично показал легкость, с которой можно обходить подобные ограничения).
Есть и другие нюансы. Центры требуют для охлаждения воды, а с водой в некоторых регионах США вроде Аризоны, Нью-Мексико, Колорадо, Калифорнии и так далее — проблемы. При этом проект не предполагает напрямую выделение льгот или субсидий, так что все траты ложатся на плечи операторов.
Все эти решения приняты ради безопасности данных — американцы прекрасно понимают, что отдавать свои секреты за границу не стоит. Инфраструктура также станет основой для реализации других планов из указов, вышедших одновременно с этим — по укреплению кибербезопасности и развитию ИИ.
Россия выбрала немного иной подход к развитию ЦОДов и активно вкладывает в это бюджетные средства.
До 2030 года на два федеральных проекта в этом направлении* выделено около 136 миллиардов рублей. Это вполне логично, учитывая, что стоимость доставки западных компонентов в Россию выросла из-за санкций, и государство будет частично компенсировать компаниям эти затраты. Некоторые депутаты даже предлагали строить ЦОДы на севере, чтобы экономить на охлаждении, хотя в таком случае остаётся вопрос о скорости доставки данных до потребителей.
Читаем указ и ещё раз вспоминаем, что дата-центры стали за последние несколько лет объектами стратегического значения, от которых зависят технологии и национальная безопасность.
*Упомянутые федеральные проекты — «Развитие инфраструктуры использования ИИ и работы с большими данными» и «Поддержка новых разработок программных решений и их внедрения в отраслях экономики»
👍2🔥1🙈1
Что за DeepSeek и почему их новая модель — прорыв в ИИ?
Мы и раньше видели новости о достижениях китайских компаний в области LLM, но вышедшая на днях модель DeepSeek-R1 удивляет даже на фоне предыдущих громких релизов. Компания не только бросила вызов лидерам индустрии на Западе, но и подтвердила высокий уровень китайских разработок. Обо всём по порядку.
R1 — это «думающая» модель с 671 миллиардом параметров, одна из самых больших на рынке. Бенчмарки и тесты показывают, что по качеству она сравнима с одной из самых продвинутых моделей от OpenAI — o1 (правда, та уже относится к предыдущему поколению), с особенно сильными результатами в математике и кодинге.
Достижения модели — результат в том числе необычного и инновационного подхода к обучению. R1 обучалась исключительно методом обучения с подкреплением (Reinforcement Learning), без привычного этапа предварительного обучения на огромном массиве данных. Это позволило R1 развить эмерджентные свойства, то есть экспериментировать и действовать не так, как задумали авторы. Она способна к «самоанализу» и произвольно увеличивает время «размышлений», Chain of Thought, для решения сложных задач (её этому не учили).
Ключевыми преимуществами R1 являются низкая стоимость — API DeepSeek стоит примерно на 90% дешевле OpenAI и Anthropic, и открытый исходный код. Это позволяет пользователям адаптировать модель под свои задачи и использовать её в коммерческих проектах, что особенно важно для стартапов и бизнеса. Отдельно стоит отметить перевод на китайский — вроде как пока она показывает лучший результат в этой области. Единственный нюанс — стоит иметь в виду при работе с моделью, что на вопросы про Китай она либо не отвечает, либо поддерживает официальную позицию КПК.
Откуда вообще взялись DeepSeek? Компания была основана в 2023 году в Ханчжоу, став частью хедж-фонда High-Flyer. Генеральный директор DeepSeek — Лян Вэнфэн, выпускник факультета компьютерных наук, «китайский Сэм Альтман». Откуда конкретно они получают финансирование — загадка. Однако известно, что компанию спонсируют разные фонды: конкретного списка нет, как и известных источников государственного финансирования. Сам Лян Вэнфэн заявил об отсутствии проблем с деньгами, зато пожаловался на недостаток чипов для обучения из-за санкций США.
После релиза R1 CEO DeepSeek встретился с премьер-министром Китая. Делать выводы пока рано, но это может свидетельствовать об официальной государственной поддержке компании со стороны КПК. Хотя уже понятно, что DeepSeek, с её демпинговыми ценами, прорывными идеями в разработке ИИ и философией продвижения продуктов с открытым исходным кодом — стала одной из самых значимых компаний Китая и мира в сфере искусственного интеллекта.
А ведь год только начался…
Мы и раньше видели новости о достижениях китайских компаний в области LLM, но вышедшая на днях модель DeepSeek-R1 удивляет даже на фоне предыдущих громких релизов. Компания не только бросила вызов лидерам индустрии на Западе, но и подтвердила высокий уровень китайских разработок. Обо всём по порядку.
R1 — это «думающая» модель с 671 миллиардом параметров, одна из самых больших на рынке. Бенчмарки и тесты показывают, что по качеству она сравнима с одной из самых продвинутых моделей от OpenAI — o1 (правда, та уже относится к предыдущему поколению), с особенно сильными результатами в математике и кодинге.
Достижения модели — результат в том числе необычного и инновационного подхода к обучению. R1 обучалась исключительно методом обучения с подкреплением (Reinforcement Learning), без привычного этапа предварительного обучения на огромном массиве данных. Это позволило R1 развить эмерджентные свойства, то есть экспериментировать и действовать не так, как задумали авторы. Она способна к «самоанализу» и произвольно увеличивает время «размышлений», Chain of Thought, для решения сложных задач (её этому не учили).
Ключевыми преимуществами R1 являются низкая стоимость — API DeepSeek стоит примерно на 90% дешевле OpenAI и Anthropic, и открытый исходный код. Это позволяет пользователям адаптировать модель под свои задачи и использовать её в коммерческих проектах, что особенно важно для стартапов и бизнеса. Отдельно стоит отметить перевод на китайский — вроде как пока она показывает лучший результат в этой области. Единственный нюанс — стоит иметь в виду при работе с моделью, что на вопросы про Китай она либо не отвечает, либо поддерживает официальную позицию КПК.
Откуда вообще взялись DeepSeek? Компания была основана в 2023 году в Ханчжоу, став частью хедж-фонда High-Flyer. Генеральный директор DeepSeek — Лян Вэнфэн, выпускник факультета компьютерных наук, «китайский Сэм Альтман». Откуда конкретно они получают финансирование — загадка. Однако известно, что компанию спонсируют разные фонды: конкретного списка нет, как и известных источников государственного финансирования. Сам Лян Вэнфэн заявил об отсутствии проблем с деньгами, зато пожаловался на недостаток чипов для обучения из-за санкций США.
После релиза R1 CEO DeepSeek встретился с премьер-министром Китая. Делать выводы пока рано, но это может свидетельствовать об официальной государственной поддержке компании со стороны КПК. Хотя уже понятно, что DeepSeek, с её демпинговыми ценами, прорывными идеями в разработке ИИ и философией продвижения продуктов с открытым исходным кодом — стала одной из самых значимых компаний Китая и мира в сфере искусственного интеллекта.
А ведь год только начался…
🔥3💘2
Аишка
Если вам не нравится перспектива платить за ChatGPT Plus или ждать анонса поддержки русского языка в Apple Intelligence (которая не факт, что будет) — есть возможность пользоваться похожими функциями уже сейчас, бесплатно и на своём устройстве. Причём даже…
This media is not supported in your browser
VIEW IN TELEGRAM
Настало время обновления нашего небольшого гайда по локальному запуску ИИ-моделей.
На этот раз речь пойдёт о «думающей» модели, специально дообученной для русского языка.
Разработчик с канала Pavel Zloi натренировал модель GigaChat 20B-A3B от Сбера. Кстати, как раз сделанную на основе DeepSeek, да ещё и с MoE архитектурой, которая позволяет не задействовать сразу все параметры модели и экономить ресурсы.
Он использовал для этого специальный переведённый дата-сет, активирующий у модели возможность «думать» (ту самую цепочку рассуждений).
В итоге «думающую» модель на 20 миллиардов параметров, адаптированную для русского языка, можно запустить даже на не самом мощном компьютере — и получить неплохой результат в задачах, связанных с кодом, логикой, математикой и анализом текста. При желании её можно развернуть на собственном сервере и использовать в любом месте даже с телефона — при этом никто не будет иметь доступа к вашим данным.
Конечно, есть нюансы — не самое удобное форматирование вывода, периодические случаи, когда модель зацикливается и выдаёт бесконечно одни и те же токены. Ну и важно понимать, что в данном случае «размышляет» модель не идеально. Хотя для бытовых задач по суммаризации информации, изменению стиля текста, его анализа и переписывания — модель подходит неплохо.
Но самое главное: такие проекты дают надежду, что совсем скоро практически любые устройства локально смогут запускать мощные модели — или даже агентов —которые будут помогать пользователям с обработкой фото, видео, текста, планированием задач и так далее.
На этот раз речь пойдёт о «думающей» модели, специально дообученной для русского языка.
Разработчик с канала Pavel Zloi натренировал модель GigaChat 20B-A3B от Сбера. Кстати, как раз сделанную на основе DeepSeek, да ещё и с MoE архитектурой, которая позволяет не задействовать сразу все параметры модели и экономить ресурсы.
Он использовал для этого специальный переведённый дата-сет, активирующий у модели возможность «думать» (ту самую цепочку рассуждений).
В итоге «думающую» модель на 20 миллиардов параметров, адаптированную для русского языка, можно запустить даже на не самом мощном компьютере — и получить неплохой результат в задачах, связанных с кодом, логикой, математикой и анализом текста. При желании её можно развернуть на собственном сервере и использовать в любом месте даже с телефона — при этом никто не будет иметь доступа к вашим данным.
Конечно, есть нюансы — не самое удобное форматирование вывода, периодические случаи, когда модель зацикливается и выдаёт бесконечно одни и те же токены. Ну и важно понимать, что в данном случае «размышляет» модель не идеально. Хотя для бытовых задач по суммаризации информации, изменению стиля текста, его анализа и переписывания — модель подходит неплохо.
Но самое главное: такие проекты дают надежду, что совсем скоро практически любые устройства локально смогут запускать мощные модели — или даже агентов —которые будут помогать пользователям с обработкой фото, видео, текста, планированием задач и так далее.
👍2
Вот вам и Звёздные врата.
Президент США Дональд Трамп только что объявил о создании новой компании — The Stargate Project — которая в течение следующих 4 лет инвестирует 500 миллиардов долларов (примерно 50 триллионов рублей) в разработку инфраструктуры для ИИ в Соединённых штатах. Причём 100 миллиардов из них — прямо сейчас, с момента анонса. Видимо, недавние успехи Китая в области ИИ заставили США напрячься.
Основывают Stargate 4 компании — SoftBank (японский холдинг, который инвестирует в ИИ), OpenAI, Oracle и MGX (компания из ОАЭ, которая инвестирует в ИИ). SoftBank будет отвечать за финансы, OpenAI — за менеджмент и рабочий процесс, Oracle — за хранение и обработку данных.
Ключевыми партнёрами станут Arm, Microsoft и NVIDIA. Стройка уже началась в Техасе и скоро начнётся в других подходящих местах по всей стране (и тут очень кстати будет недавний указ Байдена о передаче федеральных земель в аренду для строительства ЦОДов).
Обещают, что этот проект обеспечит США лидерство в сфере ИИ, создаст сотни тысячи новых рабочих мест, начнёт новый этап индустриализации Америки и даст гигантскую экономическую выгоду всему миру.
Интересно только, куда пропал Илон Маск и почему не участвует в проекте?
P. S. MGX недавно уже становились участниками подобного проекта — ИИ-партнёрства между BlackRock, Microsoft, Global Infrastructure Partners и MGX с привлечением 100 миллиарда долларов инвестиций в ЦОДы и энергетическую инфраструктуру. Видимо, арабы слишком буквально восприняли фразу «Данные — это новая нефть».
Президент США Дональд Трамп только что объявил о создании новой компании — The Stargate Project — которая в течение следующих 4 лет инвестирует 500 миллиардов долларов (примерно 50 триллионов рублей) в разработку инфраструктуры для ИИ в Соединённых штатах. Причём 100 миллиардов из них — прямо сейчас, с момента анонса. Видимо, недавние успехи Китая в области ИИ заставили США напрячься.
Основывают Stargate 4 компании — SoftBank (японский холдинг, который инвестирует в ИИ), OpenAI, Oracle и MGX (компания из ОАЭ, которая инвестирует в ИИ). SoftBank будет отвечать за финансы, OpenAI — за менеджмент и рабочий процесс, Oracle — за хранение и обработку данных.
Ключевыми партнёрами станут Arm, Microsoft и NVIDIA. Стройка уже началась в Техасе и скоро начнётся в других подходящих местах по всей стране (и тут очень кстати будет недавний указ Байдена о передаче федеральных земель в аренду для строительства ЦОДов).
Обещают, что этот проект обеспечит США лидерство в сфере ИИ, создаст сотни тысячи новых рабочих мест, начнёт новый этап индустриализации Америки и даст гигантскую экономическую выгоду всему миру.
Интересно только, куда пропал Илон Маск и почему не участвует в проекте?
P. S. MGX недавно уже становились участниками подобного проекта — ИИ-партнёрства между BlackRock, Microsoft, Global Infrastructure Partners и MGX с привлечением 100 миллиарда долларов инвестиций в ЦОДы и энергетическую инфраструктуру. Видимо, арабы слишком буквально восприняли фразу «Данные — это новая нефть».
🤯2
Как ИИ влияет на рынок труда?
Один лишь слух о том, что ИИ вот-вот заменит водителей, писателей и аналитиков, уже породил сотни заголовков и не меньше мемов. С одной стороны мы боимся, что умные машины заберут у нас работу. С другой — ждём, что они возьмут на себя рутину, оставив нам лишь творчество. А что в реальности?
Анализ PwC полумиллиарда вакансий из 15 стран показывает ускорение проникновения ИИ в ключевые сектора, особенно в профессиональные услуги, IT, коммуникации и финансы. С 2012 года количество вакансий с ИИ навыками выросло в 7 раз, в то время как общее количество вакансий увеличилось всего в 2 раза. Этот рост можно объяснить «хайпом»,а можно — развитием технологий и повышением производительности труда.
Кстати о ней. Производительность труда в секторах с глубоким проникновением ИИ растёт в 4,8 раза, что ведёт к экономическому росту, повышению заработной платы и улучшению уровня жизни. Но блага распределяются неравномерно: работники с навыками в области ИИ получают надбавки до 25% к заработной плате. Это новый digital divide на основе знаний и умений работать с ИИ.
Требования к навыкам обновляются на 25% быстрее в профессиях, подверженных влиянию ИИ. Работникам необходимо постоянно учиться и адаптироваться, чтобы оставаться востребованными. OpenAI и Antrophic утверждают, что ИИ сильно изменит рынок труда, автоматизируя 90% работы. В долгосрочной перспективе нужно думать о реструктуризации экономики, где люди будут не нужны. Но так ли это?
А Challenger, Gray & Christmas признаёт растущую роль ИИ в увольнениях. 12,7 тысяч сотрудников в США были уволены в 2024 году из-за искусственного интеллекта. Однако на фоне 761 тысячи сокращений такая цифра выглядит оптимистично.
В Китае же, наоборот, ИИ создаёт рабочие места, особенно для женщин и работников трудоемких предприятий. А как в России?
Совет по данным при Роструде уверен, что в России ИИ дополняет человека, ускоряя работу на 15% в ИТ-разработке, аналитике, написании текстов, документообороте, подборе персонала, обучении и научной работе. 7% организаций используют генеративный ИИ централизованно, 35% готовы к его внедрению, но и там, и там им уже пользуются самостоятельно сотрудники. Нехватка персонала — одна из причин, почему российские работодатели не спешат внедрять ИИ.
Говорить о десятках исчезнувших профессий и сотнях тысяч уволенных сотрудников пока рано — низкая степень внедрения ИИ, консервативность компаний и риски (отсутствие ответственности за галлюцинации, например) перевешивают потенциальные плюсы. Тенденция в IT-секторе уже наметилась — но вина за сокращения лежит не только на ИИ.
Один лишь слух о том, что ИИ вот-вот заменит водителей, писателей и аналитиков, уже породил сотни заголовков и не меньше мемов. С одной стороны мы боимся, что умные машины заберут у нас работу. С другой — ждём, что они возьмут на себя рутину, оставив нам лишь творчество. А что в реальности?
Анализ PwC полумиллиарда вакансий из 15 стран показывает ускорение проникновения ИИ в ключевые сектора, особенно в профессиональные услуги, IT, коммуникации и финансы. С 2012 года количество вакансий с ИИ навыками выросло в 7 раз, в то время как общее количество вакансий увеличилось всего в 2 раза. Этот рост можно объяснить «хайпом»,а можно — развитием технологий и повышением производительности труда.
Кстати о ней. Производительность труда в секторах с глубоким проникновением ИИ растёт в 4,8 раза, что ведёт к экономическому росту, повышению заработной платы и улучшению уровня жизни. Но блага распределяются неравномерно: работники с навыками в области ИИ получают надбавки до 25% к заработной плате. Это новый digital divide на основе знаний и умений работать с ИИ.
Требования к навыкам обновляются на 25% быстрее в профессиях, подверженных влиянию ИИ. Работникам необходимо постоянно учиться и адаптироваться, чтобы оставаться востребованными. OpenAI и Antrophic утверждают, что ИИ сильно изменит рынок труда, автоматизируя 90% работы. В долгосрочной перспективе нужно думать о реструктуризации экономики, где люди будут не нужны. Но так ли это?
А Challenger, Gray & Christmas признаёт растущую роль ИИ в увольнениях. 12,7 тысяч сотрудников в США были уволены в 2024 году из-за искусственного интеллекта. Однако на фоне 761 тысячи сокращений такая цифра выглядит оптимистично.
В Китае же, наоборот, ИИ создаёт рабочие места, особенно для женщин и работников трудоемких предприятий. А как в России?
Совет по данным при Роструде уверен, что в России ИИ дополняет человека, ускоряя работу на 15% в ИТ-разработке, аналитике, написании текстов, документообороте, подборе персонала, обучении и научной работе. 7% организаций используют генеративный ИИ централизованно, 35% готовы к его внедрению, но и там, и там им уже пользуются самостоятельно сотрудники. Нехватка персонала — одна из причин, почему российские работодатели не спешат внедрять ИИ.
Говорить о десятках исчезнувших профессий и сотнях тысяч уволенных сотрудников пока рано — низкая степень внедрения ИИ, консервативность компаний и риски (отсутствие ответственности за галлюцинации, например) перевешивают потенциальные плюсы. Тенденция в IT-секторе уже наметилась — но вина за сокращения лежит не только на ИИ.
👍2💋1🤝1
Коллеги обратили внимание на тендер московской мэрии по разработке ИИ для градостроительного планирования. Про то, что у центра ИИ в градостроительстве есть в планах решение по развитию городских территорий, говорилось ещё в ноябре прошлого года. Теперь планируется, что туда будут подтягиваться данные о «нуждах» жителей, чтобы проектирование учитывало эти нюансы.
Сразу возникает вопрос — а будет ли как-то собираться обратная связь жителей Москвы? Если будет, то как именно соберут их пожелания и до какой степени они (а также предложения ИИ-модели) будут реально влиять на решения градостроителей?
Вспоминается «масштабное внедрение ИИ» в Московской области, где несчастных сотрудников транспортных компаний заставили дополнительно ходить фотографировать царапины/трещины/скопления людей на остановках, чтобы потом другие сотрудники модерировали ИИ, который на этих снимках «обнаруживал нарушения». Могла ли эта цепочка обойтись без среднего звена? Вопрос риторический.
Пока не понятно, как будет определяться «нужда» жителей в образовательных учреждениях, медицинских организациях, спортивных объектах и так далее. Если говорить именно про обработку предпочтений городских жителей, то в мире есть подобный инструмент — Sensemaking AI от CitizenLab. Но этот ассистент не строит планы и прогнозы развития территорий, а просто структурирует и обрабатывает обратную связь для чиновников, которые потом учитывают её при принятии решений. Было бы здорово здесь увидеть подобный подход. Это если «нужда» большая.
Хотя даже если этот «ИИ» будет просто высчитывать число нужных социальных объектов, исходя из количества жителей, и потом располагать их на карте в подходящих зонах для экономии времени работников — это уже неплохо. Для малой «нужды», конечно.
Сразу возникает вопрос — а будет ли как-то собираться обратная связь жителей Москвы? Если будет, то как именно соберут их пожелания и до какой степени они (а также предложения ИИ-модели) будут реально влиять на решения градостроителей?
Вспоминается «масштабное внедрение ИИ» в Московской области, где несчастных сотрудников транспортных компаний заставили дополнительно ходить фотографировать царапины/трещины/скопления людей на остановках, чтобы потом другие сотрудники модерировали ИИ, который на этих снимках «обнаруживал нарушения». Могла ли эта цепочка обойтись без среднего звена? Вопрос риторический.
Пока не понятно, как будет определяться «нужда» жителей в образовательных учреждениях, медицинских организациях, спортивных объектах и так далее. Если говорить именно про обработку предпочтений городских жителей, то в мире есть подобный инструмент — Sensemaking AI от CitizenLab. Но этот ассистент не строит планы и прогнозы развития территорий, а просто структурирует и обрабатывает обратную связь для чиновников, которые потом учитывают её при принятии решений. Было бы здорово здесь увидеть подобный подход. Это если «нужда» большая.
Хотя даже если этот «ИИ» будет просто высчитывать число нужных социальных объектов, исходя из количества жителей, и потом располагать их на карте в подходящих зонах для экономии времени работников — это уже неплохо. Для малой «нужды», конечно.
🤔1
Что не поделили Маск и Альтман?
После объявления инвестиций в Stargate в Интернете обсуждают перепалку Илона Маска и Сэма Альтмана, CEO OpenAI, в социальной сети X. Их разногласия выходят за пределы Интернета: Маск подал несколько исков против Альтмана, а недавно назвал того мошенником. Когда начался конфликт и почему они так не любят друг друга?
2015 год. Сэм Альтман, молодой и амбициозный предприниматель, предлагает Маску создать лабораторию ИИ, способную бросить вызов Google и купленному ими DeepMind. Тому идея понравилась, он и придумал название — OpenAI.
Отношения не сложились — Маск не инвестировал обещанный миллиард долларов и покинул совет директоров OpenAI, ссылаясь на «коммерциализацию компании» и «конфликт интересов» с Tesla. Позже в OpenAI скажут, что он пытался объединить компанию с Tesla и подчинить себе, но не смог. Уход и отказ от финансирования напоминают шантаж бывших «напарников». Правда, в чём-то он был прав — компания привлекла обещанный Маском миллиард уже у Microsoft, стала вести коммерческую деятельность и закрыла доступ к моделям.
В 2023 году Маск осознал, что потерял контроль над OpenAI, и подписал открытое письмо о приостановке обучения ИИ в надежде замедлить конкурентов, одновременно основав свою собственную компанию — xAI, с флагманской моделью Grok. Сегодня она стала серьёзным игроком на рынке с оценкой более 40 миллиардов долларов.
В 2024 году Маск подал иски на OpenAI и Альтмана, утверждая, что компания нарушила соглашение о некоммерческом статусе, контролируется Microsoft и использовала его пожертвования для создания монополии на рынке. Особенно смешно читать эту новость на фоне недавних проблем в отношениях OpenAI и Microsoft.
В ответ была опубликована переписка Маска и Альтмана, где — удивительное дело — Маск поддерживал преобразование OpenAI в коммерческую организацию. Видимо, если под его контролем, то можно. Новый же виток конфликта связан с проектом Stargate — Маск усомнился в нём, назвал финансовое обеспечение Stargate «фейком», а Альтмана «мошенником» (и это всё несмотря на поддержку проекта Трампом).
Кто победил или проиграл в этой ситуации — судить пока рано. Видно, насколько Маск раздражён успехами компании, которая много лет назад была у него практически в руках. Новые дата-центры будут доступны OpenAI, которые смогут ещё быстрее развивать свои продукты. А недавно ещё и ходили слухи о намерении OpenAI заниматься робототехникой (подробнее рассказывали в статье про ИИ-агентов) — сферой, где у Маска тоже всегда было выигрышное положение. Суды назначены на февраль, ну а мы расскажем, как будет дальше развиваться их конфликт.
После объявления инвестиций в Stargate в Интернете обсуждают перепалку Илона Маска и Сэма Альтмана, CEO OpenAI, в социальной сети X. Их разногласия выходят за пределы Интернета: Маск подал несколько исков против Альтмана, а недавно назвал того мошенником. Когда начался конфликт и почему они так не любят друг друга?
2015 год. Сэм Альтман, молодой и амбициозный предприниматель, предлагает Маску создать лабораторию ИИ, способную бросить вызов Google и купленному ими DeepMind. Тому идея понравилась, он и придумал название — OpenAI.
Отношения не сложились — Маск не инвестировал обещанный миллиард долларов и покинул совет директоров OpenAI, ссылаясь на «коммерциализацию компании» и «конфликт интересов» с Tesla. Позже в OpenAI скажут, что он пытался объединить компанию с Tesla и подчинить себе, но не смог. Уход и отказ от финансирования напоминают шантаж бывших «напарников». Правда, в чём-то он был прав — компания привлекла обещанный Маском миллиард уже у Microsoft, стала вести коммерческую деятельность и закрыла доступ к моделям.
В 2023 году Маск осознал, что потерял контроль над OpenAI, и подписал открытое письмо о приостановке обучения ИИ в надежде замедлить конкурентов, одновременно основав свою собственную компанию — xAI, с флагманской моделью Grok. Сегодня она стала серьёзным игроком на рынке с оценкой более 40 миллиардов долларов.
В 2024 году Маск подал иски на OpenAI и Альтмана, утверждая, что компания нарушила соглашение о некоммерческом статусе, контролируется Microsoft и использовала его пожертвования для создания монополии на рынке. Особенно смешно читать эту новость на фоне недавних проблем в отношениях OpenAI и Microsoft.
В ответ была опубликована переписка Маска и Альтмана, где — удивительное дело — Маск поддерживал преобразование OpenAI в коммерческую организацию. Видимо, если под его контролем, то можно. Новый же виток конфликта связан с проектом Stargate — Маск усомнился в нём, назвал финансовое обеспечение Stargate «фейком», а Альтмана «мошенником» (и это всё несмотря на поддержку проекта Трампом).
Кто победил или проиграл в этой ситуации — судить пока рано. Видно, насколько Маск раздражён успехами компании, которая много лет назад была у него практически в руках. Новые дата-центры будут доступны OpenAI, которые смогут ещё быстрее развивать свои продукты. А недавно ещё и ходили слухи о намерении OpenAI заниматься робототехникой (подробнее рассказывали в статье про ИИ-агентов) — сферой, где у Маска тоже всегда было выигрышное положение. Суды назначены на февраль, ну а мы расскажем, как будет дальше развиваться их конфликт.
👍1🔥1
Forwarded from Ошибка 404
Один из распространённых мифов — макияж мешает распознаванию лиц. Если речь не о профессиональном гриме, то не мешает. Но раз мы уже вспомнили о Гарри Поттере, хочется напомнить, что нейросети — это не волшебная палочка. Если лицо скрыто, как в случае с Фантомасом, то и распознавать нечего.
Вернёмся к снимку. Степень схожести выше 85% позволяет утверждать, что на снимках один и тот же человек. Но этого мало, чтобы Волан-де-Морт мог, например, оплатить проезд в общественном транспорте по биометрии. В таких системах порог обычно устанавливается на уровне около 95%.
Вернёмся к снимку. Степень схожести выше 85% позволяет утверждать, что на снимках один и тот же человек. Но этого мало, чтобы Волан-де-Морт мог, например, оплатить проезд в общественном транспорте по биометрии. В таких системах порог обычно устанавливается на уровне около 95%.
1❤2
Что сказали про ИИ на форуме в Давосе
Тема искусственного интеллекта стала центральной на Всемирном экономическом форуме 2025 в Давосе. Лидеры индустрии, генеральные директора и представители правительств обсудили развитие ИИ, его потенциал и связанные риски. Подготовили обзор ключевых трендов и заявлений.
Рынок труда
По прогнозу ВЭФ, к 2030 году ИИ создаст 170 миллионов новых рабочих мест, при этом 92 миллиона «старых» исчезнут. Райан Рослански из LinkedIn заявил, что 70% актуальных сегодня профессиональных навыков вскоре утратят значение. Марк Бениофф из Salesforce, похоже, воспринял это буквально — компания уже сократила найм инженеров, часть их задач делегирована ИИ.
Спрос на специалистов по ИИ вырос на 300% за год, а количество упоминаний аббревиатуры в LinkedIn за 8 лет увеличилось в 20 раз. Но не стоит забывать, что искусственный интеллект усиливает потребность и в «человеческих» навыках — адаптивности, коммуникативности и эмпатии — поэтому люди остаются востребованными.
Генеральный директор Accenture Джули Свит говорит, что «физический ИИ» уже используется для сокращения времени простоя на производственных линиях, а в будущем наберёт популярность новая роль — AI people manager, который будет управлять связанными с ИИ процессами. В нашей статье есть и более подробная информация об изменениях на рынке труда.
Технологии и конкуренция
Microsoft заявила о масштабных инвестициях в облачную инфраструктуру Azure и языковые модели — 80 миллиардов долларов пойдут на строительство ЦОДов. Сатья Наделла заверил, что партнёрство с OpenAI сохраняется — на фоне слухов о назревающем расколе. А вот CEO Salesforce думает, что для Microsoft выгоднее создавать свой ИИ, и сомневается в будущем успехе OpenAI из-за убыточной бизнес-модели компании.
Anthropic разрабатывает «виртуального сотрудника», способного выполнять рутинные задачи. Они верят, что через несколько лет ИИ сможет выполнять все функции современных офисных сотрудников. OpenAI также работает над мультимодальными моделями и ИИ-агентами для заполнения форм, бронирования столиков и так далее (тот самый Operator, который выложили вчера). Словом, все подтвердили, что главным трендом 2025 года будут ИИ-агенты. А ещё мелькнула тема робототехники: OpenAI косвенно подтвердили слухи о разработках в этой области, но конкретику обещали позже.
Геополитика
В глобальной гонке США удерживают лидерство, хотя Китай, как обычно, наступает на пятки. Александр Ван из Scale AI отметил, исходя из анализа темпов развития китайского ИИ и релиза модели DeepSeek R1, подозрительно высокий объём чипов A100 в Китае (и это несмотря на санкции, какой кошмар). В духе свободного рынка тут же призвал ужесточить ограничения. На этом фоне ещё Индия стремительно укрепляет свои позиции, собираясь построить крупнейший ЦОД в мире.
В итоге ВЭФ снова утвердил ИИ как всемирный тренд, а 2025 год — как поворотный момент в развитии искусственного интеллекта.
Тема искусственного интеллекта стала центральной на Всемирном экономическом форуме 2025 в Давосе. Лидеры индустрии, генеральные директора и представители правительств обсудили развитие ИИ, его потенциал и связанные риски. Подготовили обзор ключевых трендов и заявлений.
Рынок труда
По прогнозу ВЭФ, к 2030 году ИИ создаст 170 миллионов новых рабочих мест, при этом 92 миллиона «старых» исчезнут. Райан Рослански из LinkedIn заявил, что 70% актуальных сегодня профессиональных навыков вскоре утратят значение. Марк Бениофф из Salesforce, похоже, воспринял это буквально — компания уже сократила найм инженеров, часть их задач делегирована ИИ.
Спрос на специалистов по ИИ вырос на 300% за год, а количество упоминаний аббревиатуры в LinkedIn за 8 лет увеличилось в 20 раз. Но не стоит забывать, что искусственный интеллект усиливает потребность и в «человеческих» навыках — адаптивности, коммуникативности и эмпатии — поэтому люди остаются востребованными.
Генеральный директор Accenture Джули Свит говорит, что «физический ИИ» уже используется для сокращения времени простоя на производственных линиях, а в будущем наберёт популярность новая роль — AI people manager, который будет управлять связанными с ИИ процессами. В нашей статье есть и более подробная информация об изменениях на рынке труда.
Технологии и конкуренция
Microsoft заявила о масштабных инвестициях в облачную инфраструктуру Azure и языковые модели — 80 миллиардов долларов пойдут на строительство ЦОДов. Сатья Наделла заверил, что партнёрство с OpenAI сохраняется — на фоне слухов о назревающем расколе. А вот CEO Salesforce думает, что для Microsoft выгоднее создавать свой ИИ, и сомневается в будущем успехе OpenAI из-за убыточной бизнес-модели компании.
Anthropic разрабатывает «виртуального сотрудника», способного выполнять рутинные задачи. Они верят, что через несколько лет ИИ сможет выполнять все функции современных офисных сотрудников. OpenAI также работает над мультимодальными моделями и ИИ-агентами для заполнения форм, бронирования столиков и так далее (тот самый Operator, который выложили вчера). Словом, все подтвердили, что главным трендом 2025 года будут ИИ-агенты. А ещё мелькнула тема робототехники: OpenAI косвенно подтвердили слухи о разработках в этой области, но конкретику обещали позже.
Геополитика
В глобальной гонке США удерживают лидерство, хотя Китай, как обычно, наступает на пятки. Александр Ван из Scale AI отметил, исходя из анализа темпов развития китайского ИИ и релиза модели DeepSeek R1, подозрительно высокий объём чипов A100 в Китае (и это несмотря на санкции, какой кошмар). В духе свободного рынка тут же призвал ужесточить ограничения. На этом фоне ещё Индия стремительно укрепляет свои позиции, собираясь построить крупнейший ЦОД в мире.
В итоге ВЭФ снова утвердил ИИ как всемирный тренд, а 2025 год — как поворотный момент в развитии искусственного интеллекта.
👍2🍾1
Как Китай противостоит США в сфере искусственного интеллекта
На горизонте глобальной технологической борьбы с недавнего времени новый фронт — искусственный интеллект, и особенно активное противостояние сегодня разразилось между КНР и Соединёнными штатами. Какие позиции у Китая и как он конкурирует с США при меньших затратах?
Китай недавно представил миру модель R1 от компании DeepSeek, которая не только взорвала топы App Store, но и оказалась в 20 раз дешевле o1 от OpenAI. Будто этого мало, вскоре Alibaba презентовала модель Qwen2.5-1M — с контекстным окном в миллион токенов (более 700 тысяч слов), составив конкуренцию Google, которые впервые реализовали подобное в Gemini 1.5 Pro. И всё это в комбинации с бесплатной генерацией изображений и видео через веб-интерфейс.
Прорыв возник не на пустом месте — это результат государственной стратегии Китая. Китайская экосистема ИИ характеризуется высокой фрагментацией: около 50 компаний разрабатывают свои большие языковые модели, что создаёт здоровую конкуренцию и стимулирует инновации. Ярких примеров много: ZhipuAI выпустила ChatGLM3, превосходящий некоторые американские аналоги. Moonshot AI разработала «думающего» чат-бота Kimi с большим контекстным окном, выпустив модель сразу после Deepseek и сумев отличиться даже на её фоне. Эти компании, как и многие другие получают поддержку от государства.
Не так давно США, опираясь на капитал частных инвесторов из OpenAI, Google и Microsoft, были главными в мире ИИ. Но Китай поставил далеко идущую цель — с 2000 по 2023 год китайские государственные венчурные фонды вложили 184 миллиарда долларов в более чем 9600 ИИ-компаний. Правительство Китая также предоставляет субсидии компаниям, использующим отечественные чипы вроде Huawei Ascend.
Сегодня Китай лидирует по количеству патентов в сфере ИИ, а уже в 2022 году он забрал себе 47% всех ведущих специалистов в этой области. При этом основным центром инноваций в ИИ стала не частная компания, а университет — Tsinghua University. В марте 2024 года был анонсирован проект «AI+», который обещает интегрировать ИИ в каждую отрасль экономики, превращая технологию в её фундамент.
После американского проекта Stargate с бюджетом в 500 миллиардов долларов Банк Китая с куда меньшим пафосом анонсировал свою программу: до 2030 года страна обещает вложить в ИИ 1 триллион юаней (140 миллиардов долларов). Учитывая более дешёвую разработку и поправку на паритет покупательной способности валют, Китай даже может освоить эти деньги эффективнее. Единственное, что сегодня ограничивает страну от ещё более стремительного роста — санкции США.
Борясь с санкциями, китай создаёт собственные ИИ-чипы, платформы для обучения моделей вроде Mindspore. А параллельно предоставляет вычислительные ресурсы из проекта «Данные с востока — вычисления на западе», который помогает оптимизировать распределение вычислительных центров по всей стране.
И вот мы видим два разных подхода: США надеется на частные инвестиции и своё историческое лидерство, а Китай — на мощную государственную поддержку, инновации и, что забавно звучит, открытость и конкуренцию. Даже интересно узнать, кто выйдет победителем в итоге.
На горизонте глобальной технологической борьбы с недавнего времени новый фронт — искусственный интеллект, и особенно активное противостояние сегодня разразилось между КНР и Соединёнными штатами. Какие позиции у Китая и как он конкурирует с США при меньших затратах?
Китай недавно представил миру модель R1 от компании DeepSeek, которая не только взорвала топы App Store, но и оказалась в 20 раз дешевле o1 от OpenAI. Будто этого мало, вскоре Alibaba презентовала модель Qwen2.5-1M — с контекстным окном в миллион токенов (более 700 тысяч слов), составив конкуренцию Google, которые впервые реализовали подобное в Gemini 1.5 Pro. И всё это в комбинации с бесплатной генерацией изображений и видео через веб-интерфейс.
Прорыв возник не на пустом месте — это результат государственной стратегии Китая. Китайская экосистема ИИ характеризуется высокой фрагментацией: около 50 компаний разрабатывают свои большие языковые модели, что создаёт здоровую конкуренцию и стимулирует инновации. Ярких примеров много: ZhipuAI выпустила ChatGLM3, превосходящий некоторые американские аналоги. Moonshot AI разработала «думающего» чат-бота Kimi с большим контекстным окном, выпустив модель сразу после Deepseek и сумев отличиться даже на её фоне. Эти компании, как и многие другие получают поддержку от государства.
Не так давно США, опираясь на капитал частных инвесторов из OpenAI, Google и Microsoft, были главными в мире ИИ. Но Китай поставил далеко идущую цель — с 2000 по 2023 год китайские государственные венчурные фонды вложили 184 миллиарда долларов в более чем 9600 ИИ-компаний. Правительство Китая также предоставляет субсидии компаниям, использующим отечественные чипы вроде Huawei Ascend.
Сегодня Китай лидирует по количеству патентов в сфере ИИ, а уже в 2022 году он забрал себе 47% всех ведущих специалистов в этой области. При этом основным центром инноваций в ИИ стала не частная компания, а университет — Tsinghua University. В марте 2024 года был анонсирован проект «AI+», который обещает интегрировать ИИ в каждую отрасль экономики, превращая технологию в её фундамент.
После американского проекта Stargate с бюджетом в 500 миллиардов долларов Банк Китая с куда меньшим пафосом анонсировал свою программу: до 2030 года страна обещает вложить в ИИ 1 триллион юаней (140 миллиардов долларов). Учитывая более дешёвую разработку и поправку на паритет покупательной способности валют, Китай даже может освоить эти деньги эффективнее. Единственное, что сегодня ограничивает страну от ещё более стремительного роста — санкции США.
Борясь с санкциями, китай создаёт собственные ИИ-чипы, платформы для обучения моделей вроде Mindspore. А параллельно предоставляет вычислительные ресурсы из проекта «Данные с востока — вычисления на западе», который помогает оптимизировать распределение вычислительных центров по всей стране.
И вот мы видим два разных подхода: США надеется на частные инвестиции и своё историческое лидерство, а Китай — на мощную государственную поддержку, инновации и, что забавно звучит, открытость и конкуренцию. Даже интересно узнать, кто выйдет победителем в итоге.
👍2🔥2🦄1
Аишка
Как Китай противостоит США в сфере искусственного интеллекта На горизонте глобальной технологической борьбы с недавнего времени новый фронт — искусственный интеллект, и особенно активное противостояние сегодня разразилось между КНР и Соединёнными штатами.…
Таблица с ведущими китайскими стартапами в сфере ИИ и их инвесторами
🔥4💘1
Стоило написать про соперничество Китая и США, а компания DeepSeek уже выпустила новую модель. На этот раз — мультимодальную.
Модель называется Janus Pro и предназначена для «понимания» и генерации картинок. Причём выглядит она как очередной щелчок по носу OpenAI — ведь Deepseek сделали не диффузионную модель с работой через зашумление картинки, как сегодня поступает большинство крупных компаний. Они выбрали другой подход — их модель основана на большой языковой модели. И у DALL-E от OpenAI как раз такой же случай.
Ещё смешнее смотреть на их сравнения с DALL-E, где Deepseek показывают, насколько новая модель превосходит решение OpenAI и других конкурентов. Правда, нужно иметь в виду, что пока Janus Pro работает только с изображениями размером до 384 x 384 пикселей, но это можно исправить за счёт апскейлеров.
Мы в редакции чаще всего используем как раз DALL-Е за её возможности по стилизации картинки и гиперболизации образов, поэтому будет очень интересно потестировать и сравнить. Пока всё идёт так, как предрекали Google в трендах на 2025 год — мультимодальные модели там шли на первом месте.
Janus уже доступен для скачивания, у него открытый исходный код и есть возможность коммерческого использования. Deepseek не зря западные медиа называют «вирусной» компанией, они не устают удивлять.
Модель называется Janus Pro и предназначена для «понимания» и генерации картинок. Причём выглядит она как очередной щелчок по носу OpenAI — ведь Deepseek сделали не диффузионную модель с работой через зашумление картинки, как сегодня поступает большинство крупных компаний. Они выбрали другой подход — их модель основана на большой языковой модели. И у DALL-E от OpenAI как раз такой же случай.
Ещё смешнее смотреть на их сравнения с DALL-E, где Deepseek показывают, насколько новая модель превосходит решение OpenAI и других конкурентов. Правда, нужно иметь в виду, что пока Janus Pro работает только с изображениями размером до 384 x 384 пикселей, но это можно исправить за счёт апскейлеров.
Мы в редакции чаще всего используем как раз DALL-Е за её возможности по стилизации картинки и гиперболизации образов, поэтому будет очень интересно потестировать и сравнить. Пока всё идёт так, как предрекали Google в трендах на 2025 год — мультимодальные модели там шли на первом месте.
Janus уже доступен для скачивания, у него открытый исходный код и есть возможность коммерческого использования. Deepseek не зря западные медиа называют «вирусной» компанией, они не устают удивлять.
🔥4🐳1
Антикризисный пиар от Сэма Альтмана
На фоне падения акций американских технологических компаний Сэм Альтман написал в X, что у Deepseek действительно стоящая модель, особенно из-за её низкой стоимости. Но...
Но сразу заверил, что их новая модель будет, само собой, лучше, AGI уже не за горами и вообще миру понадобится ещё больше вычислительных мощностей, чем сейчас. Так что не спешите продавать акции Nvidia (а они за сутки потеряли около 600 миллиардов долларов капитализации) и верьте в американский ИИ.
Уже интересно посмотреть на следующий релиз OpenAI. Главное, чтобы это не был Operator 2.0
На фоне падения акций американских технологических компаний Сэм Альтман написал в X, что у Deepseek действительно стоящая модель, особенно из-за её низкой стоимости. Но...
Но сразу заверил, что их новая модель будет, само собой, лучше, AGI уже не за горами и вообще миру понадобится ещё больше вычислительных мощностей, чем сейчас. Так что не спешите продавать акции Nvidia (а они за сутки потеряли около 600 миллиардов долларов капитализации) и верьте в американский ИИ.
Уже интересно посмотреть на следующий релиз OpenAI. Главное, чтобы это не был Operator 2.0
😁2👍1🍾1
Китай выделяет триллион юаней на развитие ИИ. Куда пойдут деньги?
23 января Банк Китая представил «План действий по поддержке развития индустрии искусственного интеллекта» с выделением 1 триллиона юаней до 2030 года. Что он себя включает и куда пойдут эти деньги? Пока конкретики не так много, но уже есть интересные детали.
300 миллиардов юаней будут выделены в виде инвестиций в акционерный капитал и долги (equity и debt) — для поддержки финансовой устойчивости компаний. В основе не просто кредиты, а гибкие инструменты — гранты, венчурные инвестиции, поддержка IPO. Остальная сумма пойдёт на инфраструктуру и исследования.
Банк Китая разработал механизм «1+1+N». Он предполагает, что каждая компания получит индивидуальную поддержку на всех этапах — от исследований до внедрения продукта на рынок. Параллельно запускается программа «Банк Китая: Платформа технологических инноваций+» для создания экосистемы, объединяющей правительство, научные институты, предприятия и инвесторов. Это необходимо для объединения усилий бизнеса и правительства, интеграции ресурсов и вывода решений на международный рынок.
Основой для ИИ должна стать инфраструктура, и Китай это понимает. Поэтому деньги пойдут на поддержку отечественных чипов Huawei Ascend или Baidu Kunlun и создание ЦОДов для интегрированной национальной вычислительной сети — той самой базы, на которой строится всё: от анализа больших данных до работы автономного транспорта.
Внимание акцентируется на секторах, где можно быстро получить прикладной результат — робототехнике и автономных системах (логистика и производство), биомоделировании (новые лекарства), разработке новых материалов (квантовые компьютеры и сверхпроводники). Китай ищет области, где ИИ реально повысит производительность труда, а не создаёт абстрактных ИИ-агентов для заказа пиццы на дом.
На мероприятии присутствовали представители Huawei, Tencent, Baidu, iFlytek и Zhipu, вероятно, они и получат большую часть денег (хотя официальных заявлений не было). Учитывая недавний международный успех Deepseek и встречу их CEO с премьер-министром Китая, они также могут рассчитывать на дополнительное финансирование.
Этот план не является специальным ответом на Stargate, а поддержка стартапов была и раньше — за прошедшие годы Банк Китая уже предоставил 1,91 триллиона юаней для 100000 компаний. Просто теперь темп инвестиций нарастает вместе с повышением важности самой отрасли. Если всё получится, то к 2030 году Китай может даже превзойти США. Точно ясно одно — на фоне китайских финансовых стимулов зарубежные стартапы могут столкнуться с серьёзным давлением, а противостояние США и Китая только усилится.
23 января Банк Китая представил «План действий по поддержке развития индустрии искусственного интеллекта» с выделением 1 триллиона юаней до 2030 года. Что он себя включает и куда пойдут эти деньги? Пока конкретики не так много, но уже есть интересные детали.
300 миллиардов юаней будут выделены в виде инвестиций в акционерный капитал и долги (equity и debt) — для поддержки финансовой устойчивости компаний. В основе не просто кредиты, а гибкие инструменты — гранты, венчурные инвестиции, поддержка IPO. Остальная сумма пойдёт на инфраструктуру и исследования.
Банк Китая разработал механизм «1+1+N». Он предполагает, что каждая компания получит индивидуальную поддержку на всех этапах — от исследований до внедрения продукта на рынок. Параллельно запускается программа «Банк Китая: Платформа технологических инноваций+» для создания экосистемы, объединяющей правительство, научные институты, предприятия и инвесторов. Это необходимо для объединения усилий бизнеса и правительства, интеграции ресурсов и вывода решений на международный рынок.
Основой для ИИ должна стать инфраструктура, и Китай это понимает. Поэтому деньги пойдут на поддержку отечественных чипов Huawei Ascend или Baidu Kunlun и создание ЦОДов для интегрированной национальной вычислительной сети — той самой базы, на которой строится всё: от анализа больших данных до работы автономного транспорта.
Внимание акцентируется на секторах, где можно быстро получить прикладной результат — робототехнике и автономных системах (логистика и производство), биомоделировании (новые лекарства), разработке новых материалов (квантовые компьютеры и сверхпроводники). Китай ищет области, где ИИ реально повысит производительность труда, а не создаёт абстрактных ИИ-агентов для заказа пиццы на дом.
На мероприятии присутствовали представители Huawei, Tencent, Baidu, iFlytek и Zhipu, вероятно, они и получат большую часть денег (хотя официальных заявлений не было). Учитывая недавний международный успех Deepseek и встречу их CEO с премьер-министром Китая, они также могут рассчитывать на дополнительное финансирование.
Этот план не является специальным ответом на Stargate, а поддержка стартапов была и раньше — за прошедшие годы Банк Китая уже предоставил 1,91 триллиона юаней для 100000 компаний. Просто теперь темп инвестиций нарастает вместе с повышением важности самой отрасли. Если всё получится, то к 2030 году Китай может даже превзойти США. Точно ясно одно — на фоне китайских финансовых стимулов зарубежные стартапы могут столкнуться с серьёзным давлением, а противостояние США и Китая только усилится.
👍3👏1💋1
Китайцы не сдержались и перед Новым годом довыполнили KPI, сделав ещё один громкий анонс.
Alibaba представили новую версию своей модели — Qwen2.5-Max с архитектурой Mixture-of-Expert (это когда для экономии ресурсов в ответ на запрос пользователя активируются не все параметры, а только та часть, которая релевантнее всего на него ответит — нужный «эксперт» внутри модели).
Главная особенность — Qwen2.5-Max обучалась на 20 триллионах токенов. Видимо, компания даже взяла для этого где-то видеокарты. То есть санкции всё-таки «работают»…
На бенчмарках модель показывает себя вроде как даже лучше Deepseek V3, не говоря о многострадальных GPT-4o и Claude Sonnet, которых китайцы совсем уже не жалеют (а зря).
Правда, разница с тем же Deepseek минимальная, а стоит API сильно дороже. Так ещё и модель с закрытым исходным кодом. Но для простых пользователей бесплатно можно использовать через чат. В чате, кстати, ещё есть генерация картинок и видео, хотя по качеству они пока довольно посредственные в сравнении с конкурентами.
Как китайцы умудряются быть такими продуктивными? У этого есть своё объяснение — один из ведущих разработчиков этой модели и исследователь NLP в Alibaba Биньюань Хуэй начинает работать в 10 и заканчивает в 21, хотя даже после этого продолжает проверять прогресс модели и думать над развитием проекта.
Alibaba представили новую версию своей модели — Qwen2.5-Max с архитектурой Mixture-of-Expert (это когда для экономии ресурсов в ответ на запрос пользователя активируются не все параметры, а только та часть, которая релевантнее всего на него ответит — нужный «эксперт» внутри модели).
Главная особенность — Qwen2.5-Max обучалась на 20 триллионах токенов. Видимо, компания даже взяла для этого где-то видеокарты. То есть санкции всё-таки «работают»…
На бенчмарках модель показывает себя вроде как даже лучше Deepseek V3, не говоря о многострадальных GPT-4o и Claude Sonnet, которых китайцы совсем уже не жалеют (а зря).
Правда, разница с тем же Deepseek минимальная, а стоит API сильно дороже. Так ещё и модель с закрытым исходным кодом. Но для простых пользователей бесплатно можно использовать через чат. В чате, кстати, ещё есть генерация картинок и видео, хотя по качеству они пока довольно посредственные в сравнении с конкурентами.
Как китайцы умудряются быть такими продуктивными? У этого есть своё объяснение — один из ведущих разработчиков этой модели и исследователь NLP в Alibaba Биньюань Хуэй начинает работать в 10 и заканчивает в 21, хотя даже после этого продолжает проверять прогресс модели и думать над развитием проекта.
❤3