Аишка
975 subscribers
715 photos
67 videos
2 files
461 links
Side-канал @contentreview с новостями из области искусственного интеллекта (AI)

Наши каналы:
Основной (телеком и IT) – @contentreview
Песочница (БигТех) – @BigTechSandbox
Электричка – @econtentreview
Download Telegram
Аишка
Если вам не нравится перспектива платить за ChatGPT Plus или ждать анонса поддержки русского языка в Apple Intelligence (которая не факт, что будет) — есть возможность пользоваться похожими функциями уже сейчас, бесплатно и на своём устройстве. Причём даже…
This media is not supported in your browser
VIEW IN TELEGRAM
Настало время обновления нашего небольшого гайда по локальному запуску ИИ-моделей.

На этот раз речь пойдёт о «думающей» модели, специально дообученной для русского языка.

Разработчик с канала Pavel Zloi натренировал модель GigaChat 20B-A3B от Сбера. Кстати, как раз сделанную на основе DeepSeek, да ещё и с MoE архитектурой, которая позволяет не задействовать сразу все параметры модели и экономить ресурсы.

Он использовал для этого специальный переведённый дата-сет, активирующий у модели возможность «думать» (ту самую цепочку рассуждений).

В итоге «думающую» модель на 20 миллиардов параметров, адаптированную для русского языка, можно запустить даже на не самом мощном компьютере — и получить неплохой результат в задачах, связанных с кодом, логикой, математикой и анализом текста. При желании её можно развернуть на собственном сервере и использовать в любом месте даже с телефона — при этом никто не будет иметь доступа к вашим данным.

Конечно, есть нюансы — не самое удобное форматирование вывода, периодические случаи, когда модель зацикливается и выдаёт бесконечно одни и те же токены. Ну и важно понимать, что в данном случае «размышляет» модель не идеально. Хотя для бытовых задач по суммаризации информации, изменению стиля текста, его анализа и переписывания — модель подходит неплохо.

Но самое главное: такие проекты дают надежду, что совсем скоро практически любые устройства локально смогут запускать мощные модели — или даже агентов —которые будут помогать пользователям с обработкой фото, видео, текста, планированием задач и так далее.
👍2
Вот вам и Звёздные врата.

Президент США Дональд Трамп только что объявил о создании новой компании — The Stargate Project — которая в течение следующих 4 лет инвестирует 500 миллиардов долларов (примерно 50 триллионов рублей) в разработку инфраструктуры для ИИ в Соединённых штатах. Причём 100 миллиардов из них — прямо сейчас, с момента анонса. Видимо, недавние успехи Китая в области ИИ заставили США напрячься.

Основывают Stargate 4 компании — SoftBank (японский холдинг, который инвестирует в ИИ), OpenAI, Oracle и MGX (компания из ОАЭ, которая инвестирует в ИИ). SoftBank будет отвечать за финансы, OpenAI — за менеджмент и рабочий процесс, Oracle — за хранение и обработку данных.

Ключевыми партнёрами станут Arm, Microsoft и NVIDIA. Стройка уже началась в Техасе и скоро начнётся в других подходящих местах по всей стране (и тут очень кстати будет недавний указ Байдена о передаче федеральных земель в аренду для строительства ЦОДов).

Обещают, что этот проект обеспечит США лидерство в сфере ИИ, создаст сотни тысячи новых рабочих мест, начнёт новый этап индустриализации Америки и даст гигантскую экономическую выгоду всему миру.

Интересно только, куда пропал Илон Маск и почему не участвует в проекте?

P. S. MGX недавно уже становились участниками подобного проекта — ИИ-партнёрства между BlackRock, Microsoft, Global Infrastructure Partners и MGX с привлечением 100 миллиарда долларов инвестиций в ЦОДы и энергетическую инфраструктуру. Видимо, арабы слишком буквально восприняли фразу «Данные — это новая нефть».
🤯2
Как ИИ влияет на рынок труда?

Один лишь слух о том, что ИИ вот-вот заменит водителей, писателей и аналитиков, уже породил сотни заголовков и не меньше мемов. С одной стороны мы боимся, что умные машины заберут у нас работу. С другой — ждём, что они возьмут на себя рутину, оставив нам лишь творчество. А что в реальности?

Анализ PwC полумиллиарда вакансий из 15 стран показывает ускорение проникновения ИИ в ключевые сектора, особенно в профессиональные услуги, IT, коммуникации и финансы. С 2012 года количество вакансий с ИИ навыками выросло в 7 раз, в то время как общее количество вакансий увеличилось всего в 2 раза. Этот рост можно объяснить «хайпом»,а можно — развитием технологий и повышением производительности труда.

Кстати о ней. Производительность труда в секторах с глубоким проникновением ИИ растёт в 4,8 раза, что ведёт к экономическому росту, повышению заработной платы и улучшению уровня жизни. Но блага распределяются неравномерно: работники с навыками в области ИИ получают надбавки до 25% к заработной плате. Это новый digital divide на основе знаний и умений работать с ИИ.

Требования к навыкам обновляются на 25% быстрее в профессиях, подверженных влиянию ИИ. Работникам необходимо постоянно учиться и адаптироваться, чтобы оставаться востребованными. OpenAI и Antrophic утверждают, что ИИ сильно изменит рынок труда, автоматизируя 90% работы. В долгосрочной перспективе нужно думать о реструктуризации экономики, где люди будут не нужны. Но так ли это?

А Challenger, Gray & Christmas признаёт растущую роль ИИ в увольнениях. 12,7 тысяч сотрудников в США были уволены в 2024 году из-за искусственного интеллекта. Однако на фоне 761 тысячи сокращений такая цифра выглядит оптимистично.

В Китае же, наоборот, ИИ создаёт рабочие места, особенно для женщин и работников трудоемких предприятий. А как в России?

Совет по данным при Роструде уверен, что в России ИИ дополняет человека, ускоряя работу на 15% в ИТ-разработке, аналитике, написании текстов, документообороте, подборе персонала, обучении и научной работе. 7% организаций используют генеративный ИИ централизованно, 35% готовы к его внедрению, но и там, и там им уже пользуются самостоятельно сотрудники. Нехватка персонала — одна из причин, почему российские работодатели не спешат внедрять ИИ.

Говорить о десятках исчезнувших профессий и сотнях тысяч уволенных сотрудников пока рано — низкая степень внедрения ИИ, консервативность компаний и риски (отсутствие ответственности за галлюцинации, например) перевешивают потенциальные плюсы. Тенденция в IT-секторе уже наметилась — но вина за сокращения лежит не только на ИИ.
👍2💋1🤝1
Коллеги обратили внимание на тендер московской мэрии по разработке ИИ для градостроительного планирования. Про то, что у центра ИИ в градостроительстве есть в планах решение по развитию городских территорий, говорилось ещё в ноябре прошлого года. Теперь планируется, что туда будут подтягиваться данные о «нуждах» жителей, чтобы проектирование учитывало эти нюансы.

Сразу возникает вопрос — а будет ли как-то собираться обратная связь жителей Москвы? Если будет, то как именно соберут их пожелания и до какой степени они (а также предложения ИИ-модели) будут реально влиять на решения градостроителей?

Вспоминается «масштабное внедрение ИИ» в Московской области, где несчастных сотрудников транспортных компаний заставили дополнительно ходить фотографировать царапины/трещины/скопления людей на остановках, чтобы потом другие сотрудники модерировали ИИ, который на этих снимках «обнаруживал нарушения». Могла ли эта цепочка обойтись без среднего звена? Вопрос риторический.

Пока не понятно, как будет определяться «нужда» жителей в образовательных учреждениях, медицинских организациях, спортивных объектах и так далее. Если говорить именно про обработку предпочтений городских жителей, то в мире есть подобный инструмент — Sensemaking AI от CitizenLab. Но этот ассистент не строит планы и прогнозы развития территорий, а просто структурирует и обрабатывает обратную связь для чиновников, которые потом учитывают её при принятии решений. Было бы здорово здесь увидеть подобный подход. Это если «нужда» большая.

Хотя даже если этот «ИИ» будет просто высчитывать число нужных социальных объектов, исходя из количества жителей, и потом располагать их на карте в подходящих зонах для экономии времени работников — это уже неплохо. Для малой «нужды», конечно.
🤔1
Что не поделили Маск и Альтман?

После объявления инвестиций в Stargate в Интернете обсуждают перепалку Илона Маска и Сэма Альтмана, CEO OpenAI, в социальной сети X. Их разногласия выходят за пределы Интернета: Маск подал несколько исков против Альтмана, а недавно назвал того мошенником. Когда начался конфликт и почему они так не любят друг друга?

2015 год. Сэм Альтман, молодой и амбициозный предприниматель, предлагает Маску создать лабораторию ИИ, способную бросить вызов Google и купленному ими DeepMind. Тому идея понравилась, он и придумал название — OpenAI.

Отношения не сложились — Маск не инвестировал обещанный миллиард долларов и покинул совет директоров OpenAI, ссылаясь на «коммерциализацию компании» и «конфликт интересов» с Tesla. Позже в OpenAI скажут, что он пытался объединить компанию с Tesla и подчинить себе, но не смог. Уход и отказ от финансирования напоминают шантаж бывших «напарников». Правда, в чём-то он был прав — компания привлекла обещанный Маском миллиард уже у Microsoft, стала вести коммерческую деятельность и закрыла доступ к моделям.

В 2023 году Маск осознал, что потерял контроль над OpenAI, и подписал открытое письмо о приостановке обучения ИИ в надежде замедлить конкурентов, одновременно основав свою собственную компанию — xAI, с флагманской моделью Grok. Сегодня она стала серьёзным игроком на рынке с оценкой более 40 миллиардов долларов.

В 2024 году Маск подал иски на OpenAI и Альтмана, утверждая, что компания нарушила соглашение о некоммерческом статусе, контролируется Microsoft и использовала его пожертвования для создания монополии на рынке. Особенно смешно читать эту новость на фоне недавних проблем в отношениях OpenAI и Microsoft.

В ответ была опубликована переписка Маска и Альтмана, где — удивительное дело — Маск поддерживал преобразование OpenAI в коммерческую организацию. Видимо, если под его контролем, то можно. Новый же виток конфликта связан с проектом Stargate — Маск усомнился в нём, назвал финансовое обеспечение Stargate «фейком», а Альтмана «мошенником» (и это всё несмотря на поддержку проекта Трампом).

Кто победил или проиграл в этой ситуации — судить пока рано. Видно, насколько Маск раздражён успехами компании, которая много лет назад была у него практически в руках. Новые дата-центры будут доступны OpenAI, которые смогут ещё быстрее развивать свои продукты. А недавно ещё и ходили слухи о намерении OpenAI заниматься робототехникой (подробнее рассказывали в статье про ИИ-агентов) — сферой, где у Маска тоже всегда было выигрышное положение. Суды назначены на февраль, ну а мы расскажем, как будет дальше развиваться их конфликт.
👍1🔥1
Forwarded from Ошибка 404
Один из распространённых мифов — макияж мешает распознаванию лиц. Если речь не о профессиональном гриме, то не мешает. Но раз мы уже вспомнили о Гарри Поттере, хочется напомнить, что нейросети — это не волшебная палочка. Если лицо скрыто, как в случае с Фантомасом, то и распознавать нечего.

Вернёмся к снимку. Степень схожести выше 85% позволяет утверждать, что на снимках один и тот же человек. Но этого мало, чтобы Волан-де-Морт мог, например, оплатить проезд в общественном транспорте по биометрии. В таких системах порог обычно устанавливается на уровне около 95%.
12
Что сказали про ИИ на форуме в Давосе

Тема искусственного интеллекта стала центральной на Всемирном экономическом форуме 2025 в Давосе. Лидеры индустрии, генеральные директора и представители правительств обсудили развитие ИИ, его потенциал и связанные риски. Подготовили обзор ключевых трендов и заявлений.

Рынок труда

По прогнозу ВЭФ, к 2030 году ИИ создаст 170 миллионов новых рабочих мест, при этом 92 миллиона «старых» исчезнут. Райан Рослански из LinkedIn заявил, что 70% актуальных сегодня профессиональных навыков вскоре утратят значение. Марк Бениофф из Salesforce, похоже, воспринял это буквально — компания уже сократила найм инженеров, часть их задач делегирована ИИ.

Спрос на специалистов по ИИ вырос на 300% за год, а количество упоминаний аббревиатуры в LinkedIn за 8 лет увеличилось в 20 раз. Но не стоит забывать, что искусственный интеллект усиливает потребность и в «человеческих» навыках — адаптивности, коммуникативности и эмпатии — поэтому люди остаются востребованными.

Генеральный директор Accenture Джули Свит говорит, что «физический ИИ» уже используется для сокращения времени простоя на производственных линиях, а в будущем наберёт популярность новая роль — AI people manager, который будет управлять связанными с ИИ процессами. В нашей статье есть и более подробная информация об изменениях на рынке труда.

Технологии и конкуренция

Microsoft заявила о масштабных инвестициях в облачную инфраструктуру Azure и языковые модели — 80 миллиардов долларов пойдут на строительство ЦОДов. Сатья Наделла заверил, что партнёрство с OpenAI сохраняется — на фоне слухов о назревающем расколе. А вот CEO Salesforce думает, что для Microsoft выгоднее создавать свой ИИ, и сомневается в будущем успехе OpenAI из-за убыточной бизнес-модели компании.

Anthropic разрабатывает «виртуального сотрудника», способного выполнять рутинные задачи. Они верят, что через несколько лет ИИ сможет выполнять все функции современных офисных сотрудников. OpenAI также работает над мультимодальными моделями и ИИ-агентами для заполнения форм, бронирования столиков и так далее (тот самый Operator, который выложили вчера). Словом, все подтвердили, что главным трендом 2025 года будут ИИ-агенты. А ещё мелькнула тема робототехники: OpenAI косвенно подтвердили слухи о разработках в этой области, но конкретику обещали позже.

Геополитика

В глобальной гонке США удерживают лидерство, хотя Китай, как обычно, наступает на пятки. Александр Ван из Scale AI отметил, исходя из анализа темпов развития китайского ИИ и релиза модели DeepSeek R1, подозрительно высокий объём чипов A100 в Китае (и это несмотря на санкции, какой кошмар). В духе свободного рынка тут же призвал ужесточить ограничения. На этом фоне ещё Индия стремительно укрепляет свои позиции, собираясь построить крупнейший ЦОД в мире.

В итоге ВЭФ снова утвердил ИИ как всемирный тренд, а 2025 год — как поворотный момент в развитии искусственного интеллекта.
👍2🍾1
Как Китай противостоит США в сфере искусственного интеллекта

На горизонте глобальной технологической борьбы с недавнего времени новый фронт — искусственный интеллект, и особенно активное противостояние сегодня разразилось между КНР и Соединёнными штатами. Какие позиции у Китая и как он конкурирует с США при меньших затратах?


Китай недавно представил миру модель R1 от компании DeepSeek, которая не только взорвала топы App Store, но и оказалась в 20 раз дешевле o1 от OpenAI. Будто этого мало, вскоре Alibaba презентовала модель Qwen2.5-1M — с контекстным окном в миллион токенов (более 700 тысяч слов), составив конкуренцию Google, которые впервые реализовали подобное в Gemini 1.5 Pro. И всё это в комбинации с бесплатной генерацией изображений и видео через веб-интерфейс.

Прорыв возник не на пустом месте — это результат государственной стратегии Китая. Китайская экосистема ИИ характеризуется высокой фрагментацией: около 50 компаний разрабатывают свои большие языковые модели, что создаёт здоровую конкуренцию и стимулирует инновации. Ярких примеров много: ZhipuAI выпустила ChatGLM3, превосходящий некоторые американские аналоги. Moonshot AI разработала «думающего» чат-бота Kimi с большим контекстным окном, выпустив модель сразу после Deepseek и сумев отличиться даже на её фоне. Эти компании, как и многие другие получают поддержку от государства.

Не так давно США, опираясь на капитал частных инвесторов из OpenAI, Google и Microsoft, были главными в мире ИИ. Но Китай поставил далеко идущую цель — с 2000 по 2023 год китайские государственные венчурные фонды вложили 184 миллиарда долларов в более чем 9600 ИИ-компаний. Правительство Китая также предоставляет субсидии компаниям, использующим отечественные чипы вроде Huawei Ascend.

Сегодня Китай лидирует по количеству патентов в сфере ИИ, а уже в 2022 году он забрал себе 47% всех ведущих специалистов в этой области. При этом основным центром инноваций в ИИ стала не частная компания, а университет — Tsinghua University. В марте 2024 года был анонсирован проект «AI+», который обещает интегрировать ИИ в каждую отрасль экономики, превращая технологию в её фундамент.

После американского проекта Stargate с бюджетом в 500 миллиардов долларов Банк Китая с куда меньшим пафосом анонсировал свою программу: до 2030 года страна обещает вложить в ИИ 1 триллион юаней (140 миллиардов долларов). Учитывая более дешёвую разработку и поправку на паритет покупательной способности валют, Китай даже может освоить эти деньги эффективнее. Единственное, что сегодня ограничивает страну от ещё более стремительного роста — санкции США.

Борясь с санкциями, китай создаёт собственные ИИ-чипы, платформы для обучения моделей вроде Mindspore. А параллельно предоставляет вычислительные ресурсы из проекта «Данные с востока — вычисления на западе», который помогает оптимизировать распределение вычислительных центров по всей стране.

И вот мы видим два разных подхода: США надеется на частные инвестиции и своё историческое лидерство, а Китай — на мощную государственную поддержку, инновации и, что забавно звучит, открытость и конкуренцию. Даже интересно узнать, кто выйдет победителем в итоге.
👍2🔥2🦄1
Стоило написать про соперничество Китая и США, а компания DeepSeek уже выпустила новую модель. На этот раз — мультимодальную.

Модель называется Janus Pro и предназначена для «понимания» и генерации картинок. Причём выглядит она как очередной щелчок по носу OpenAI — ведь Deepseek сделали не диффузионную модель с работой через зашумление картинки, как сегодня поступает большинство крупных компаний. Они выбрали другой подход — их модель основана на большой языковой модели. И у DALL-E от OpenAI как раз такой же случай.

Ещё смешнее смотреть на их сравнения с DALL-E, где Deepseek показывают, насколько новая модель превосходит решение OpenAI и других конкурентов. Правда, нужно иметь в виду, что пока Janus Pro работает только с изображениями размером до 384 x 384 пикселей, но это можно исправить за счёт апскейлеров.

Мы в редакции чаще всего используем как раз DALL-Е за её возможности по стилизации картинки и гиперболизации образов, поэтому будет очень интересно потестировать и сравнить. Пока всё идёт так, как предрекали Google в трендах на 2025 год — мультимодальные модели там шли на первом месте.

Janus уже доступен для скачивания, у него открытый исходный код и есть возможность коммерческого использования. Deepseek не зря западные медиа называют «вирусной» компанией, они не устают удивлять.
🔥4🐳1
Антикризисный пиар от Сэма Альтмана

На фоне падения акций американских технологических компаний Сэм Альтман написал в X, что у Deepseek действительно стоящая модель, особенно из-за её низкой стоимости. Но...

Но сразу заверил, что их новая модель будет, само собой, лучше, AGI уже не за горами и вообще миру понадобится ещё больше вычислительных мощностей, чем сейчас. Так что не спешите продавать акции Nvidia (а они за сутки потеряли около 600 миллиардов долларов капитализации) и верьте в американский ИИ.

Уже интересно посмотреть на следующий релиз OpenAI. Главное, чтобы это не был Operator 2.0
😁2👍1🍾1
Китай выделяет триллион юаней на развитие ИИ. Куда пойдут деньги?

23 января Банк Китая представил «План действий по поддержке развития индустрии искусственного интеллекта» с выделением 1 триллиона юаней до 2030 года. Что он себя включает и куда пойдут эти деньги? Пока конкретики не так много, но уже есть интересные детали.

300 миллиардов юаней будут выделены в виде инвестиций в акционерный капитал и долги (equity и debt) — для поддержки финансовой устойчивости компаний. В основе не просто кредиты, а гибкие инструменты — гранты, венчурные инвестиции, поддержка IPO. Остальная сумма пойдёт на инфраструктуру и исследования.

Банк Китая разработал механизм «1+1+N». Он предполагает, что каждая компания получит индивидуальную поддержку на всех этапах — от исследований до внедрения продукта на рынок. Параллельно запускается программа «Банк Китая: Платформа технологических инноваций+» для создания экосистемы, объединяющей правительство, научные институты, предприятия и инвесторов. Это необходимо для объединения усилий бизнеса и правительства, интеграции ресурсов и вывода решений на международный рынок.

Основой для ИИ должна стать инфраструктура, и Китай это понимает. Поэтому деньги пойдут на поддержку отечественных чипов Huawei Ascend или Baidu Kunlun и создание ЦОДов для интегрированной национальной вычислительной сети — той самой базы, на которой строится всё: от анализа больших данных до работы автономного транспорта.

Внимание акцентируется на секторах, где можно быстро получить прикладной результат — робототехнике и автономных системах (логистика и производство), биомоделировании (новые лекарства), разработке новых материалов (квантовые компьютеры и сверхпроводники). Китай ищет области, где ИИ реально повысит производительность труда, а не создаёт абстрактных ИИ-агентов для заказа пиццы на дом.

На мероприятии присутствовали представители Huawei, Tencent, Baidu, iFlytek и Zhipu, вероятно, они и получат большую часть денег (хотя официальных заявлений не было). Учитывая недавний международный успех Deepseek и встречу их CEO с премьер-министром Китая, они также могут рассчитывать на дополнительное финансирование.

Этот план не является специальным ответом на Stargate, а поддержка стартапов была и раньше — за прошедшие годы Банк Китая уже предоставил 1,91 триллиона юаней для 100000 компаний. Просто теперь темп инвестиций нарастает вместе с повышением важности самой отрасли. Если всё получится, то к 2030 году Китай может даже превзойти США. Точно ясно одно — на фоне китайских финансовых стимулов зарубежные стартапы могут столкнуться с серьёзным давлением, а противостояние США и Китая только усилится.
👍3👏1💋1
Китайцы не сдержались и перед Новым годом довыполнили KPI, сделав ещё один громкий анонс.

Alibaba представили новую версию своей модели — Qwen2.5-Max с архитектурой Mixture-of-Expert (это когда для экономии ресурсов в ответ на запрос пользователя активируются не все параметры, а только та часть, которая релевантнее всего на него ответит — нужный «эксперт» внутри модели).

Главная особенность — Qwen2.5-Max обучалась на 20 триллионах токенов. Видимо, компания даже взяла для этого где-то видеокарты. То есть санкции всё-таки «работают»…

На бенчмарках модель показывает себя вроде как даже лучше Deepseek V3, не говоря о многострадальных GPT-4o и Claude Sonnet, которых китайцы совсем уже не жалеют (а зря).

Правда, разница с тем же Deepseek минимальная, а стоит API сильно дороже. Так ещё и модель с закрытым исходным кодом. Но для простых пользователей бесплатно можно использовать через чат. В чате, кстати, ещё есть генерация картинок и видео, хотя по качеству они пока довольно посредственные в сравнении с конкурентами.

Как китайцы умудряются быть такими продуктивными? У этого есть своё объяснение — один из ведущих разработчиков этой модели и исследователь NLP в Alibaba Биньюань Хуэй начинает работать в 10 и заканчивает в 21, хотя даже после этого продолжает проверять прогресс модели и думать над развитием проекта.
3
Forwarded from Content Review
Что на самом деле кроется за DeepSeek-хайпом (1/2)

Медийный эффект, произведённый анонсами DeepSeek, заслуживает отдельного разговора. Который день приходится подряд читать одно и то же. Хотя подобные волны «экспертных» обсуждений случаются регулярно, и к 2025 году они уже не должны вызывать удивления. Они и не удивляют, но, признаться, изрядно утомляют.

Кстати, о 2025-м. Трудно удержаться и не вспомнить о бурлениях вокруг микроядерной ОС компании Huawei. Тогда, в 2019 году, «эксперты» предрекали революцию на рынке операционных систем и смену глобального лидера. Было обещано, что ядро будет открыто, а возможности системы заявлялись просто фантастические. Нам потребовалось изучить некоторое количество публикаций, собрать данные из различных источников, включая LinkedIn, GitHub и т.д., чтобы прийти к однозначному выводу: никакой полнофункциональной микроядерной ОС ни к 2021, ни даже к 2025 году в смартфонах Huawei не появится, как бы громко «эксперты» не хоронили ядро Android.

Но это было небольшое отступление. Вернёмся в наш 2025 год. DeepSeek методично, по нарастающей, выкладывает в открытый доступ модели, демонстрирующие весьма неплохие характеристики. И вот, 20 января выходит модель DeepSeek R1, позиционируемая как конкурент OpenAI o1. Модель доступна как на серверах самой DeepSeek, так и в виде опенсорсного продукта под MIT-лицензией. Цены на обработку запросов при этом были установлены приблизительно в 27 раз ниже, чем у OpenAI.

Релиз сопровождается как официальными, так и неофициальными публикациями, из которых следует, что с экономической точки зрения продукт DeepSeek на порядок превосходит конкурентов. Это касается его эксплуатации, и, что особенно подчёркивается, стоимости создания модели. Тиражируется заявление, что затраты на обучение составили всего пять с половиной миллионов долларов.

Информация стремительно распространяется в СМИ, в детали, как обычно никто не вникает. «Эксперты», в зависимости от своей принадлежности к тому или иному лагерю, начинают тиражировать привычные рассуждения. В результате, медийная волна становится одной из причин триллионной коррекции акций американского хайтека. Что, в свою очередь только усиливает бурления, количество безумных прогнозов растёт, равно как и такого же качества аналитики.

Но что происходит на самом деле? Мы видим очень талантливую маркетинговую кампанию, которая, в первую очередь, направлена на усиление переговорных позиций китайских властей с США относительно технологических санкций, а во вторую призвана поддержать выход китайских AI-продуктов на глобальные рынки.

Что же представляет собой модель R1 и действительно ли её создание было столь экономичным?

Если не углубляться в технические детали, то R1 — это действительно весьма эффективная модель, способная к рассуждениям и использующая ряд оптимизаций, повышающих её производительность. В ряде задач она демонстрирует результаты на уровне с лидерами рынка. Однако, это не всегда и не во всех тестах, поэтому говорить о её превосходстве нет оснований. Иными словами, R1 — это хороший продукт, с набором интересных оптимизаций, которые обеспечивают ему как преимущества, так и заметные недостатки.

Разумеется, создание модели R1 обошлось значительно дороже, чем фигурирующие повсеместно 5,5 миллиона долларов. Начнём с того, что эти данные взяты из документа, сопровождавшего релиз предыдущей модели DeepSeek V3, а вовсе не R1.

Согласно этому документу, 5,576 миллиона долларов могла стоить лишь завершающая фаза обучения модели V3 при условии, что она проводилась на урезанных ускорителях H800, аренду которых авторы оценили в 2 доллара в час. Однако даже к этим данным есть вопросы: достижение заявленных в статье показателей на H800 представляется крайне сложным, а каких-либо деталей не сообщается. Оно и понятно, так как слухи говорят о том, что в реальности DeepSeek располагает от 10 до 50 тысячами ускорителей Nvidia Hopper. Причем их, возможно, у нее быть не должно из-за санкционных ограничений: и запрещенный санкциями H100 и урезанный H800, относятся к семейству Hopper.

(продолжение)
Forwarded from Content Review
Что на самом деле кроется за DeepSeek-хайпом (2/2)

(начало)

Если бы менеджмент DeepSeek обладал интеллектом на уровне какого-нибудь депутата, то они, возможно, даже сняли бы тик-ток с паллетами H100, где крупными планом были бы видны серийные номера, по которым можно отследить и поставщика, и цепочку поставки, и сопроводили бы это комментариями, что мол, смотрите санкции не работают. Но, по какой-то загадочной причине компания выбрала иную стратегию и утверждает, что у неё в наличии только 2048 штук H800, и вообще это побочный проект, которым занялись только потому что железо простаивало. В общем, не видали вы еще Котофея Ивановича, он пока квантовыми вычислениями занимается, а это так, его младший брат.

Так или иначе, сумма в 5 миллионов 576 тысяч долларов не имеет никакого отношения к реальной стоимости разработки ни V3, ни тем более R1. Можно заявить, что написание этого текста стоит 6 копеек, потому что он был написан на ноутбуке в иркутской деревне, где кВт⋅ч стоит 1,8 руб. Но очевидно, что это не так.

Теперь поговорим о том, зачем китайской компании выкладывать в открытый доступ эту модель именно сейчас и сопровождать это прекрасно организованной пиар-компанией, которая поражает своей эффективностью не меньше, чем сама R1.

Во-первых, нужно понимать, что политика open source органически не очень соответствует менталитету китайских корпораций. Безусловно, мы слышали какое-то количество рекламных заявлений на этот счёт, но многолетняя практика показывает иное.

Тут, кстати, можно вспомнить главаря экстремистов Цукерберга. Мы видим у него похожую стратегию: точно также LlaMA выкладывается в открытый доступ. И мотивация в чем-то схожа: помешать OpenAI закрепиться на рынке в качестве монополиста, а заодно и набрать классов у публики.

В случае с DeepSeek мы наблюдаем не только открытый код, но и явно выраженную ориентацию на западного потребителя, включая такие детали, как авторизацию через Google, которая, как известно, в Китае не работает. Всё это сопровождается хорошо продуманной и организованной кампанией, с практически идеальными таймингами, вершиной которой становится релиз R1 20 января, ровно в день инаугурации Трампа.

Расчёт был точным: график релизов создал у публики впечатление, что DeepSeek развивается с беспрецедентной для индустрии скоростью. При этом стоит отметить, что актуальность данных модели датируется приблизительно поздней осенью 2023 года. Тем не менее, эффект внезапности позволил нарисовать убедительную картину: молодой и талантливый коллектив, для которого это является побочным проектом, разработал революционную модель с минимальными затратами на слабом, урезанном санкциями железе.

Ну наконец, на этой неделе, волна хайпа обвалила давно перегретый рынок акций. Что, опять же только позволило укрепиться мифу о невероятно гениальном продукте, который смог обогнать всю индустрию.

Таким образом, DeepSeek удалось добавить веса китайской стороне перед грядущими торговыми переговорами между США и Китаем. Все ж не каждая компания своим релизом может обвалить Nasdaq, пусть даже и в ситуации, когда рынок перегрет и коррекция так или иначе бы случилась. Одного пиара, даже очень эффективного тут явно бы не хватило.

Что тут можно сказать? Политика Soft Power возможна, когда есть и Soft (во всех смыслах), и Power. Такое сочетание на практике оказывается намного эффективнее, чем невнятные угрозы и завывания о неработающих санкциях.
Не прошло и недели с того момента, как Великобритания открыла для себя «Госуслуги» — наступил черёд государственных учреждений США открыть для себя ИИ.

OpenAI анонсировала ChatGPT Gov — специализированную версию чат-бота, предназначенную исключительно для государственных учреждений США. В теории этот шаг должен дать чиновникам «возможность ускорить принятие решений, автоматизировать рутинные процессы» и так далее. Хотя опыт показывает, что сама по себе аббревиатура не обладает никакими магическими свойствами, и нужно смотреть на результаты.

Функционал будет такой же, как у корпоративной версии ChatGPT Enterprise. Ключёвой особенностью стал повышенный уровень безопасности: сервис разворачивается в закрытом облаке Microsoft Azure и соответствует разным стандартам работы с чувствительными данными (аналогам ФЗ-152 и сертификации ФСТЭК в России).

Показательно, что внедрение ИИ от «маленькой некоммерческой компании» стартовало в США… с Военно-воздушных сил. Более того, сотрудничество OpenAI с государством и военными началось не сейчас: с января прошлого года они убрали из правил запрет на использовании ИИ для военных целей и начали партнёрство с Пентагоном.

И вот сегодня ChatGPT Gov используется в 3,5 тысячах госучреждений США. Компания пишет о 90000 пользователей сервиса — не слишком много на фоне 3 миллионов работников федерального правительства, нужно поднажать.

О финансовой стороне проекта никто не говорит — стоимость сервиса для учреждений не раскрывается. Хотя учитывая заявления OpenAI, что они теряют деньги на подписках за 200 долларов в месяц — госзаказ может стать отличным способом получить финансирование из бюджета. Маск занимается таким давно — чем Альтман хуже?

В России ИИ уже используется в разных цифровых сервисах, начиная от самого массового государственного портала — Госуслуг, со своим ассистентом на базе отечественных языковых моделей. А Минцифры ещё в июле 2023 года сформулировало список основных направлений развития ИИ в сфере госуправления. США до Госуслуг пока ещё не дошли, но хоть с внедрением ИИ можно пожелать удачи — с чего-то надо начинать.
😁3
Конкуренция в сфере робототехники набирает оборотыи её участниками становятся передовые компании из сферы искусственного интеллекта

OpenAI, которые раньше ограничивались разве что инвестициями в этот сектор, намекнули на форуме в Давосе о готовности самим заняться производством роботов. Поддерживаемый OpenAI стартап 1X недавно приобрел компанию Kind Humanoid. Figure AI также активно сотрудничает с OpenAI в разработке роботов для промышленного использования. И все перечисленные компании — одни из ведущих стартапов в отрасли робототехники.

Nvidia на CES 2025 уделила очень много внимания автономным роботам с ИИ-агентами и даже показала нейросеть Cosmos для создания синтетического материала, на котором их можно обучать. В плане Банка Китая по инвестиции триллиона юаней в ИИ также ведущая роль отведена разработкам в области робототехники. Словом, все понимают, что эта отрасль станет одной из самых важных в перспективе на ближайшие 5 лет.

В связи с этим Илон Маск планирует выпустить от 500 тысяч до миллиона гуманоидных роботов Optimus к 2027 году. По его словам, это будет «самый большой продукт в истории», и к 2035 году на каждого человека будет приходиться по 5 роботов. Производственные тесты уже идут на заводах Tesla, а в 2025 году Optimus будет внедрен во внутренние процессы компании.

Ключевым элементом здесь является ИИ, который будет управлять роботами. Именно поэтому Figure сейчас так зависят от OpenAI и их решений. Tesla использует ИИ, способный обучаться и адаптироваться, а грядущий чип AI5 обещает сделать роботов более умными и быстрыми. Маск уверен, что Optimus сможет работать на заводах и стать помощником в каждом доме.

Однако есть сомнения, что Tesla достигнет заявленных объемов производства в такие короткие сроки. А даже если достигнет — гуманоидным роботам еще предстоит доказать свою надежность и безопасность. Figure AI, например, думают об этом уже сейчас и планируют создать центр по проверке стабильности роботов, тестируя их поведение в движении и реакцию на людей и животных. Но уже понятно, что связанные с безопасностью на производстве ограничения могут стать причиной замедления или откладывания процесса роботизации.

Маск также продвигает идею автономного транспорта, обещая, что к июню 2025 года в Остине появится полностью беспилотная служба роботакси. Он утверждает, что система Full Self-Driving «безусловно безопаснее» обычного вождения. Хотя критические вмешательства водителей всё ещё происходят раз в 400 миль. Основатель Waymo Энтони Левандовски сомневается в реалистичности планов Илона Маска, хотя и поддерживает его идеи.

Зачем так вкладываться в роботов? Экономический потенциал робототехники огромен. Маск, например, говорит о глобальном спросе на 20 миллиардов человекоподобных роботов. Хотя вот Deutsche Bank смотрят скептично и прогнозируют объём продаж только 200 тысяч роботов в год. TSMC же просто радуется грядущей волне заказов и рассматривает многофункциональных роботов как стратегическое направление развития.

Можно с большой уверенностью сказать, что очередная «арена» крупных технологических компаний на ближайшие годы определена. Интересно только, будет ли Маск, как новый директор Департамента эффективности правительства, пытаться как-то влиять на регуляторные органы и обеспечить себе преимущества на этой арене?
👍3
Китайский чат-бот DeepSeek иногда выдает себя за YandexGPT. Во вторник в Telegram-каналах появились скриншоты с ответами DeepSeek на вопрос «Кто умнее, ты или ChatGPT4?», где китайский ИИ сначала утверждает, что он является YandexGPT, а потом говорит, что это было недоразумение из-за технической ошибки в данных или случайной путаницы во время обучения. В «Яндексе» ошибку прокомментировали так:

«Многие нейросети обучаются на данных, доступных в интернете. Эти данные могут включать как оригинальные тексты, так и материалы, сгенерированные другими ИИ-системами. В случае с DeepSeek, вероятно, в ее датасет могли попасть данные, связанные с технологиями "Яндекса", так как в сети присутствуют публичные обсуждения, упоминания и отзывы о таких системах. Именно поэтому, когда модель генерирует ответ, она может случайно воспроизвести информацию, относящуюся к "Яндексу", в том числе ошибочно утверждая, что она является YandexGPT».


Кажется, случай с DeepSeek подчеркивает важность развития открытых решений. Компания поддерживает open-source разработки и доступность технологий для всего сообщества. На днях технический директор «Яндекса» Алексей Гусаков отметил, что высокая степень открытости при создании чат-бота DeepSeek является редкостью, а технический отчет его создателей отличается высокой степенью подробности.

Свою версию ИИ-ассистента (R1) китайский стартап выложил в открытый доступ 20 января, после чего он занял первое место по скачиваниям в App Store в США, Великобритании, ОАЭ, Японии, Южной Корее и Китае. Вследствие этого акции ряда технологических компаний начали падение на бирже. Хороший разбор ситуации с акциями можно почитать тут.
Генеративный ИИ в бизнесе: инвестиции растут, но есть ли реальная отдача?

Генеративный искусственный интеллект (GenAI) больше не рассматривается как технологическая новинка — он стал неотъемлемой частью бизнес-стратегий крупнейших мировых компаний. Dataiku в середине прошлого года провели исследование, опросив 400 senior специалистов по GenAI и ML из ведущих компаний мира. Большая часть опрошенных была из США (60%), ещё 30% из ЕС и только 10% из Азиатско-Тихоокеанского региона, так что исследование скорее относится к западным компаниям. Но оно всё равно остаётся интересным, в том числе и для российского бизнеса. На какие цифры стоит обратить внимание?

В прошлом году почти 90% крупных компаний уже инвестировали в генеративный искусственный интеллект (GenAI), а 48% планируют выделить на это направление как минимум миллион долларов в 2025 году. Средства для таких инвестиций поступают из разных источников: в 57% случаев они берутся из бюджетов IT и Data Science, а треть компаний выделили для GenAI отдельный бюджет. Сразу возникает вопрос: насколько эти инвестиции оправданы?

65% компаний, которые уже внедрили большие языковые модели (LLM), настроены оптимистично и считают, что вложения в них окупаются. Однако общий показатель рентабельности инвестиций (ROI) в сфере данных и аналитики остается на прежнем уровне, несмотря на рост вложений. Это может указывать на несовершенство метрик и трудности с измерением реального эффекта от использования ИИ, или на необходимость улучшения и поиска новых методов его монетизации. Что используют компании?

Среди сервисов, которые используются для внедрения GenAI, безоговорочными лидерами являются LLM (особенно от OpenAI). 85% компаний либо уже применяют их, либо активно изучают. В то же время растет интерес к решениям с собственным хостингом на основе open-source моделей (вроде Llama и Mistral, а с недавнего времени — DeepSeek). Эти решения позволяют обеспечить контроль, безопасность данных и меньшую зависимость от вендоров. Где они применяются?

Нейросети находят применение в HR (для подбора и управления персоналом), юридических отделах (в автоматизации анализа контрактов и других документов, например) и других бизнес-функциях. Менеджеры все чаще рассматривают GenAI как фактор, трансформирующий бизнес-процессы, а не просто повышающий производительность сотрудников. Но всё ли так гладко?

Несмотря на инновации, существуют и барьеры на пути внедрения технологии. Классические проблемы — нехватка данных, сложность внедрения и дефицит специалистов — все еще актуальны. Однако появились и более специфические: отсутствие вычислительных ресурсов (44%), непонимание сотрудниками, как использовать GenAI (28%), и ограничения со стороны IT и регуляторов (22%).

Фавориты гонки — «пионеры ИИ». Они инвестируют более активно, быстрее достигают рентабельности (69% против 52% у остальных компаний) и более уверенно осваивают новые модели GenAI. Такие компании выстраивают зрелые организационные структуры, внедряют системы отслеживания ROI и получают возврат инвестиций выше $1 на каждый вложенный доллар. Собственно, именно они и выделили для ИИ отдельный бюджет, направляя туда больше денег, чем конкуренты. Разрыв между «пионерами» и остальными игроками рынка увеличивается.

Важно, что похожие выводы были сделаны консалтинговой компанией CB Insight, которая проводила опрос среди 50 руководителей, отвечающих за стратегию компаний, в августе 2024 года.

Все понимают, что GenAI уже не просто игрушка, а инструмент, который компании активно интегрируют в бизнес-процессы. Но парадокс ситуации заключается в том, что технология получила популярность сравнительно недавно. Адекватных метрик для измерения ROI в случае с генеративным ИИ нет, пока его влияние на результаты бизнеса остаётся сложным для оценки, а инвестиции делаются скорее в надежде на будущую потенциальную прибыль, даже при отсутствии отдачи здесь и сейчас.
👍1
Вот они и договорились
😁13