Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Почувствуйте разницу между Нанабананой и остальными неудачниками.
Промпт на одной из картинок: "сделай только тарелку и сам суп в духе 2Д-аниме, а остальное не трогай воще".
Пора выдавать награду за голову Нанабананы, живой или мертвой. Опенсорсной или закрытой. Любая информация про мерзавку.
@cgevent
Промпт на одной из картинок: "сделай только тарелку и сам суп в духе 2Д-аниме, а остальное не трогай воще".
Пора выдавать награду за голову Нанабананы, живой или мертвой. Опенсорсной или закрытой. Любая информация про мерзавку.
@cgevent
🔥18❤5⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
WIRobotics выпустили гуманоида ALLEX
Корейцы из WIRobotics представили универсального гуманоида ALLEX с качественными, точными в движениях, руками.
Каждая рука имеет 15 степеней свободы, поднимает 30+ кг и создает усилие 40+ Н кончиками пальцев.
Причём такие руки достаточно сложны в производстве, поэтому массовость наладят не скоро.
Механизмы и системы управления были разработаны в партнерстве с техническим университетом KOREATECH.
Pricise fingering (мелкая моторика) от корейцев :)
Будет интересно когда робот сможет кисточкой иероглиф нарисовать. Ну т.е. не как принтер, а именно художественная роспись на рандомной поверхности.
#ALLEX #WIRobotics #robots
------
@tsingular
Корейцы из WIRobotics представили универсального гуманоида ALLEX с качественными, точными в движениях, руками.
Каждая рука имеет 15 степеней свободы, поднимает 30+ кг и создает усилие 40+ Н кончиками пальцев.
Причём такие руки достаточно сложны в производстве, поэтому массовость наладят не скоро.
Механизмы и системы управления были разработаны в партнерстве с техническим университетом KOREATECH.
Pricise fingering (мелкая моторика) от корейцев :)
Будет интересно когда робот сможет кисточкой иероглиф нарисовать. Ну т.е. не как принтер, а именно художественная роспись на рандомной поверхности.
#ALLEX #WIRobotics #robots
------
@tsingular
🔥26⚡17❤4🆒3🤣1👾1
Forwarded from Борис опять
Pro tip: поставь в зуме имя "AI notetaker" и можешь молча присутствовать на любых встречах
🤣20✍10❤2
Я понимаю, что на 3 поста вверх тяжело смотреть,- шея затекает, но там бессмертие подвезли. :)
@tsingular
@tsingular
😁23💯5
Жадная телега (не админ. Админ,- практикующий альтруист), снова требует бустов для поддержания жироты широты эмоционального разнообразия и автопереводов.
Поддержите кому не влом 😀 :
https://xn--r1a.website/boost/tsingular
@tsingular
Поддержите кому не влом 😀 :
https://xn--r1a.website/boost/tsingular
@tsingular
Telegram
Технозаметки Малышева
Проголосуйте за канал, чтобы он получил больше возможностей.
5⚡12
Forwarded from PWN AI (Artyom Semenov)
От идей к инструментам: что я показал на OFFZONE 2025.
Если вы читали мой анонс, то, наверное, запомнили эту строчку:
«И я покажу - не теорию, не концепт, а вещь, которую можно взять в руки, подключить, настроить. Инструмент для наступательной безопасности. Для тестирования агентов, которые уже не просто отвечают - они решают.»
Собственно, вокруг этого и строился весь мой доклад. Мне хотелось показать не очередную гипотезу или красивую схему на слайде, а живую концепцию того, каким может быть инструмент для тестирования агентов в динамике.
Да, первыми подобный подход реализовали в AgentDojo, но я убеждён: можно сделать проще, компактнее, доступнее. Хочу, чтобы в арсенале ИБ появился конструктор - окружение, которое можно без боли развернуть и сразу использовать как рабочий инструмент.
Сейчас в agentsploit поддерживаются только langchain-агенты - далеко не идеальный вариант. Думаю о том, чтобы добавить поддержку Langflow, а может быть, и других фреймворков. Ну и, конечно, особое внимание стоит уделить компонентам-оценщикам: без них картинка получается неполной. Тут я вижу огромный простор для развития.
Что касается самой подачи, я выбрал форму рассказа, вдохновившись произведением Филипа К. Дика «Обман Инкорпорейтед». И, знаете, не пожалел ни на секунду. В мире, где идёт ожесточённая борьба за внимание, рассказ, переплетённый с отсылками к художественному миру, оказался куда живее сухих тезисов.
Спасибо всем, кто пришёл на выступление - вас было действительно много, и это заряжает. Отдельная благодарность организаторам AI.ZONE за то, что вплели мою идею в сетку докладов.
А дальше - больше. В ближайшее время я подготовлю отдельный лонгрид: разберём инструмент детально и пройдёмся по его особенностям.
PDF версия презентации - ниже.
Если вы читали мой анонс, то, наверное, запомнили эту строчку:
«И я покажу - не теорию, не концепт, а вещь, которую можно взять в руки, подключить, настроить. Инструмент для наступательной безопасности. Для тестирования агентов, которые уже не просто отвечают - они решают.»
Собственно, вокруг этого и строился весь мой доклад. Мне хотелось показать не очередную гипотезу или красивую схему на слайде, а живую концепцию того, каким может быть инструмент для тестирования агентов в динамике.
Да, первыми подобный подход реализовали в AgentDojo, но я убеждён: можно сделать проще, компактнее, доступнее. Хочу, чтобы в арсенале ИБ появился конструктор - окружение, которое можно без боли развернуть и сразу использовать как рабочий инструмент.
Сейчас в agentsploit поддерживаются только langchain-агенты - далеко не идеальный вариант. Думаю о том, чтобы добавить поддержку Langflow, а может быть, и других фреймворков. Ну и, конечно, особое внимание стоит уделить компонентам-оценщикам: без них картинка получается неполной. Тут я вижу огромный простор для развития.
Что касается самой подачи, я выбрал форму рассказа, вдохновившись произведением Филипа К. Дика «Обман Инкорпорейтед». И, знаете, не пожалел ни на секунду. В мире, где идёт ожесточённая борьба за внимание, рассказ, переплетённый с отсылками к художественному миру, оказался куда живее сухих тезисов.
Спасибо всем, кто пришёл на выступление - вас было действительно много, и это заряжает. Отдельная благодарность организаторам AI.ZONE за то, что вплели мою идею в сетку докладов.
А дальше - больше. В ближайшее время я подготовлю отдельный лонгрид: разберём инструмент детально и пройдёмся по его особенностям.
PDF версия презентации - ниже.
🔥8❤2
Eleven v3 (alpha) стала доступна через API
ElevenLabs открыла доступ к новой версии своей голосовой модели через API.
Основные улучшения - более эмоциональная выразительность и реалистичный синтез речи.
В модель встроена система водяных знаков VoiceShield - теперь можно отслеживать сгенерированный ИИ контент.
ИИ голос будет ещё сложнее отличить от настоящего человека.
#ElevenLabs #TTS #API
------
@tsingular
ElevenLabs открыла доступ к новой версии своей голосовой модели через API.
Основные улучшения - более эмоциональная выразительность и реалистичный синтез речи.
В модель встроена система водяных знаков VoiceShield - теперь можно отслеживать сгенерированный ИИ контент.
ИИ голос будет ещё сложнее отличить от настоящего человека.
#ElevenLabs #TTS #API
------
@tsingular
👍3⚡1
Forwarded from Егошин | Кеды профессора
Если бы не один ботаник и четыре певицы - не было бы ни мемов, ни Госуслуг, ни ChatGPT.
Иногда большие истории начинаются странно. Кто бы мог подумать, что нажатие одной клавиши и шуточная песня про коллайдер станут первой искрой цепочки, которая приведёт нас к ChatGPT.
23 августа 1991 года в CERN один скромный физик нажал «Enter» - и мир перестал быть прежним. Его звали Тим Бернерс-Ли. Он придумал то, что мы сегодня называем «ссылкой», и выложил в сеть первую в истории веб-страницу. По сути изобрел Интернет.
«Я всего лишь хотел упорядочить хаос», - говорил он. Но на самом деле он построил мост, по которому человечество вышло в новую эпоху.
Вот, кстати, тот самый первый сайт, который до сих пор работает: http://info.cern.ch/
А теперь - девушки. Четыре сотрудницы CERN, которые ради прикола собрали музыкальную группу «Les Horribles Cernettes» («Ужасные ЦЕРНнетки») и прославились шуточными песнями о любви к физикам, влюблённым в свои коллайдеры. Именно их фото стало первой картинкой, отправленной по интернету. Мир увидел не логотип, не схему, не документ - а улыбки.
- вот цитата из их песни - ну чем не гимн цифровой эпохи?
С тех пор интернет вырос в глобальную экономику, перевернул рынок и сделал нефть второстепенной. Сегодня самая дорогая валюта - не литры топлива, а гигабайты данных и минуты нашего внимания.
Но самое важное: интернет оказался не финалом, а прологом. На его рельсах сейчас мчится искусственный интеллект. Все мемы, статьи, фото и видео стали топливом для AI-моделей. Если через 100 лет нас будут помнить - то, скорее всего, как поколение, которое преобразовало интернет в искусственный интеллект.
Сегодня интернету всего 34. Для технологий это подростковый возраст - бунтарский, дерзкий, полный экспериментов. И он только учится жить вместе с человечеством.
🎉 С днём рождения, интернет! 🌐🚀
Егошин | Кеды профессора
Иногда большие истории начинаются странно. Кто бы мог подумать, что нажатие одной клавиши и шуточная песня про коллайдер станут первой искрой цепочки, которая приведёт нас к ChatGPT.
23 августа 1991 года в CERN один скромный физик нажал «Enter» - и мир перестал быть прежним. Его звали Тим Бернерс-Ли. Он придумал то, что мы сегодня называем «ссылкой», и выложил в сеть первую в истории веб-страницу. По сути изобрел Интернет.
«Я всего лишь хотел упорядочить хаос», - говорил он. Но на самом деле он построил мост, по которому человечество вышло в новую эпоху.
Вот, кстати, тот самый первый сайт, который до сих пор работает: http://info.cern.ch/
А теперь - девушки. Четыре сотрудницы CERN, которые ради прикола собрали музыкальную группу «Les Horribles Cernettes» («Ужасные ЦЕРНнетки») и прославились шуточными песнями о любви к физикам, влюблённым в свои коллайдеры. Именно их фото стало первой картинкой, отправленной по интернету. Мир увидел не логотип, не схему, не документ - а улыбки.
Я подарила тебе золотое кольцо, чтобы показать свою любовь.
А ты вставил его в печатную плату,
Чтобы устранить утечку напряжения в коллекторе.
Ты подключаешь мои чувства к своему детектору.
Ты никогда не проводишь со мной вечера.
Ты не встречаешься с другими девушками.
Ты любишь только свой коллайдер,
Свой коллайдер
- вот цитата из их песни - ну чем не гимн цифровой эпохи?
С тех пор интернет вырос в глобальную экономику, перевернул рынок и сделал нефть второстепенной. Сегодня самая дорогая валюта - не литры топлива, а гигабайты данных и минуты нашего внимания.
Но самое важное: интернет оказался не финалом, а прологом. На его рельсах сейчас мчится искусственный интеллект. Все мемы, статьи, фото и видео стали топливом для AI-моделей. Если через 100 лет нас будут помнить - то, скорее всего, как поколение, которое преобразовало интернет в искусственный интеллект.
Сегодня интернету всего 34. Для технологий это подростковый возраст - бунтарский, дерзкий, полный экспериментов. И он только учится жить вместе с человечеством.
🎉 С днём рождения, интернет! 🌐🚀
Егошин | Кеды профессора
🎉13⚡6 3🍾2❤1✍1🤩1👀1🦄1
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 DeepConf — новый подход к мышлению ИИ
Учёные придумали новые метод Deep Think with Confidence (DeepConf).
Он позволяет модели сразу отбрасывать «слабые» варианты ответа и оставлять только те, в которых она уверена.
Классический метод *parallel thinking* (self-consistency) работает так: модель генерирует множество рассуждений и выбирает лучший ответ по большинству. Точность повышается, но ресурсы тратятся огромные — тысячи токенов уходят на слабые варианты.
🔹 DeepConf решает эту проблему: модель сама оценивает уровень уверенности в рассуждениях и отбрасывает «слабые» ветви — либо сразу, либо после генерации.
Как это устроено:
1️⃣ Оценка уверенности на уровне токенов — смотрится вероятность выбранного токена (log-prob) или энтропия.
2️⃣ Group Confidence — оценки объединяются в блоки, чтобы понять силу целой ветки рассуждения.
3️⃣ Online-режим — слабые ветки отсекаются прямо в процессе.
4️⃣ Offline-режим — сначала генерируются все ответы, потом остаются только те, где уверенность высокая.
📈 Результаты:
- На AIME-2025 точность выросла до 99,9%
- Количество лишних токенов сократилось почти на 85%
- Работает без дообучения и сложных настроек
📚 Paper: https://arxiv.org/pdf/2508.15260
🌐 Project: https://jiaweizzhao.github.io/deepconf
Учёные придумали новые метод Deep Think with Confidence (DeepConf).
Он позволяет модели сразу отбрасывать «слабые» варианты ответа и оставлять только те, в которых она уверена.
Классический метод *parallel thinking* (self-consistency) работает так: модель генерирует множество рассуждений и выбирает лучший ответ по большинству. Точность повышается, но ресурсы тратятся огромные — тысячи токенов уходят на слабые варианты.
🔹 DeepConf решает эту проблему: модель сама оценивает уровень уверенности в рассуждениях и отбрасывает «слабые» ветви — либо сразу, либо после генерации.
Как это устроено:
1️⃣ Оценка уверенности на уровне токенов — смотрится вероятность выбранного токена (log-prob) или энтропия.
2️⃣ Group Confidence — оценки объединяются в блоки, чтобы понять силу целой ветки рассуждения.
3️⃣ Online-режим — слабые ветки отсекаются прямо в процессе.
4️⃣ Offline-режим — сначала генерируются все ответы, потом остаются только те, где уверенность высокая.
📈 Результаты:
- На AIME-2025 точность выросла до 99,9%
- Количество лишних токенов сократилось почти на 85%
- Работает без дообучения и сложных настроек
📚 Paper: https://arxiv.org/pdf/2508.15260
🌐 Project: https://jiaweizzhao.github.io/deepconf
🔥9⚡5❤2👍2
Media is too big
VIEW IN TELEGRAM
Zhiyuan Mall — мегамолл роботов запущен в Китае
Zhiyuan Robot в сотрудничестве с LG, JD.com и Tencent запустили супермаркет гуманоидных роботов.
В наличии несколько категорий, - от промышленных до бытовых и даже молодёжных :).
В продаже и гуманоиды и собаки и запчасти к ним.
Есть так же VR комплекты дистанционного управления и аккумуляторные наборы.
В целом приоритет - opensourse подход и глобальная экспансия.
Роботы теперь продаются как посудомойки.
Ждем акции типа "купи телевизор, получи гуманоида в подарок".
М-Видео когда уже?
Или кто у нас еще ИИ роботов возит? 😉
#Zhiyuan #robots #Китай
------
@tsingular
Zhiyuan Robot в сотрудничестве с LG, JD.com и Tencent запустили супермаркет гуманоидных роботов.
В наличии несколько категорий, - от промышленных до бытовых и даже молодёжных :).
В продаже и гуманоиды и собаки и запчасти к ним.
Есть так же VR комплекты дистанционного управления и аккумуляторные наборы.
В целом приоритет - opensourse подход и глобальная экспансия.
Роботы теперь продаются как посудомойки.
Ждем акции типа "купи телевизор, получи гуманоида в подарок".
М-Видео когда уже?
Или кто у нас еще ИИ роботов возит? 😉
#Zhiyuan #robots #Китай
------
@tsingular
Материалы про Schema-Guided Reasoning (SGR) для LLM от Рината Абдуллина @llm_under_hood
- SGR Intro - заглавная страница с определением и основными ссылками
- SGR Patterns - примеры простых паттернов, из которых можно "собирать" более сложные reasoning схемы: Cascade, Routing, Cycle.
- SGR Examples - четыре примера: simple math task, text-to-sql, document classification, advanced reasoning in compliance.
- SGR Demo - пример бизнес-ассистента с использованием инструментов на базе SGR
Интересная подборка. Изучаем.
#SGR #обучение #structuredoutput #promptengineering
------
@tsingular
- SGR Intro - заглавная страница с определением и основными ссылками
- SGR Patterns - примеры простых паттернов, из которых можно "собирать" более сложные reasoning схемы: Cascade, Routing, Cycle.
- SGR Examples - четыре примера: simple math task, text-to-sql, document classification, advanced reasoning in compliance.
- SGR Demo - пример бизнес-ассистента с использованием инструментов на базе SGR
Интересная подборка. Изучаем.
#SGR #обучение #structuredoutput #promptengineering
------
@tsingular
✍4❤1⚡1😁1
Forwarded from ИТ в Медицине
Учёные из Массачусетса представили разработки, которые могут перевернуть наше представление о профилактике и мониторинге здоровья в будущем.
🔹 В MIT создали ультразвуковой бюстгальтер-сканер. Он позволяет женщинам проходить регулярные обследования груди прямо дома, между визитами к врачу. Идея родилась после личной трагедии исследовательницы Канан Даґдевирен: её тётя умерла от рака, который не был выявлен вовремя. Теперь диагностика может стать регулярной и максимально удобной — без похода в клинику.
🔹 Другой проект — графеновые «татуировки», которые считывают биохимические процессы организма и способны заранее предупреждать о приближении сердечного приступа. Они настолько тонкие и незаметные, что человек может забыть о них, пока в нужный момент устройство не подаст сигнал.
🔹 Ещё одна разработка от профессора Йоэля Финка — «умная нить», которая может хранить данные, выполнять алгоритмы ИИ, улавливать движение и звук, а также передавать всё это через Bluetooth. Обычная футболка может превратиться в медицинский датчик, который фиксирует изменения в вашем организме.
Пока все это напоминает снаряжение героев сериала Star Trek, но возможно когда-то действительно так и будет.
@it_medicine
🔹 В MIT создали ультразвуковой бюстгальтер-сканер. Он позволяет женщинам проходить регулярные обследования груди прямо дома, между визитами к врачу. Идея родилась после личной трагедии исследовательницы Канан Даґдевирен: её тётя умерла от рака, который не был выявлен вовремя. Теперь диагностика может стать регулярной и максимально удобной — без похода в клинику.
🔹 Другой проект — графеновые «татуировки», которые считывают биохимические процессы организма и способны заранее предупреждать о приближении сердечного приступа. Они настолько тонкие и незаметные, что человек может забыть о них, пока в нужный момент устройство не подаст сигнал.
🔹 Ещё одна разработка от профессора Йоэля Финка — «умная нить», которая может хранить данные, выполнять алгоритмы ИИ, улавливать движение и звук, а также передавать всё это через Bluetooth. Обычная футболка может превратиться в медицинский датчик, который фиксирует изменения в вашем организме.
Пока все это напоминает снаряжение героев сериала Star Trek, но возможно когда-то действительно так и будет.
@it_medicine
WBUR
These 3 health gadgets will make you feel like the future is (almost) here
Massachusetts scientists are building the next generation of wearables — tattoos, fabrics and bras — that could monitor health more accurately than today's smartwatches and fitness tracking devices.
🔥9✍2⚡1❤1👍1
Forwarded from Сиолошная
MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers
Свежий бенчмарк от Salesforce, на этот раз тестируют навыки работы LLM с популярными MCP-серверами. MCP — это предложенный Anthropic в конце 2024-го года протокол взаимодействия LLM со внешними системами и источниками данных. По сути те же инструменты, только собранные в наборы для отдельных сервисов: поиск, Гугл Карты, итд. При этом, так как технология MCP — «молодая», модели ещё не настолько хорошо с ними работают и не обучались на них по сто тыщ раз.
Авторы собрали 11 MCP серверов (на 133 инструмента) из 6 доменов, и придумали 231 задачу, которая решается с использованием одного или нескольких MCP:
— Для домена навигации по картам выбрали 4 типа подзадач, включая планирование маршрута, оптимальные остановки, поиск местоположения и поиск по ID конкретного заведения
— Для домена управления репозиторием с кодом тоже 4 типа подзадач, включая настройку проекта, отслеживание проблем, настройку автоматизации и интеграцию кода
— Для домена финансового анализа 5 подзадач: анализ портфеля, финансовая отчетность, торговые стратегии, институциональные активы и анализ дивидендов
— Для домена 3D-проектирования (используют Blender) 5 подзадач, включая создание объектов, настройку материалов, конфигурацию освещения, настройки рендеринга и иерархию сцен
— Для домена автоматизации браузера 5 подзадач: бронирование билетов, спортивная аналитика, академические исследования, исследование платформы и навигация по карте
— Для домена веб-поиска тоже 5: идентификацию человека, обнаружение сущностей, сопоставление метрик, сложные рассуждения и поиск фактов.
Существенная часть задач требует больше 5 обращений к MCP-серверу, что подразумевает хорошую работу LLM с длинным контекстом. Результат работы оценивается по трём критериям: оценка формата, простая сверка ответа и динамическая. Последняя — это для запросов в духе «какая сегодня погода», так как ответ меняется из раза в раз.
Авторы отсеивали задачи, которые LLM могут сделать без MCP серверов или если модель решает задачу 5 раз из 5 — они были слишком лёгкими.
Свежий бенчмарк от Salesforce, на этот раз тестируют навыки работы LLM с популярными MCP-серверами. MCP — это предложенный Anthropic в конце 2024-го года протокол взаимодействия LLM со внешними системами и источниками данных. По сути те же инструменты, только собранные в наборы для отдельных сервисов: поиск, Гугл Карты, итд. При этом, так как технология MCP — «молодая», модели ещё не настолько хорошо с ними работают и не обучались на них по сто тыщ раз.
Авторы собрали 11 MCP серверов (на 133 инструмента) из 6 доменов, и придумали 231 задачу, которая решается с использованием одного или нескольких MCP:
— Для домена навигации по картам выбрали 4 типа подзадач, включая планирование маршрута, оптимальные остановки, поиск местоположения и поиск по ID конкретного заведения
— Для домена управления репозиторием с кодом тоже 4 типа подзадач, включая настройку проекта, отслеживание проблем, настройку автоматизации и интеграцию кода
— Для домена финансового анализа 5 подзадач: анализ портфеля, финансовая отчетность, торговые стратегии, институциональные активы и анализ дивидендов
— Для домена 3D-проектирования (используют Blender) 5 подзадач, включая создание объектов, настройку материалов, конфигурацию освещения, настройки рендеринга и иерархию сцен
— Для домена автоматизации браузера 5 подзадач: бронирование билетов, спортивная аналитика, академические исследования, исследование платформы и навигация по карте
— Для домена веб-поиска тоже 5: идентификацию человека, обнаружение сущностей, сопоставление метрик, сложные рассуждения и поиск фактов.
Существенная часть задач требует больше 5 обращений к MCP-серверу, что подразумевает хорошую работу LLM с длинным контекстом. Результат работы оценивается по трём критериям: оценка формата, простая сверка ответа и динамическая. Последняя — это для запросов в духе «какая сегодня погода», так как ответ меняется из раза в раз.
Авторы отсеивали задачи, которые LLM могут сделать без MCP серверов или если модель решает задачу 5 раз из 5 — они были слишком лёгкими.
❤5👍2✍1🔥1
🚀 Macrohard: Маск запускает AI-компанию против Microsoft
Илон Маск анонсировал проект полностью автоматизированной софтверной компании на базе AI — прямого конкурента Microsoft.
Суть инициативы: создать первую компанию, где сотни AI-агентов на базе Grok самостоятельно разрабатывают, тестируют и выпускают ПО без участия людей.
Технический фундамент:
- Суперкомпьютер Colossus: 200K+ GPU Nvidia с планами усиления до 1M к концу года (строят ускоренными темпами, - буквально датацентр в палатках)
- Производительность: 98,9 экзафлопс (одна из топ-5 AI-систем мира на сегодня)
- Модель Grok-4 с мультиагентной архитектурой
- Развертывание за 122 дня вместо стандартных 18-24 месяцев
- Потребление энергии: 250 МВт с планами до 1,65 ГВт
Финансирование:
$12 млрд привлечено, оценка $80 млрд
Но сжигает $1 млрд ежемесячно
Обещает 70% снижение затрат на разработку
Следующие 18 месяцев покажут насколько реально с маскока вытеснить Майкрософт с рынка, на котором она окапывалась почти 5 десятилетий (в следующем году 4 апреля 50 лет будет).
Но даже если не получится, - опыт автономной разработки роем ИИ агентов Маск наработает бесценный, конечно.
#Macrohard #xAI #ElonMusk #Microsoft
———
@tsingular
Илон Маск анонсировал проект полностью автоматизированной софтверной компании на базе AI — прямого конкурента Microsoft.
Суть инициативы: создать первую компанию, где сотни AI-агентов на базе Grok самостоятельно разрабатывают, тестируют и выпускают ПО без участия людей.
Технический фундамент:
- Суперкомпьютер Colossus: 200K+ GPU Nvidia с планами усиления до 1M к концу года (строят ускоренными темпами, - буквально датацентр в палатках)
- Производительность: 98,9 экзафлопс (одна из топ-5 AI-систем мира на сегодня)
- Модель Grok-4 с мультиагентной архитектурой
- Развертывание за 122 дня вместо стандартных 18-24 месяцев
- Потребление энергии: 250 МВт с планами до 1,65 ГВт
Финансирование:
$12 млрд привлечено, оценка $80 млрд
Но сжигает $1 млрд ежемесячно
Обещает 70% снижение затрат на разработку
Следующие 18 месяцев покажут насколько реально с маскока вытеснить Майкрософт с рынка, на котором она окапывалась почти 5 десятилетий (в следующем году 4 апреля 50 лет будет).
Но даже если не получится, - опыт автономной разработки роем ИИ агентов Маск наработает бесценный, конечно.
#Macrohard #xAI #ElonMusk #Microsoft
———
@tsingular
🔥20😁7👀1
🚀 Seed-OSS-36B-Instruct от ByteDance — новая открытая модель с контролем глубины мышления
36B параметров с GQA attention
Контекст 512K токенов
Совместимость с vLLM и Transformers
Бенчмарки — SOTA среди открытых моделей:
MMLU: 90.6% (vs 78.6% у Gemma3-27B)
LiveCodeBench: 66.8%
SWE-Bench Verified: 48.4%
AIME 2024: 90.3%
ArcAGI V2 - 50.3%
SimpleQA 23.7%
Agent: SWE-Bench Verified
(OpenHands) 41.8%
Про thinking budget:
- Задается через лимит токенов на размышления (512, 1K, 2K, 4K, 8K, 16K)
- Модель периодически отчитывается о потраченных/оставшихся ресурсах
- При исчерпании бюджета выдает финальный ответ
- Budget = 0 → прямой ответ без раздумий
Требует ~77GB VRAM (FP16), но thinking budget позволяет оптимизировать затраты — простые задачи решает быстро, сложные получают необходимое время на размышления.
Есть GGUF вариант под LM Studio и Ollama в Q4 - 20 гигов
Q8 - 38.5 Gb
Apache 2.0 лицензия - можно использовать в коммерции.
HF: https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct
#SeedOSS #ByteDance #OpenSource #Китай
———
@tsingular
36B параметров с GQA attention
Контекст 512K токенов
Совместимость с vLLM и Transformers
Бенчмарки — SOTA среди открытых моделей:
MMLU: 90.6% (vs 78.6% у Gemma3-27B)
LiveCodeBench: 66.8%
SWE-Bench Verified: 48.4%
AIME 2024: 90.3%
ArcAGI V2 - 50.3%
SimpleQA 23.7%
Agent: SWE-Bench Verified
(OpenHands) 41.8%
Про thinking budget:
- Задается через лимит токенов на размышления (512, 1K, 2K, 4K, 8K, 16K)
- Модель периодически отчитывается о потраченных/оставшихся ресурсах
- При исчерпании бюджета выдает финальный ответ
- Budget = 0 → прямой ответ без раздумий
Требует ~77GB VRAM (FP16), но thinking budget позволяет оптимизировать затраты — простые задачи решает быстро, сложные получают необходимое время на размышления.
Есть GGUF вариант под LM Studio и Ollama в Q4 - 20 гигов
Q8 - 38.5 Gb
Apache 2.0 лицензия - можно использовать в коммерции.
HF: https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct
#SeedOSS #ByteDance #OpenSource #Китай
———
@tsingular
⚡3👍2🔥2❤1
🇨🇳 Китай захватил топ OpenSource на designarena.ai
Интересно сформировался топ-15 открытых моделей в Design Arena,- теперь он состоит только из китайских моделей.
Топ-15 открытых моделей:
- DeepSeek - лидер (5 моделей: позиции 1, 4, 5, 8, 10)
- Alibaba (6 моделей: позиции 3, 6, 9, 13, 14, 15)
- Zhipu AI (2 модели: позиции 2, 7)
- THUDM (1 модель: позиция 11)
- Moonshot AI (1 модель: позиция 12)
Первая западная модель, GPT-OSS-120B, появляется только на 16 месте
#OpenSource #designarena #China #Китай
———
@tsingular
Интересно сформировался топ-15 открытых моделей в Design Arena,- теперь он состоит только из китайских моделей.
Топ-15 открытых моделей:
- DeepSeek - лидер (5 моделей: позиции 1, 4, 5, 8, 10)
- Alibaba (6 моделей: позиции 3, 6, 9, 13, 14, 15)
- Zhipu AI (2 модели: позиции 2, 7)
- THUDM (1 модель: позиция 11)
- Moonshot AI (1 модель: позиция 12)
Первая западная модель, GPT-OSS-120B, появляется только на 16 месте
#OpenSource #designarena #China #Китай
———
@tsingular
🔥10🤯4⚡2❤1