Технозаметки Малышева
8.27K subscribers
3.72K photos
1.4K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Почувствуйте разницу между Нанабананой и остальными неудачниками.

Промпт на одной из картинок: "сделай только тарелку и сам суп в духе 2Д-аниме, а остальное не трогай воще".

Пора выдавать награду за голову Нанабананы, живой или мертвой. Опенсорсной или закрытой. Любая информация про мерзавку.

@cgevent
🔥1852
This media is not supported in your browser
VIEW IN TELEGRAM
WIRobotics выпустили гуманоида ALLEX

Корейцы из WIRobotics представили универсального гуманоида ALLEX с качественными, точными в движениях, руками.

Каждая рука имеет 15 степеней свободы, поднимает 30+ кг и создает усилие 40+ Н кончиками пальцев.

Причём такие руки достаточно сложны в производстве, поэтому массовость наладят не скоро.

Механизмы и системы управления были разработаны в партнерстве с техническим университетом KOREATECH.

Pricise fingering (мелкая моторика) от корейцев :)
Будет интересно когда робот сможет кисточкой иероглиф нарисовать. Ну т.е. не как принтер, а именно художественная роспись на рандомной поверхности.

#ALLEX #WIRobotics #robots
------
@tsingular
🔥26174🆒3🤣1👾1
Forwarded from Борис опять
Pro tip: поставь в зуме имя "AI notetaker" и можешь молча присутствовать на любых встречах
🤣20102
Я понимаю, что на 3 поста вверх тяжело смотреть,- шея затекает, но там бессмертие подвезли. :)

@tsingular
😁23💯5
Жадная телега (не админ. Админ,- практикующий альтруист), снова требует бустов для поддержания жироты широты эмоционального разнообразия и автопереводов.

Поддержите кому не влом 😀 :
https://xn--r1a.website/boost/tsingular

@tsingular
512
Forwarded from PWN AI (Artyom Semenov)
От идей к инструментам: что я показал на OFFZONE 2025.

Если вы читали мой анонс, то, наверное, запомнили эту строчку:
«И я покажу - не теорию, не концепт, а вещь, которую можно взять в руки, подключить, настроить. Инструмент для наступательной безопасности. Для тестирования агентов, которые уже не просто отвечают - они решают.»
Собственно, вокруг этого и строился весь мой доклад. Мне хотелось показать не очередную гипотезу или красивую схему на слайде, а живую концепцию того, каким может быть инструмент для тестирования агентов в динамике.
Да, первыми подобный подход реализовали в AgentDojo, но я убеждён: можно сделать проще, компактнее, доступнее. Хочу, чтобы в арсенале ИБ появился конструктор - окружение, которое можно без боли развернуть и сразу использовать как рабочий инструмент.

Сейчас в agentsploit поддерживаются только langchain-агенты - далеко не идеальный вариант. Думаю о том, чтобы добавить поддержку Langflow, а может быть, и других фреймворков. Ну и, конечно, особое внимание стоит уделить компонентам-оценщикам: без них картинка получается неполной. Тут я вижу огромный простор для развития.
Что касается самой подачи, я выбрал форму рассказа, вдохновившись произведением Филипа К. Дика «Обман Инкорпорейтед». И, знаете, не пожалел ни на секунду. В мире, где идёт ожесточённая борьба за внимание, рассказ, переплетённый с отсылками к художественному миру, оказался куда живее сухих тезисов.

Спасибо всем, кто пришёл на выступление - вас было действительно много, и это заряжает. Отдельная благодарность организаторам AI.ZONE за то, что вплели мою идею в сетку докладов.

А дальше - больше. В ближайшее время я подготовлю отдельный лонгрид: разберём инструмент детально и пройдёмся по его особенностям.

PDF версия презентации - ниже.
🔥82
Eleven v3 (alpha) стала доступна через API

ElevenLabs открыла доступ к новой версии своей голосовой модели через API.

Основные улучшения - более эмоциональная выразительность и реалистичный синтез речи.

В модель встроена система водяных знаков VoiceShield - теперь можно отслеживать сгенерированный ИИ контент.

ИИ голос будет ещё сложнее отличить от настоящего человека.

#ElevenLabs #TTS #API
------
@tsingular
👍31
Если бы не один ботаник и четыре певицы - не было бы ни мемов, ни Госуслуг, ни ChatGPT.

Иногда большие истории начинаются странно. Кто бы мог подумать, что нажатие одной клавиши и шуточная песня про коллайдер станут первой искрой цепочки, которая приведёт нас к ChatGPT.

23 августа 1991 года в CERN один скромный физик нажал «Enter» - и мир перестал быть прежним. Его звали Тим Бернерс-Ли. Он придумал то, что мы сегодня называем «ссылкой», и выложил в сеть первую в истории веб-страницу. По сути изобрел Интернет.

«Я всего лишь хотел упорядочить хаос», - говорил он. Но на самом деле он построил мост, по которому человечество вышло в новую эпоху.

Вот, кстати, тот самый первый сайт, который до сих пор работает: http://info.cern.ch/

А теперь - девушки. Четыре сотрудницы CERN, которые ради прикола собрали музыкальную группу «Les Horribles Cernettes» («Ужасные ЦЕРНнетки») и прославились шуточными песнями о любви к физикам, влюблённым в свои коллайдеры. Именно их фото стало первой картинкой, отправленной по интернету. Мир увидел не логотип, не схему, не документ - а улыбки.

Я подарила тебе золотое кольцо, чтобы показать свою любовь.
А ты вставил его в печатную плату,
Чтобы устранить утечку напряжения в коллекторе.
Ты подключаешь мои чувства к своему детектору.
Ты никогда не проводишь со мной вечера.
Ты не встречаешься с другими девушками.
Ты любишь только свой коллайдер,
Свой коллайдер

- вот цитата из их песни - ну чем не гимн цифровой эпохи?

С тех пор интернет вырос в глобальную экономику, перевернул рынок и сделал нефть второстепенной. Сегодня самая дорогая валюта - не литры топлива, а гигабайты данных и минуты нашего внимания.

Но самое важное: интернет оказался не финалом, а прологом. На его рельсах сейчас мчится искусственный интеллект. Все мемы, статьи, фото и видео стали топливом для AI-моделей. Если через 100 лет нас будут помнить - то, скорее всего, как поколение, которое преобразовало интернет в искусственный интеллект.

Сегодня интернету всего 34. Для технологий это подростковый возраст - бунтарский, дерзкий, полный экспериментов. И он только учится жить вместе с человечеством.

🎉 С днём рождения, интернет! 🌐🚀

Егошин | Кеды профессора
🎉1363🍾211🤩1👀1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 DeepConf — новый подход к мышлению ИИ

Учёные придумали новые метод Deep Think with Confidence (DeepConf).

Он позволяет модели сразу отбрасывать «слабые» варианты ответа и оставлять только те, в которых она уверена.

Классический метод *parallel thinking* (self-consistency) работает так: модель генерирует множество рассуждений и выбирает лучший ответ по большинству. Точность повышается, но ресурсы тратятся огромные — тысячи токенов уходят на слабые варианты.

🔹 DeepConf решает эту проблему: модель сама оценивает уровень уверенности в рассуждениях и отбрасывает «слабые» ветви — либо сразу, либо после генерации.

Как это устроено:
1️⃣ Оценка уверенности на уровне токенов — смотрится вероятность выбранного токена (log-prob) или энтропия.
2️⃣ Group Confidence — оценки объединяются в блоки, чтобы понять силу целой ветки рассуждения.
3️⃣ Online-режим — слабые ветки отсекаются прямо в процессе.
4️⃣ Offline-режим — сначала генерируются все ответы, потом остаются только те, где уверенность высокая.

📈 Результаты:
- На AIME-2025 точность выросла до 99,9%
- Количество лишних токенов сократилось почти на 85%
- Работает без дообучения и сложных настроек

📚 Paper: https://arxiv.org/pdf/2508.15260
🌐 Project: https://jiaweizzhao.github.io/deepconf
🔥952👍2
Media is too big
VIEW IN TELEGRAM
Zhiyuan Mall — мегамолл роботов запущен в Китае

Zhiyuan Robot в сотрудничестве с LG, JD.com и Tencent запустили супермаркет гуманоидных роботов.

В наличии несколько категорий, - от промышленных до бытовых и даже молодёжных :).

В продаже и гуманоиды и собаки и запчасти к ним.
Есть так же VR комплекты дистанционного управления и аккумуляторные наборы.

В целом приоритет - opensourse подход и глобальная экспансия.

Роботы теперь продаются как посудомойки.
Ждем акции типа "купи телевизор, получи гуманоида в подарок".
М-Видео когда уже?
Или кто у нас еще ИИ роботов возит? 😉

#Zhiyuan #robots #Китай
------
@tsingular
9🔥6👾421
Материалы про Schema-Guided Reasoning (SGR) для LLM от Рината Абдуллина @llm_under_hood

- SGR Intro - заглавная страница с определением и основными ссылками
- SGR Patterns - примеры простых паттернов, из которых можно "собирать" более сложные reasoning схемы: Cascade, Routing, Cycle.
- SGR Examples - четыре примера: simple math task, text-to-sql, document classification, advanced reasoning in compliance.
- SGR Demo - пример бизнес-ассистента с использованием инструментов на базе SGR

Интересная подборка. Изучаем.

#SGR #обучение #structuredoutput #promptengineering
------
@tsingular
411😁1
Forwarded from ИТ в Медицине
Учёные из Массачусетса представили разработки, которые могут перевернуть наше представление о профилактике и мониторинге здоровья в будущем.

🔹 В MIT создали ультразвуковой бюстгальтер-сканер. Он позволяет женщинам проходить регулярные обследования груди прямо дома, между визитами к врачу. Идея родилась после личной трагедии исследовательницы Канан Даґдевирен: её тётя умерла от рака, который не был выявлен вовремя. Теперь диагностика может стать регулярной и максимально удобной — без похода в клинику.

🔹 Другой проект — графеновые «татуировки», которые считывают биохимические процессы организма и способны заранее предупреждать о приближении сердечного приступа. Они настолько тонкие и незаметные, что человек может забыть о них, пока в нужный момент устройство не подаст сигнал.

🔹 Ещё одна разработка от профессора Йоэля Финка — «умная нить», которая может хранить данные, выполнять алгоритмы ИИ, улавливать движение и звук, а также передавать всё это через Bluetooth. Обычная футболка может превратиться в медицинский датчик, который фиксирует изменения в вашем организме.

Пока все это напоминает снаряжение героев сериала Star Trek, но возможно когда-то действительно так и будет.

@it_medicine
🔥9211👍1
Forwarded from Сиолошная
MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

Свежий бенчмарк от Salesforce, на этот раз тестируют навыки работы LLM с популярными MCP-серверами. MCP — это предложенный Anthropic в конце 2024-го года протокол взаимодействия LLM со внешними системами и источниками данных. По сути те же инструменты, только собранные в наборы для отдельных сервисов: поиск, Гугл Карты, итд. При этом, так как технология MCP — «молодая», модели ещё не настолько хорошо с ними работают и не обучались на них по сто тыщ раз.

Авторы собрали 11 MCP серверов (на 133 инструмента) из 6 доменов, и придумали 231 задачу, которая решается с использованием одного или нескольких MCP:

— Для домена навигации по картам выбрали 4 типа подзадач, включая планирование маршрута, оптимальные остановки, поиск местоположения и поиск по ID конкретного заведения

— Для домена управления репозиторием с кодом тоже 4 типа подзадач, включая настройку проекта, отслеживание проблем, настройку автоматизации и интеграцию кода

— Для домена финансового анализа 5 подзадач: анализ портфеля, финансовая отчетность, торговые стратегии, институциональные активы и анализ дивидендов

— Для домена 3D-проектирования (используют Blender) 5 подзадач, включая создание объектов, настройку материалов, конфигурацию освещения, настройки рендеринга и иерархию сцен

— Для домена автоматизации браузера 5 подзадач: бронирование билетов, спортивная аналитика, академические исследования, исследование платформы и навигация по карте

— Для домена веб-поиска тоже 5: идентификацию человека, обнаружение сущностей, сопоставление метрик, сложные рассуждения и поиск фактов.

Существенная часть задач требует больше 5 обращений к MCP-серверу, что подразумевает хорошую работу LLM с длинным контекстом. Результат работы оценивается по трём критериям: оценка формата, простая сверка ответа и динамическая. Последняя — это для запросов в духе «какая сегодня погода», так как ответ меняется из раза в раз.

Авторы отсеивали задачи, которые LLM могут сделать без MCP серверов или если модель решает задачу 5 раз из 5 — они были слишком лёгкими.
5👍21🔥1
🚀 Macrohard: Маск запускает AI-компанию против Microsoft

Илон Маск анонсировал проект полностью автоматизированной софтверной компании на базе AI — прямого конкурента Microsoft.

Суть инициативы: создать первую компанию, где сотни AI-агентов на базе Grok самостоятельно разрабатывают, тестируют и выпускают ПО без участия людей.

Технический фундамент:
- Суперкомпьютер Colossus: 200K+ GPU Nvidia с планами усиления до 1M к концу года (строят ускоренными темпами, - буквально датацентр в палатках)
- Производительность: 98,9 экзафлопс (одна из топ-5 AI-систем мира на сегодня)
- Модель Grok-4 с мультиагентной архитектурой
- Развертывание за 122 дня вместо стандартных 18-24 месяцев
- Потребление энергии: 250 МВт с планами до 1,65 ГВт

Финансирование:

$12 млрд привлечено, оценка $80 млрд
Но сжигает $1 млрд ежемесячно
Обещает 70% снижение затрат на разработку

Следующие 18 месяцев покажут насколько реально с маскока вытеснить Майкрософт с рынка, на котором она окапывалась почти 5 десятилетий (в следующем году 4 апреля 50 лет будет).
Но даже если не получится, - опыт автономной разработки роем ИИ агентов Маск наработает бесценный, конечно.

#Macrohard #xAI #ElonMusk #Microsoft
———
@tsingular
🔥20😁7👀1
🚀 Seed-OSS-36B-Instruct от ByteDance — новая открытая модель с контролем глубины мышления

36B параметров с GQA attention
Контекст 512K токенов
Совместимость с vLLM и Transformers

Бенчмарки — SOTA среди открытых моделей:

MMLU: 90.6% (vs 78.6% у Gemma3-27B)
LiveCodeBench: 66.8%
SWE-Bench Verified: 48.4%
AIME 2024: 90.3%
ArcAGI V2 - 50.3%
SimpleQA 23.7%
Agent: SWE-Bench Verified
(OpenHands) 41.8%

Про thinking budget:

- Задается через лимит токенов на размышления (512, 1K, 2K, 4K, 8K, 16K)
- Модель периодически отчитывается о потраченных/оставшихся ресурсах
- При исчерпании бюджета выдает финальный ответ
- Budget = 0 → прямой ответ без раздумий

Требует ~77GB VRAM (FP16), но thinking budget позволяет оптимизировать затраты — простые задачи решает быстро, сложные получают необходимое время на размышления.

Есть GGUF вариант под  LM Studio и Ollama в Q4 - 20 гигов
Q8 - 38.5 Gb

Apache 2.0 лицензия - можно использовать в коммерции.

HF: https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

#SeedOSS #ByteDance #OpenSource #Китай
———
@tsingular
3👍2🔥21
🇨🇳 Китай захватил топ OpenSource на designarena.ai

Интересно сформировался топ-15 открытых моделей в Design Arena,- теперь он состоит только из китайских моделей.

Топ-15 открытых моделей:
- DeepSeek - лидер (5 моделей: позиции 1, 4, 5, 8, 10)
- Alibaba (6 моделей: позиции 3, 6, 9, 13, 14, 15)
- Zhipu AI (2 модели: позиции 2, 7)
- THUDM (1 модель: позиция 11)
- Moonshot AI (1 модель: позиция 12)

Первая западная модель, GPT-OSS-120B, появляется только на 16 месте

#OpenSource #designarena #China #Китай
———
@tsingular
🔥10🤯421