Технозаметки Малышева
8.48K subscribers
3.79K photos
1.42K videos
40 files
3.97K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Google Antigravity: Skills для агентов

Google добавил в Антигравити поддержку расширения возможностей агентов через Skills — пакеты инструкций в формате SKILL.md с описанием задач, которые агент может решать.

Каждый навык живёт в папке с обязательным SKILL.md и опциональными скриптами. Агент видит список доступных skills, выбирает подходящие по описанию и следует инструкциям.

Два уровня размещения:
- workspace-root/.agent/skills/ — для проектных workflow
- ~/.gemini/antigravity/skills/ — глобальные навыки

Выбор навыка происходит автоматически на основе LLM-рассуждений без алгоритмической фильтрации.

Есть, правда, риск по части кибербеза: инъекции через SKILL.md тривиальны, изоляция скриптов не предусмотрена. Каждая строка Skills интерпретируется как инструкция без проверки, что делает систему "fundamentally insecure".

Insecure by design, получается.

Agentic Skills прям тема года. Во-первых срочно изучать, кто еще не начал.
Во-вторых надо их сканировать на закладки с LLM.
И минимизировать права агентов.
Загонять в песочницы.

#Antigravity #Skills #cybersecurity
------
@tsingular
5👍421👀1
OpenAI и Cerebras: 750 мегаватт на инференс

OpenAI подписал многолетний контракт с Cerebras на развертывание систем для инференса суммарной мощностью 750 мегаватт.
Поэтапный запуск начнется в 2026 году.

Cerebras обещает скорость до 15× быстрее GPU для голосовых чатов и кодовых агентов.
Для примера,- Llama 3.1 70B выдает 450 токенов/сек против 20-50 на H100.

750 МВт — это примерно 30 тысяч систем по 25 кВт каждая.
Одна CS-3 стоит $2-3 млн, полная инфраструктура потянет на десятки миллиардов.

Сверхбыстрый инференс штука полезная. Нас ждут мгновенные (100-150мс) голосовые ответы и кодовые агенты, способные подумать в 15 раз детальнее над ответом.
Т.е. можно повысить качество разработки даже без новых моделей, тупо прогнав больше гипотез или проверок за то же время.

#Cerebras #OpenAI
------
@tsingular
🔥10👍42
depthfirst: $40M на защиту от ИИ-атак

Стартап depthfirst (основан в октябре 2024) привлёк $40 млн серии А от Accel Partners.

Платформа General Security Intelligence сканирует код, отслеживает утечки учёток и проверяет зависимости.
Фишка — верификация найденных credentials (тестирует, активны ли они), а не просто поиск по паттернам.

Результаты:
- 85% меньше ложных срабатываний
- 8× больше реальных угроз
- 8/10 разрабов принимают предложенные фиксы

Команда: CEO из Databricks/Amazon, CTO — экс-Google DeepMind, сооснователь — директор по безопасности Square.

Клиенты: AngelList, Lovable, Moveworks.

#depthfirst #cybersecurity #Anthropic
———
@tsingular
🔥10👍21
Personal Intelligence: "товарищ майор" от Gemini

Всем кто боялся, что товарищ майор читает переписку в Max, - на заметку

Google запустила Personal Intelligence для Gemini - систему, которая сканирует Gmail, Photos, YouTube и Search для персонализированных ответов ( верим :) ).

По умолчанию выключена, доступна только платным подписчикам AI Pro и Ultra.

Обработка происходит в защищённых облачных контейнерах на базе Titanium Intelligence Enclaves - данные шифруются и удаляются после запроса.

Google обещает не тренировать модели на содержимом почты или фотографий, только на промптах и ответах с фильтрацией личных данных.

Облачных сервисов не существует, - есть чьи-то чужие компьютеры, которые обрабатывают ваши данные :)

#Gemini #PersonalIntelligence #cybersecurity
———
@tsingular
🔥107💯53😁3👍2
🤖 Cursor провели кодовый марафон среди AI-агентов на недели и получили миллионы строк кода среднего качества

Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.

Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)

Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.

Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Когда у общества нет цветовой дифференциации штанов, то нет цели! А когда нет цели — нет будущего!


Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл

Главный инсайт по моделям:
Codex
отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.

Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.

Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».

Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели

#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
👍10🔥422
This media is not supported in your browser
VIEW IN TELEGRAM
Opencode теперь можно привязать к GitHub

Если есть платная подписка на Github, то к ней теперь можно прикрутить любые модели и агентов через OC.

#opencode #github #dev
------
@tsingular
🔥9421
Microsoft обновил бесплатный курс по агентам

на русском языке

курс охватывает базу, шаблоны, RAG, вывод в продакшен, масштабирование и системы защиты.

#Microsoft #агенты #обучение
———
@tsingular
22🔥4👨‍💻311❤‍🔥1
Claude Cowork сливает файлы через собственное API

Мы не договорили про Cowork :)

Тут выяснилось, что еще незарелизиный Claude Cowork полностью "совместим" со старой уязвимостью из Claude.

Работает так (приведено чисто в информационных целях. не использовать ни где!):
- Жертва подключает локальную папку с конфиденциальными документами
- Загружает файл со скрытой инъекцией (например, .docx с белым текстом на белом фоне, кегль 1)
- Просит проанализировать файлы через этот «навык»
- Инъекция заставляет Claude выполнить curl к Anthropic Files API с ключом атакующего
- Файлы утекают на чужой аккount без запроса подтверждения

VM блокирует почти все домены, но api.anthropic.com в белом списке.
Проблема известна с октября 2025, но не исправлена.

Anthropic предупреждает: «следите за подозрительными действиями».
Но обычный пользователь вряд ли заметит curl в развёрнутом блоке команд.

При этом Cowork умеет работать с браузером, MCP-серверами и т.д. :)

Держите Агентов в изоляции, в общем. Отрубайте им интернет, ну или контролируйте каждый вызов.

#Claude #Cowork #PromptInjection #cybersecurity
———
@tsingular
👍1043
TranslateGemma: открытые модели перевода на 55 языков

Google выпустил TranslateGemma — семейство открытых моделей перевода на базе Gemma 3 в трёх размерах: 4B, 12B и 27B параметров.

Главная фишка — эффективность через дистилляцию знаний Gemini: модель на 12B превосходит базовую Gemma 3 27B по метрике MetricX на бенчмарке WMT24++. Вдвое меньше параметров, но качество выше.

Двухэтапное обучение: сначала файнтюн на параллельных данных (микс человеческих переводов и синтетики от Gemini), затем reinforcement learning с наградными моделями MetricX-QE и AutoMQM.

Официально протестировано на 55 языках, дообучено почти на 500 языковых пар. Сохранились мультимодальные способности — переводит текст на изображениях без специального файнтюна.

#TranslateGemma #Gemma3 #Google
———
@tsingular
8👍82
Поздравляю, вы прошли краткий курс современного вайбкодинга

#ClaudeCode #dev
------
@tsingular
🔥115😁421💯1
Обязательный лайфхак для вайбкодеров

Рельсы для защиты от rm -rf

#dev #lifehack
------
@tsingular
👍8321
OpenAI инвестирует в нейроинтерфейс Сэма Альтмана

OpenAI вложила крупнейший чек в раунд $250 млн стартапа Merge Labs Сэма Альтмана при оценке $850 млн.

Merge обещает неинвазивный интерфейс мозг-компьютер на молекулярном уровне вместо электродов и ультразвук для связи с нейронами.
Звучит футуристично и пока не понятно как именно ультразвук через череп считает состояние отдельных молекул и декодирует мысли.

Конкуренция с Neuralink Маска обостряется - там инвазивная хирургия, здесь обещают без скальпеля. Neuralink, кстати, уже стоит $9 млрд после $650 млн раунда летом 2025.

Альтман мечтает о слиянии человека и машины с 2017 года. Merge может стать полигоном для софта OpenAI - круговая схема, где успех стартапа гонит трафик в компанию, которой Альтман руководит.

Среди сооснователей - CEO Tools for Humanity, исследователь из Caltech и основатели Forest Neurotech.

Общаться на равных без BCI с ИИ скоро будет невозможно.

#MergeLabs #OpenAI #BCI
------
@tsingular
43🤯3👍1😈1
WEF: 4 сценария рынка труда к 2030 году

Всемирный экономический форум опубликовал сценарный анализ влияния AI на занятость.

Взяли два ключевых вектора — скорость развития AI и готовность рабочей силы, - они формируют 4 возможных будущих варианта.

Текущая статистика (опрос 10,000+ руководителей):
- 54% ожидают массового вытеснения рабочих мест
- 24% — создания новых профессий
- 45% — роста маржинальности бизнеса
- 12% — повышения зарплат
- 88% компаний уже используют AI (было 55% в 2022)

4 сценария от WEF:
1️⃣ Supercharged Progress (экспоненциальный AI + готовые кадры)
Люди управляют флотами AI-агентов. Новые профессии масштабируются быстро. Продуктивность взлетает. Но регуляторы и соцзащита не успевают.

2️⃣ Age of Displacement (экспоненциальный AI + неготовые кадры)
Автоматизация как затычка дефицита талантов. Безработица растёт, потребительское доверие падает ниже исторического минимума (44). Социальный раскол.

3️⃣ Co-Pilot Economy (постепенный AI + готовые кадры)
AI-пузырь сдулся в середине 2020-х. Фокус на аугментации, не автоматизации. Human-AI команды. Самый стабильный сценарий.

4️⃣ Stalled Progress (постепенный AI + неготовые кадры)
Лоскутный рост. Выигрывают только компании с AI-экспертизой. Остальные теряют конкурентоспособность. Бифуркация экономики.

Универсальные стратегии ("no-regret moves"):
- Start small, scale what works
- Синхронизация технологической и кадровой стратегии
- Инвестиции в human-AI коллаборацию
- Data governance как приоритет
- Мультипоколенческие команды (молодые учат старших работать с AI)

Прогноз WEF: к 2030 году макротренды создадут ~170 млн новых рабочих мест и вытеснят ~92 млн существующих.

Полный отчёт в комментарии

#WEF #FutureOfWork #AI #аналитика
———
@tsingular
👍6421🐳1
🎮 Warcraft для AI-агентов: UI в стиле геймдев

Мир вайбкодеров захватила новая шиза, - народ пилит интерфейсы к агентам в стиле старых добрых RTS игр.

Ralv.AI,- 3D-интерфейс для управления сотнями агентов через механики RTS.

- Пространственная карта вместо терминалов
- выбор агентов мышкой на карте → отправка на проект
- Агенты получают blueprint, контекст и MCP-инструменты

VibeCraft,- 3D-визуализация Claude Code через гексагональную сетку.

- Локальный агент, передаются только метаданные
- Зоны для группировки агентов
- Голосовой ввод через Deepgram
- Интеграция с tmux

Плюс macOS-приложение (https://vibecraft.build/) для параллельного управления Claude Code и Codex.

npx vibecraft setup && npx vibecraft


Golem: управление через ИИ любыми персонажами в Unity
https://github.com/TreasureProject/Golem

Ну и множество похожих разработок уже лавинообразно заполняют ленту :)

Нужен бассейн из Sims для агентов ;) кто знает :)

Любители Весёлой Фермы: вся моя жизнь была подготовкой к этому моменту! :)

#gamedev #ClaudeCode #агенты #Ralv #VibeCraft #Golem
———
@tsingular
😁24👍10333🤯3
Forwarded from Data Secrets
⚡️ OpenAI достигли AGI!
Please open Telegram to view this post
VIEW IN TELEGRAM
😁58🎉3
OpenWork от LangChain: еще один конкурент Cowork

LangChain выпустил OpenWork — десктопное приложение для запуска ИИ-агентов с прямым доступом к файловой системе и выполнением shell-команд.

Работает на базе deepagentsjs — фреймворка для агентов с планированием и делегацией подзадач другим агентам.

Запускается через npx openwork
Поддерживает протоколы и модели Anthropic, OpenAI, Gemini 3 Pro.

МIT лицензия

Пишут, что подключить можно любые модели, даже локальные.

Коворк уже выпустили в релиз для Про подписчиков, но кому он платный нужен, когда весь интернет уже обложился бесплатными аналогами.

И все это за 1 неделю.

#OpenWork #LangChain #DeepAgents
------
@tsungular
🔥205👍321
В копилку надстроек над opencode, которые поднимают его на уровень claudecode и antigravity

https://github.com/obra/superpowers/tree/main

https://github.com/code-yeongyu/oh-my-opencode

Если нашли еще полезные,- делитесь в комментариях.

#dev #opencode
------
@tsingular
👍1042
Microsfot OptiMind: малая модель для задач оптимизации

Microsoft Research выпустила OptiMind — модель на 20B параметров, которая переводит описания бизнес-задач в математические формулы для солверов оптимизации.

Проблема заключалась в том, как превратить задачу типа "оптимизации цепочки поставок" в код для Gurobi. Обычно это занимает у экспертов несколько дней или даже недель.

Решение: модель сначала классифицирует задачу (расписание, маршруты, сети), затем применяет подсказки экспертов для этой категории и генерит решение через код на Python с подключённо библиотекой Gurobi.

Обучали на очищенных данных OR-Instruct и OptMATH — исходные бенчмарки содержали 30-50% ошибок, которые вручную исправили.

Точность выросла на ~10% по сравнению с базовой моделью.

Модель доступна через HuggingFace и GitHub.

Для комфортной работы нужно ≥32GB видеопамяти и лицензия на Gurobi библиотеку.

#OptiMind #Gurobi #Microsoft
———
@tsingular
5🔥51