Технозаметки Малышева
8.28K subscribers
3.72K photos
1.4K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Вот некоторые спрашивают, - чего тебе дался этот n8n?

Ну например вот.
Персональный ИИ-ассистент с голосовым управлением контактами, таблицами, календарем и почтой :)

Быстро, просто, надёжно.

#n8n
———
@tsingular
🔥2243👍1
🚀 Docling 2.0: Новый cтандарт предобработки документов для RAG

32,830 звёзд на GitHub за год — Docling от IBM Research завоевывает все большую популярность и становится основным инструментом для подготовки документов к AI обработке.

Что изменилось в версии 2.0:
30x ускорение по сравнению с традиционным OCR:

- 3.1 сек/страница на CPU x86
- 0.49 сек/страница на Nvidia L4 GPU
- 0.35 сек/страница с новой SmolDocling (256M параметров, <500MB VRAM)

Ключевой подход: компьютерное зрение вместо OCR там, где возможно — PDF обрабатываются напрямую через специализированные AI-модели.

Технические преимущества
TableFormer достигает 93.6% точности против 67.9% у Tabula и 73.0% у Camelot — обрабатывает сложные таблицы с частичными границами и иерархическими заголовками.

SmolDocling + формат DocTags — сквозное преобразование документов в один проход.

Новый markup-формат под VLMки.

ASR-поддержка для WAV/MP3 — теперь можно обрабатывать записи встреч и лекций.

Корпоративные внедрения
- Red Hat Enterprise Linux AI использует Docling как ядро InstructLab для кастомизации моделей.
- IBM: уже обработали 2.1M PDF из Common Crawl, планы до 1.8B PDF для обучения Granite.
- Linux Foundation AI & Data — официальное управление с мая 2025, статус enterprise-ready.

Интеграции "из коробки"
- LangChain: DoclingLoader с режимами DOC_CHUNKS и MARKDOWN
- LlamaIndex: DoclingReader + DoclingNodeParser
- Haystack/CrewAI: прямая поддержка агентных workflow
- Унифицированный формат: экспорт в Markdown, HTML, DocTags, JSON

Практическое применение
Когда использовать:
сложные документы, где структурная точность критична (финансовые отчёты, юридические контракты, научные статьи).
Когда НЕ использовать: простое извлечение текста — PyMuPDF будет в 50x быстрее.

MIT-лицензия - свободно используем для коммерции.

В планах разработки:
- Извлечение метаданных (авторы, ссылки, язык)
- Понимание диаграмм (уже частично в SmolDocling)
- Химические структуры (молекулы в патентах/исследованиях)

Полезная штука. Добавляем в пул микросервисов.

GitHub

#Docling #Documents #RAG #IBM
———
@tsingular
👍1032
Для всех вайбкодеров делюсь скриптом, который автоматически установит и поднимет у вас локальный докер с docling, через который вы можете вызывать обработку документов, получать номер очереди потом периодически проверять в нем результат.

Скрипт - просто скачать и запустить в ubuntu. (докер должен быть уже установлен)

а дальше проверить можно так:

curl -s -X POST http://localhost:8080/jobs \
-H "Content-Type: application/json" \
-d '{"source": "https://arxiv.org/pdf/2206.01062"}'


он выдаст номер очереди

дальше по этому номеру очереди забираем результат когда он будет готов:

curl -s http://localhost:8080/jobs/НОМЕР-ОЧЕРЕДИ/result


Спасибо принимаются сюда :)

#docling #docker #dev
------
@tsingular
3🔥124👍31😁1
🤖 Питер Тиль об Антихристе: когда страх прогресса становится инструментом власти

В недавнем интервью The New York Times сооснователь PayPal и Palantir высказал неожиданную теорию: современный Антихрист придет к власти не через демонические речи, а через страх перед технологиями.

Ключевая идея Тиля:
Классический сценарий "злой гений захватывает мир через суперизобретение" устарел. Сегодня люди слишком напуганы прогрессом. Набирает силу тезис: "Остановим науку! Нужно больше регулирования!"

Механизмы реализации:
- Постоянные разговоры об экзистенциальных рисках ИИ/ядерного оружия/климата
- Призывы к "глобальному управлению" для предотвращения катастроф
- Создание всемирных регуляторов (как FDA фактически контролирует фарму)

Результат: единое мировое правительство под лозунгом "мир и безопасность"

Парадокс:
По логике Тиля, мы уже 50 лет живем в режиме "умеренного Антихриста" — глобальная стагнация под видом заботы о безопасности.
Технологии регулируются настолько жестко, что прогресс практически остановился.

Неочевидные сценарии развития:

- "Грета-протокол": Экологический активизм становится основой для мирового правительства. Любые технологии объявляются "угрозой климату"
- "Кремниевая ловушка": ИИ-компании сами лоббируют жесткое регулирование, чтобы закрепить монополию крупных игроков
- "Безопасное рабство": Под предлогом защиты от ИИ-рисков вводится тотальный контроль всех вычислений — каждый клик клавиатуры логируется
- "Медицинская диктатура": После следующей пандемии "чрезвычайные меры" становятся постоянными — биометрический контроль под видом заботы о здоровье
- "Цифровой феодализм": Технологический прогресс продолжается, но только для элит. Остальные получают "безопасные" урезанные версии

NYT, конечно, та ещё желтуха, но вопрос-то интересный, - что опаснее для человечества: неконтролируемый технологический прогресс (а сингулярность ведь не отконтролируешь по факту) или его тотальное регулирование "ради безопасности" и, следовательно, замедление?

А про Антихриста прям интересно. Антихрист это AGI или ASI? В какой момент начинать бояться? :)

#Тиль #футурология #регулирование
———
@tsingular
🤯4🐳4👻31😈1
Forwarded from Machinelearning
🚀 Baidu открыла исходный код серии моделей ERNIE 4.5 !

🧠 Эти модели достигли SOTA-результатов на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.

🔧 Обучены на PaddlePaddle с эффективностью до 47% MFU при претрейне крупнейшей модели.

📦 В составе релиза:
- 10 моделей ERNIE 4.5,
- MoE‑архитектуры с 3B и 47B активных параметров,
- самая крупная модель содержит 424B параметров (MoE),
- также доступна компактная dense‑версия на 0.3B.

Всего Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥

🟢Попробовать: http://ernie.baidu.com
🟢Hugging Face: https://huggingface.co/baidu
🟢GitHub: https://github.com/PaddlePaddle/ERNIE
🟢AI Studio: https://aistudio.baidu.com/overview

@ai_machinelearning_big_data

#ERNIE #opensource #Baidu
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Интересный прецендент с DeepSeek в Германии

Китайские эксперты раскритиковали решение Германии о блокировке DeepSeek как проявление предвзятости к китайским технологиям.

Претензия, - передает песональные данные пользователей в Китай.

Т.е. хочешь работать с китайскими компаниями — придется снимать ограничения с их ИИ-решений.

Ну или это приведёт к распространению китайских датацентров с ИИ в этих странах, - надо же персональные данные локально обрабатывать.

Но тогда потом пусть не жалуются, что под боком появились доступные нейронки.

#DeepSeek #Китай #Германия
———
@tsingular
👍94🔥1
Бессмертие почти: китайские ученые нашли генетический переключатель регенерации органов у млекопитающих

Прорыв в регенеративной медицине от китайских исследователей из NIBS и BGI Research. Публикация в Science показала, как восстановить способность к заживлению у млекопитающих.

Ключ — ген Aldh1a2, отвечающий за метаболизм витамина А. У рыб и саламандр он активен, у млекопитающих — заблокирован эволюцией.

Ученые "включили" этот ген у мышей и крыс, что привело к полной регенерации мягких и суставных тканей.
Механизм работает через производство ретиноевой кислоты.

Открытие может упростить лечение травм костей, конечностей, кожи, нервов и легких у людей.

#regeneration #Aldh1a2 #biotechnology #Китай
———
@tsingular
👍193🔥94🤔1386🙏3
✔️Sakana AI запускает новый алгоритм AB-MCTS

Sakana AI представила AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — алгоритм, который объединяет несколько передовых ИИ-моделей (o4-mini, Gemini 2.5 Pro, DeepSeek-R1-0528) в единую систему коллективного поиска решений.

Преимущества AB-MCTS:
— Коллективный интеллект: каждая модель вносит свои сильные стороны и компенсирует слабые.
— Адаптивный поиск: строится дерево возможных стратегий, и выбор ответвлений происходит на основе успешности прошлых итераций.
— Существенный прирост качества: на бенчмарке ARC-AGI-2 комбинация моделей значительно превосходит каждую из них по отдельности.

Полезные ссылки:
Блог об AB-MCTS: https://sakana.ai/ab-mcts
Статья на arXiv: https://arxiv.org/abs/2503.04412
Исходник TreeQuest: https://github.com/SakanaAI/treequest
Эксперименты ARC-AGI: https://github.com/SakanaAI/ab-mcts-arc2

@vistehno
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
62❤‍🔥11👌1
И так бывает :)

#юмор
------
@tsingular
😁172❤‍🔥2
finita la comedia

#юмор
———
@tsingular
😁24👏2🗿2
Cursor запустил ИИ-агентов в веб и мобильных версиях

Теперь Cursor Agent работает не только в IDE, но и в браузере и на мобильных устройствах. Агенты умеют писать код, отвечать на сложные вопросы и создавать архитектуру проектов.

Доступны прямо сейчас на cursor.com/agents. Можно получать уведомления в Slack о завершении задач и запускать агентов командой "@Cursor".

Главная фишка — синхронизация между устройствами. Начал работу на телефоне, продолжил на ноутбуке. Cursor превращает работу с ИИ-агентами в такой же естественный процесс, как командная работа.

#Cursor #агенты
------
@tsingular
🔥8👍311
Forwarded from PWN AI (Artyom Semenov)
Ну что же, а сейчас разберём пример интересного исследования, которое подкинул мне агент, о котором я описывал выше.

Безопасность протоколов коммуникации между агентами, кажется, что только в MCP проблемы, но тут господа из Китая провели детальное исследование всех существующих (на момент написания исследования) протоколов взаимодействия между агентами и пришли к интересным выводам.

Во-первых они проанализировали 150 статьей по протоколам коммуникаций между агентами, а также по их безопасности. Выделили 3 уровня протоколов:

1.User-Agent – человек-агент
2.Agent-Agent- коммуникация между агентами
3.Agent-Environment – взаимодействие агентов с внешними системами.


Самое интересное конечно же, что они построили свою модель угроз для всех 3 уровней. Так на первом уровне расположились довольно известные нам угрозы - промпт инъекции, социотехнические атаки, извлечение данных и манипуляция контекстом.

Дальше, когда происходит коммуникация между агентами – тут выделяют угрозы, когда агенты с изначально опасной целью – нарушают консенсус, то есть цель всей агентной системы. А также внедрение ложных данных и эксплуатация доверия – буквально агент может внушить другому что-то плохое.

А уже потом – Agent-Environment, тут и атаки на цепочку поставок и влияние на API, а также внешние ресурсы. Интересно что манипуляция с API – также может повлиять на поведение агентов.

Есть и отдельный блок – Protocol Analysis. Примечательно что MCP выделяют как наиболее проработанным с точки зрения безопасности, и в правду много исследований – а сейчас ещё вышло интересное обновление – в MCP добавили защиту. Но не об этом речь.

A2A – пока что в стадии проработки с точки зрения безопасности.

Ну и что интересно, предлагают в статье и механизмы защиты – например адаптацию Zero Trust, мониторинг поведения, контролировать промпт-инъекции путём наложения файрволла, балансировщика нагрузки а также дообучения на состязательных примерах. Подробно

В скриншотах к посту - важные таблицы из статьи.

статья
8👍5
🏆 XBOW: ИИ-пентестер возглавил рейтинг HackerOne, обогнав людей

Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.

Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.

Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.

Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.

Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.

Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.

Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.

Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.

Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".

Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.

Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?

#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular
11🔥63👍2🤔1
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Лазерное ПВО от комаров заказывали? Стартаперы сделали и продают на аналоге кикстартера за €500 штуку

Я пока скептически настроен, но направление гаджетов клевое – еще хочется чтобы эта фигня пчел отличала от комаров, потому что я за пчел

Ссылка
🔥24🤔65🍾2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Тут, мне кажется, можно выпить за Affter Effects, титры, и вот эти вот все текстовые эффекты.

Veo3 просто удивительно неплохо справляется со шрифтами, эффектами и вообще "понимает", о чем идет речь.

Вспомните, ведь еще где-то полгода-год назад текст на картинках был набором иероглифов.

А сейчас мы смотрим на то, как видеогенераторы бахают титры и логосы.

What a time to be alive!

Автор

@cgevent
149🔥5👏2