Технозаметки Малышева
8.27K subscribers
3.67K photos
1.38K videos
40 files
3.87K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Короче, делюсь.
Решил же попробовать DeepSeek OCR

А он только под NVidia.
А под рукой только Apple и MLX.

Пришлось зарядить Codex.
Он что-то долго шуршал, искал, переписывал.
Несколько дней фоном на это ушло.
Принципиально не менял модели.
Только codex-medium.

Но в итоге он справился.

И теперь у меня есть своя версия DeepSeekOCR под мак.

На скрине пример таблицы, которую он смог вытащить из картинки.

Если кому нужен патч - пишите, поделюсь.

А если еще кто нибудь объяснит как можно законтрибьютить в основную ветку- вообще огонь.

#DeepSeekOCR #DeepSeek #OCR #dev
------
@tsingular
🔥288
MCP Shark: Wireshark для MCP

Наткнулся на интересный инструмент MCP Shark - создан для мониторинга коммуникаций между IDE и серверами по Model Context Protocol.

Работает как прокси, - перехватывает весь трафик и отображает его в веб-интерфейсе.

Возможности:
- Захват всех запросов и ответов в реальном времени
- Фильтрация и группировка по сессиям и серверам
- Логирование в SQLite
- Автоопределение конфигов IDE с резервным копированием

Если пилите свои MCP, - может пригодится.
Опять же интересный сценарий завернуть логи с шарка обратно в агента-разработчика для отладки тех же MCP.

#MCP #Wireshark #dev
———
@tsingular
4🆒311👍1
Загнал Манус в телегу :)
удобно, в принципе.

из полезного - сделал инструментик - delayTimer - ИИшка сама ставит процесс на паузу пока Манус шуршит

#Manus #dev
———
@tsingular
🔥9👍64🤔21
Media is too big
VIEW IN TELEGRAM
Запрос:

Напиши Windows на html но с современными спецэффектами на p5 js
браузер должен что то показывать
в терминале чтобы можно было писать
пару папок в компе и в Doom2 чтобы можно было поиграть


Новая операционка в комментариях

#Gemini #Windows #dev #test
———
@tsingular
🔥10😁8221🦄1
LLM Council: Карпатый запустил совет директоров из нейросетей

Андрей тоже на выходных вайбкодит и опубликовал приложение, которое отправляет запрос сразу нескольким моделям через OpenRouter, заставляет их оценить ответы друг друга, а затем модель-председатель синтезирует финальный результат.

Идея появилась когда Карпатый читал книги вместе с LLM и хотел видеть разные ответы параллельно.

Внутри три этапа:
- Все модели из совета отвечают на вопрос
- Взаимная оценка и ранжирование ответов
- Председатель выдает итоговый вердикт

Навайбкодили демократию за выходные :)

Вообще совет ИИ экспертов популярная фишка будет, я смотрю.
Нарекаю трендом :)

#Karpathy #OpenRouter #Council #dev
———
@tsingular
1🔥25👍533
Адам Вольф, один из разработчиков CludeCode в Anthropic, пишет

Через 6 месяцев софтварным инженерам нечем будет заняться.

Уже сегодня он просто ставит задачу ClaudeCode, уходит минут на 20-30 и когда возвращается, - в большинстве случаев задача решена.

С новыми моделями мы перестанем ожидать что ИИ разраб может ошибиться, ровно так, как мы не ждём ошибки от работы компилятора.

#claudecode #dev #Claude #Anthropic
———
@tsingular
🤯886👍6🤣3😁2🗿2👏1
Media is too big
VIEW IN TELEGRAM
Ладно, не такая уж и плохая модель Opus 4.5

за 1 час в Курсоре можно с нуля написать свой n8n

В копилку подтверждений роста доли гражданского программирования.
Написать свое будет все проще и все быстрее.


Может платный мастер-класс кому?

Записывайтесь в комментах

#dev #Opus
———
@tsingular
2🔥1992
устанавливаем n8n на Raspberry Pi

Домашняя автоматизация на изи.
Наткнулся на инструкцию как поднять n8n на малине.

Авось кому пригодится.

#n8n #RaspberryPi #dev
———
@tsingular
1🔥6👀53
DeepSite - генератор сайтов от HuggingFace с хостингом

У HuggingFace вышел конкурент Lovable -платформа для вайбкодинга веб сайтов с возможностью автоматического разворачивания, бесплатного хостинга, бесшовной интеграцией с моделями на HuggingFace и подключением их железа для генерации различного контента с ИИ.

Для генерации сайтов можно использовать различные модели на выбор:
DeepSeek V3, Qwen3, Kimi K2, GLM 4.6, Minimax M2.

Идеально для стартапов, прототипов и пет-проектов

#huggingface #deepsite #dev
———
@tsingular
🔥951
Transformers v5: PyTorch, новый API и конец TensorFlow

Hugging Face выпустил пятую версию библиотеки Transformers — крупнейший рефакторинг за всю историю проекта.

Главное изменение: полный отказ от TensorFlow и JAX. Теперь только PyTorch.

Упростили поддержку кода при сохранении совместимости с экосистемой (vLLM, SGLang, llama.cpp).

Новый WeightConverter API упрощает загрузку моделей с квантизацией и параллелизмом. Теперь можно комбинировать MoE + квантизацию или Tensor Parallelism + MoE.

Упростили токенизацию: убрали дублирование «быстрых» и «медленных» токенизаторов.

#Transformers #PyTorch #dev
------
@tsingular
81👨‍💻1🆒1
Media is too big
VIEW IN TELEGRAM
Gemini3 demo: управление жестами через камеру

Пополняем серию примеров, - что теперь можно сделать за 5 минут с ИИ из области, которая раньше вам была недоступна и занимала бы недели.

Сегодня демка управления разными фигурами в виде облака динамических частиц, которые морфятся друг в друга и управляемы жестами руки на камеру.

AiStudio->Build->Промпт:
Create a React 19, TypeScript, Three.js (@react-three/fiber), and Tailwind CSS application called "Gemini Kinetic Particles".

Core Functionality:
Hand Tracking: Use @mediapipe/tasks-vision to detect hands. Map pinch gestures to particle chaos/attraction, hand distance to zoom, and hand position to 3D rotation. Implement input smoothing (lerp) and robust camera error handling (including stream cleanup and resolution constraints).

Particle System: Render 5000 particles using THREE.Points with a custom radial gradient texture.

Shape Modes:
Math-based: Sphere, Cube, Saturn, Spiral.
Physics-based: "Fireworks" mode with gravity, drag, velocity, and continuous multi-colored explosions using vertex colors.
Procedural Sculptures: "Bear" (composed of spheres for limbs/head) and "Statue" (MSU Tower composed of boxes). These must be generated purely mathematically.

Transitions: Implement smooth interpolation (lerp) when switching between shapes.

Controls: A modern dark UI overlay with connection status, shape selector (clickable + A/D keyboard shortcuts), and color picker.

UX: Ensure the scene is completely static/stable when idle (no infinite zoom or drift).

Rely solely on hardcoded procedural generation functions for all shapes.


#Gemini #dev #particles #camera #gestures #промпты
———
@tsingular
🔥10🤯42🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Еще пример, что можно сделать минут за 15 с Gemini3.

#Gemini #vibecoding #dev
------
@tsingular
🔥283👨‍💻2🗿2🤯1
Внимание, общий сбор.
Нужно протестировать бота @skilldaybot :)

Далее цитирую:

Привет!
Хочу поделиться с вами одной маленькой, но очень важной для меня историей.
Мой сын последние месяцы тихонько работал над своим проектом и теперь он запустил собственного Telegram-бота Skill Day (@skilldaybot). Да, целый бот, который помогает людям учиться! Я до сих пор в лёгком восторге и гордости 😊

Смысл простой и классный: вы пишете боту любую тему, которая вам интересна — от психологии до программирования ,  а он за несколько секунд создаёт под вас мини-курс. Короткие уроки на каждый день, тест и даже «диплом» в конце.
И всё это он собрал своими руками.

Монетизацию сын пока не подключал — хочет сначала понять, действительно ли людям это полезно, удобно, интересно. Поэтому сейчас для меня особенно важно поддержать его тестирование.

Если вам откликается тема саморазвития, коротких форматов обучения или просто любопытно посмотреть, что делают современные дети 😅 — попробуйте.

Тем более микролернинг сейчас топ тема:)


Вот ссылка: https://xn--r1a.website/skilldaybot

Оригинальный пост, где можно/нужно оставлять комментарии

#боты #dev
------
@tsingular
🔥183👍1🆒1
Vibe Kanban, - управление агентами разработчиками через канбан

Вайб-программирование эволюционирует в вайб-менеджмент.

Появилось приложение в виде Kanban доски, в котором каждая задача выполняется AI-агентом в изолированном git worktree.

Агенты не мешают друг другу и не трогают main-ветку.

Ключевые фичи:
- Мультиагентность — Claude Code, Gemini CLI, OpenAI Codex, Amp, Cursor Agent в одном месте
- Параллельное выполнение - несколько агентов работают одновременно
- Визуальный code review с построчными diff'ами и комментариями
- MCP-серверы из коробки — централизованная конфигурация
SSH-доступ для remote-разработки (VSCode Remote-SSH)

Практическое применение:
- Соло-разработчикам: параллельно гонять несколько задач на разных агентах
- Командам: стандартизировать разработку с AI-ассистентами
- Экспериментаторам: A/B тестирование агентов на одинаковых задачах

Ещё есть собственный MCP-сервер, чтобы внешние AI-агенты могли сами управлять доской и мультиагентными разрабами.

#Kanban #Канбан #агенты #dev
———
@tsingular
🔥6👌31👍1
n8n 2.0: архитектурный редизайн платформы автоматизации

n8n выкатила вторую мажорную версию с кардинальными изменениями архитектуры.

Главное нововведение — Task Runners по умолчанию изолируют выполнение кода от основного процесса.
Питон теперь нативный вместо Pyodide, что даёт прирост производительности и безопасности.

Базовые изменения:
- SQLite переведён на WAL-режим с пулингом — до 10× быстрее в бенчмарках
- Code Node больше не видит переменные окружения по дефолту
- Доступ к файловой системе ограничен директорией ~/.n8n-files
- ExecuteCommand и LocalFileTrigger выключены из коробки

Отдельный докер-образ для таск-раннеров!!!

Remove task runner from n8nio/n8n docker image#

Starting with v2.0, the main n8nio/n8n Docker image will no longer include the task runner for external mode. You must use the separate n8nio/runners Docker image to run task runners in external mode.


MySQL/MariaDB больше не поддерживаются — только PostgreSQL или SQLite.

список изменений

По ценам — от $12/мес за 2.5K выполнений в облаке, селфхост остаётся бесплатным для комьюнити-версии.

Beta (2.0.0): сегодня
Stable (2.0.x): 15 Декабря

#n8n #dev
———
@tsingular
🔥194👨‍💻211👍11
Media is too big
VIEW IN TELEGRAM
Web Audio Player

За 30 минут буквально делается такой вот плеер со спецэффектами с помощью Gemini 3 Pro Build.

PLAY

музыка никуда не выгружается.
остается в памяти браузера.

#dev #player
———
@tsingular
🔥2631
Никогда такого не было и вот опять.

Claude Code CLI зачистил всю домашнюю директорию у разраба на маке.

Просто rm-rf ~/

Пора уже заводить практику всех этих ИИ агентов в контейнерах держать.

#ClaudeCode #fail #dev
------
@tsingular
👌13😭743😁2💯2👍1
в API Sora2 обновилась модель до sora-2-2025-12-08

не забудьте переключить, кто пользуется.

старую отключат 13 января.

Повысили качество рендера, убрали мигание.

#sora #openai #dev
———
@tsingular
8
Создатель ClaudeCode, Борис Чёрный, пишет:

За последние 30 дней 100% кода, который я разработал, был создан с помощью ClaudeCode

Таким образом, предсказание Дарио Амодеи, гендира Антропика сбылось для некоторой части разрабов в мире.

100% кода они пишут с ИИ.
Пусть даже внутри Антропика.

Будущее наступило, просто оно неравномерно распределено.

#ClaudeCode #dev
------
@tsingular
174😢3🗿2🤣1