Useful Tools | Linux | GitOps | DevOps
6.61K subscribers
348 photos
8 videos
12 files
1.02K links
Полезные бесплатные opensource инструменты на все случаи жизни, а иногда и советы.

Понравился проект из поста - поддержи автора звездой!

Web: https://gitgate.d3.ru

Сотрудничество: @maxgrue
Download Telegram
Nano-vLLM - облегченная реализация vLLM, созданная с нуля.

Возможности:
- быстрый офлайн-вывод - скорость вывода сравнима с vLLM
- читабельная кодовая база - чистая реализация примерно в 1200 строках кода Python
- набор для оптимизации - кэширование префиксов, тензорный параллелизм, компиляция Torch, график CUDA и т. д.

https://github.com/GeeeekExplorer/nano-vllm

Опубликовано в @gitgate

#llm #ai
👍7🔥4
OnlyHuman - устали от того, что SEO-спам, генерируемый искусственным интеллектом, засоряет результаты вашего поиска?

OnlyHuman - это список фильтров для uBlock Origin, который блокирует появление в результатах поиска и лентах новостей неэффективных ИИ-контента и сайтов, содержащих спам с помощью SEO.

Что он блокирует:
- фермы контента на основе AI-SEO - веб-сайты, предназначенные для ранжирования в результатах поисковых запросов путем массового производства не требующих больших усилий ИИ-рерайтов.
- cлабые SEO-сайты, страницы с тысячами ничего не говорящих слов, оптимизированные исключительно для поисковых алгоритмов.
- вторичное содержание и переписывание, одинаковые статьи, распространяемые по нескольким доменам.
- спам в результатах поиска, низкокачественные сайты, которые наводняют Google, Bing, DuckDuckGo, Яндекс ненужным контентом.

https://github.com/FranklyRocks/OnlyHuman

проект uBlock Origin: https://github.com/gorhill/uBlock

Опубликовано в @gitgate

#spam #seo #ai
👍23🔥10
Remove Windows Ai - текущая сборка Windows 11 (25H2) и будущие сборки будут включать всё больше функций и компонентов ИИ. Цель этого скрипта удалить ВСЕ эти функции для улучшения пользовательского опыта, конфиденциальности и безопасности.

Возможности:
- отключает ключи реестра:
* отключить CoPilot
* отключить Recall
* отключить функцию Input Insights и сбор данных о вводе
* Copilot пилот в Edge
* создатель изображений в Paint
* удаляет службу AI Fabric
* отключает действия ИИ
* отключает ИИ в Paint
* отключает голосовой доступ
* отключает голосовые эффекты ИИ
* отключает ИИ в настройках поиска
- предотвращает переустановку пакетов ИИ
- отключает политики Copilot
- удаляет пакеты AI Appx
- удаляет пакеты AI в CBS
- удаляет файлы AI
- скрывает компоненты ИИ
- отключает функцию перезаписи ИИ в Блокноте
- принудительно удаляет все экземпляры запланированных задач Recall.

https://github.com/zoicware/RemoveWindowsAI

Опубликовано в @gitgate

#windows #ai #cleaner
👍23🔥10
ppl - консольная утилита “как системный инструмент”, которая подключается к Perplexity API и помогает общаться, генерировать команды и собирать скрипты прямо из терминала.

Возможности:
- chat: разговорный режим: подмешивает историю (контекст) и печатает ответ в формате Markdown
- cmd: генерирует одну bash-команду под задачу: возвращает строгий JSON (команда + заметки), умеет предложить выполнить после подтверждения (--run)
- script python: возвращает код + список pip-зависимостей; ppl предлагает установить зависимости, затем показывает код и предлагает запуск
- script bash: генерирует bash-скрипт, показывает и предлагает запуск
- key: сохранить/очистить Perplexity API key локально
- clear: очистить историю диалога
- Готовые onefile бинарники в Releases (Linux/Windows), на macOS пока нет

https://github.com/Fristivan/perplexity-cli.git

Поддержите нашего автора @fristivan звездой в репке ! Для разработчика это очень важно !

Опубликовано в @gitgate

#ai #cli #perplexity #bash #python #linux #windows #devtools
👍14🔥8
PicoClaw - сверхлегкий персональный ИИ-помощник, вдохновленный nanobot, полностью переработанный на языке Go с использованием процесса самоинициализации, в рамках которого сам ИИ-агент руководил всей архитектурной миграцией и оптимизацией кода.

Работает на оборудовании стоимостью 10 долларов с объемом оперативной памяти менее 10 МБ: это на 99% меньше памяти, чем у OpenClaw, и на 98% дешевле, чем Mac mini!

Возможности:
- сверхлегкий: занимает менее 10 МБ памяти - на 99% меньше, чем базовый Clawdbot
- минимальная стоимость: достаточно эффективен для работы на оборудовании стоимостью 10 долларов - на 98% дешевле, чем Mac mini.
- молниеносная скорость: время запуска в 400 раз быстрее, загрузка за 1 секунду даже на одноядерном процессоре с частотой 0,6 ГГц.
- настоящая портативность: единый автономный исполняемый файл для RISC-V, ARM и x86, запуск одним щелчком мыши!
- AI-Bootstrapped: Автономная реализация Go-native - 95% ядра создано агентами, а доработка осуществляется с участием человека.
- интеграция c Telegram, Discord, DingTalk или LINE.

https://github.com/sipeed/picoclaw

Опубликовано в @gitgate

#ai #nanobot
👍15🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
llmfit - сотни моделей и поставщиков AI. Одна команда, чтобы узнать, что работает на вашем оборудовании.

Инструмент для терминала, который оптимизирует размеры моделей LLM в соответствии с оперативной памятью, процессором и видеокартой вашей системы. Он определяет ваше оборудование, оценивает каждую модель по таким параметрам, как качество, скорость, соответствие и контекст, и сообщает, какие из них действительно будут хорошо работать на вашей машине.

Поставляется с интерактивным графическим интерфейсом пользователя (по умолчанию) и классическим режимом командной строки. Поддерживает многопроцессорные конфигурации, архитектуры MoE, динамический выбор квантизации, оценку скорости и локальные поставщики среды выполнения (Ollama, llama.cpp, MLX).

https://github.com/AlexsJones/llmfit

Опубликовано в @gitgate

#ai #tui #llm
1👍6🔥6
Claude Usage Bar - приложение для панели меню, отображающее использование вами сервиса Claude в режиме реального времени.

Возможности:
- специально разработано для отслеживания использования Claude Pro и Max.
- отображает текущий процент использования сессии в строке меню.
- отображает еженедельные лимиты использования (для всех моделей и только для Sonnet).
- отображает дополнительные расходы и остаток на балансе.
- цветовая кодировка значков: зеленый (< 80%), оранжевый (80-95%), красный (> 95%).
- встроенные уведомления при достижении пороговых значений использования 80% и 95%.
- автоматическое обновление каждые 5 минут (с возможностью ручного обновления)
- дополнительная опция автоматического запуска при входе в систему.

https://github.com/mnapoli/claude-usage-bar

Опубликовано в @gitgate

#ai #gui #llm
👍12🔥4
llm-checker
- интеллектуальный селектор моделей Ollama

Интерфейс командной строки на основе искусственного интеллекта, который анализирует ваше оборудование и рекомендует оптимальные модели LLM.
Детерминированная оценка на основе более чем 200 динамических моделей (более 35 тщательно отобранных резервных вариантов) с калибровкой памяти на аппаратном уровне.

Выбор подходящей модели LLM для вашего оборудования - сложная задача. Учитывая тысячи вариантов моделей, уровней квантования и конфигураций оборудования, для поиска оптимальной модели необходимо понимать пропускную способность памяти, ограничения видеопамяти и характеристики производительности.

LLM Checker решает эту проблему. Он анализирует вашу систему, оценивает каждую совместимую модель по четырем параметрам (качество, скорость, соответствие, контекст) и за считанные секунды предоставляет практические рекомендации.

https://github.com/Pavelevich/llm-checker

Опубликовано в @gitgate

#llm #ai #tools #cli
👍13🔥7
Voicebox - локальная студия клонирования голоса с функциями, аналогичными DAW, для профессионального синтеза голоса. Рассматривайте её как локальную, бесплатную и открытую альтернативу ElevenLabs - загружайте модели, клонируйте голоса и генерируйте речь полностью на своём компьютере.

В отличие от облачных сервисов, которые блокируют доступ к вашим голосовым данным по подписке, Voicebox предоставляет вам:
- полная конфиденциальность - модели и голосовые данные остаются на вашем устройстве.
- профессиональные инструменты - многодорожечный редактор временной шкалы, обрезка звука, микширование разговоров.
- гибкость моделей - в настоящее время используется Qwen3-TTS, поддержка XTTS, Bark и других моделей появится в ближайшее время.
- API-ориентированный подход - используйте настольное приложение или интегрируйте синтез речи в свои собственные проекты.
- высокая производительность - создано с использованием Tauri (Rust), а не Electron.
- сверхбыстрая работа на Mac - бэкэнд MLX с нативным ускорением Metal для 4-5-кратного ускорения вывода на Apple Silicon.

Скачайте голосовую модель, клонируйте любой голос из нескольких секунд аудиозаписи и создавайте многоголосые проекты с помощью инструментов редактирования студийного уровня. Не требуется установка Python, нет зависимости от облачных сервисов, нет ограничений.

https://github.com/jamiepine/voicebox

Опубликовано в @gitgate

#voice #ai #elevenlabs
👍22🔥7
RuView - "смотри сквозь стены" благодаря Wi-Fi и искусственному интеллекту.

Воспринимайте мир через сигналы. Никаких камер. Никаких носимых устройств. Никакого интернета. Только физика.

Вместо того чтобы полагаться на камеры или облачные модели, система отслеживает любые сигналы, существующие в пространстве, такие как Wi-Fi, радиоволны в широком диапазоне, движения, вибрации, звук или другие сенсорные данные, и формирует понимание того, что происходит локально.

Анализируя помехи в информации о состоянии канала (CSI), вызванные движением человека, RuView в реальном времени восстанавливает положение тела, частоту дыхания, частоту сердечных сокращений и присутствие, используя обработку сигналов на основе физических принципов и машинное обучение.

В отличие от исследовательских систем, которые полагаются на синхронизированные камеры для обучения, RuView разработана для работы исключительно на основе радиосигналов и самообучающихся эмбеддингов на периферии сети.

Система работает исключительно на недорогом оборудовании, таком как сенсорная сеть ESP32 (стоимостью всего около 1 доллара за узел). Небольшие программируемые периферийные модули анализируют сигналы локально и со временем изучают радиочастотную сигнатуру помещения, что позволяет системе отделять окружающую среду от активности, происходящей внутри нее.

Поскольку RuView обучается в непосредственной близости от наблюдаемых сигналов, он совершенствуется по мере работы. Каждая развернутая система создает локальную модель своего окружения и постоянно адаптируется без необходимости использования камер, размеченных данных или облачной инфраструктуры.

На практике это означает, что обычные помещения обретают новый вид пространственного восприятия. Комнаты, здания и устройства начинают ощущать присутствие, движение и жизненную активность, используя сигналы, которые уже заполняют пространство.

https://github.com/ruvnet/RuView

Опубликовано в @gitgate

#wifi #esp32 #ai
🔥12👍9
voice-over-translation - расширение для браузера для закадрового перевода видео.

Возможности:
- перевод видео на русский, английский или казахский с поддерживаемых языков
- автоматический перевод видео при открытии
- автоматическое включение субтитров при открытии
- умное расположение субтитров: адаптация длины строк и размера текста под размер плеера
- отображение субтитров, сгенерированных нейросетью
- отображение субтитров с сайта (например, автопереведенные субтитры YouTube)
- сохранение субтитров в форматах .srt, .vtt, .json
- сохранение аудиодорожки перевода в формате .mp3
- отдельные ползунки громкости для оригинального и переведённого звука
- адаптивная громкость: приглушение оригинала, когда звучит перевод
- ограничение перевода видео на родном языке (язык можно выбрать в меню)
- синхронизация громкости перевода с громкостью видео
- ограничение перевода с выбранных языков
- горячие клавиши для перевода и управления субтитрами (включая комбинации клавиш)
- простая настройка внешнего вида субтитров
- отображение перевода отдельных слов в субтитрах

https://github.com/ilyhalight/voice-over-translation

Опубликовано в @gitgate

#browser #plugin #translate #ai
👍16🔥5
rtk - высокопроизводительный CLI-прокси, снижающий потребление токенов LLM на 60-90%.

rtk фильтрует и сжимает выходные данные команд до того, как они достигнут контекста LLM. Единый исполняемый файл Rust, более 100 поддерживаемых команд, накладные расходы <10 мс.

https://github.com/rtk-ai/rtk

Опубликовано в @gitgate

#ai #agent #roken
1👍17🔥8
Octo - небольшой, полезный помощник по программированию, похожий на головоногих моллюсков, который работает с любым API LLM, совместимым с OpenAI или Anthropic, и позволяет переключаться между моделями по своему желанию во время разговора, если конкретная модель зависает. Octo может дополнительно использовать (и мы рекомендуем использовать) модели машинного обучения, которые мы специально обучили и открыли для автоматической обработки ошибок вызова инструмента и редактирования кода от основных моделей программирования, с которыми вы работаете: модели автоисправления работают с любым LLM для программирования. Octo отлично работает с Kimi K2.5, MiniMax M2.5, GPT-5.3 и Claude 4.6 (хотя подойдет практически любая агентная модель программирования). Octo хочет помочь вам, потому что Octo - ваш друг.

Octo не использует телеметрию. Использование Octo с поставщиком LLM, ориентированным на конфиденциальность означает, что ваш код остается вашим. Но вы также можете использовать его с любым API-провайдером, совместимым с OpenAI, с Anthropic или с локальными LLM, которые вы запускаете на своем компьютере.

https://github.com/synthetic-lab/octofriend

Опубликовано в @gitgate

#ai #llm #openai #gpt #claude
👍8🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
RustRAG - система знаний для LLM, которую можно быстро развернуть через Docker и использовать как основу для внутренних чат-ботов, техподдержки, персональных ассистентов и других сценариев, где требуется собственный контур хранения и выдачи знаний.

Проект позволяет загружать файлы, документы, изображения и ссылки, извлекать из них текст и структуру, строить эмбеддинги, векторный индекс и граф связей, а затем использовать эту базу знаний через UI или подключать к любым ИИ-агентам через MCP.

Возможности:

- загрузка документов, веб-страниц и изображений в общую базу знаний;
- поддержка форматов txt, md, csv, json, yaml, xml, html, pdf, docx, pptx, а также изображений png, jpg, jpeg, gif, webp, svg, tiff, heic и других текстовых форматов;
- извлечение текста, построение векторов и графа сущностей/отношений;
- встроенный ассистент в UI для проверки ответов по выбранной библиотеке;
- подключение агентных клиентов через MCP;
- выбор разных моделей для различных этапов обработки;
- учет расходов на уровне документа, сайта и библиотеки;
- гибкая настройка прав: только чтение, доступ к отдельным библиотекам или запись для самообновления базы ИИ агентом;
- готовая инфраструктура с UI, API и служебными компонентами в одном развёртывании.

В планах:

- редактирование графа напрямую из UI;
- поддержка аудио и видео с преобразованием в базу знаний и векторное представление;
- SaaS-режим: систему можно будет либо развернуть у себя, либо использовать как внешний сервис.

Подход проекта - предоставить не отдельные компоненты для ручной сборки очередного RAG-стека, а целостную систему, которую можно быстро запустить и использовать в прикладных задачах.

https://github.com/mlimarenko/RustRAG

Поделился автор: Mikhail - @leader_lm

Опубликовано в @gitgate

#rust #rag #llm #mcp #docker #ai #chatbot #knowledgebase
7👍17🔥12
GoClaw - многоагентный AI-шлюз, который подключает LLM-модели к вашим инструментам, каналам и данным — разворачивается как единый Go-бинарник без каких-либо сторонних зависимостей времени выполнения. Он оркестрирует команды агентов и межагентную делегацию через 20+ провайдеров LLM с полной мультиарендной изоляцией.

Go-порт проекта OpenClaw с расширенной безопасностью, мультиарендным PostgreSQL и наблюдаемостью производственного уровня.

Возможности:
- команды агентов и оркестрация: Команды с общими досками задач, межагентная делегация (синхронная/асинхронная) и гибридное обнаружение агентов
- мультиарендный PostgreSQL: Отдельные рабочие пространства для каждого пользователя, контекстные файлы на пользователя, зашифрованные API-ключи (AES-256-GCM), изолированные сессии
- единый бинарник: ~25 МБ статический Go-бинарник, без Node.js, запуск менее чем за 1 с, работает на VPS за $5
- безопасность производственного уровня: 5-уровневая система прав (аутентификация шлюза → глобальная политика инструментов → на агента → на канал → только для владельца) плюс ограничение запросов, обнаружение prompt-инъекций, защита от SSRF, запрещённые shell-паттерны и шифрование AES-256-GCM
- 20+ провайдеров LLM: Anthropic (нативный HTTP+SSE с кэшированием промптов), OpenAI, OpenRouter, Groq, DeepSeek, Gemini, Mistral, xAI, MiniMax, Cohere, Perplexity, DashScope, Bailian, Zai, Ollama, Ollama Cloud, Claude CLI, Codex, ACP и любой OpenAI-совместимый эндпоинт
- 7 каналов обмена сообщениями: Telegram, Discord, Slack, Zalo OA, Zalo Personal, Feishu/Lark, WhatsApp
- Extended Thinking: Режим thinking на каждого провайдера (бюджет токенов Anthropic, усилия рассуждения OpenAI, бюджет мышления DashScope) с поддержкой стриминга
- Heartbeat: Периодические проверки агентов через чек-листы HEARTBEAT.md с подавлением при успехе, активными часами, логикой повторных попыток и доставкой в канал
- планировщик и cron: Выражения at, every и cron для автоматизированных задач агентов с параллелизмом на основе очередей
- наблюдаемость: Встроенная трассировка LLM-вызовов со спанами и метриками кэша промптов, опциональный экспорт OpenTelemetry OTLP

https://github.com/nextlevelbuilder/goclaw

Подсказал: Eliot Spencer - @tehn0mad

Опубликовано в @gitgate

#ai #agent #go
12👍15🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
purple - терминальный интерфейс для ваших серверов. Поиск, подключение, передача файлов, управление контейнерами и выполнение команд на разных хостах. Все управляется с клавиатуры. Бесплатное программное обеспечение с открытым исходным кодом.

Возможности:
- вся информация с первого взгляда. Информация о подключении, маршрут перехода, график активности, теги, туннели, фрагменты кода, контейнеры и метаданные сервера. Индикаторы состояния показывают, какие хосты активны. Группировка по провайдеру, тегу или типу соединения.
- мгновенный нечеткий поиск. Имена, IP-адреса, теги, пользователи. Сортировка по частоте выводит наиболее часто используемые хосты вверху списка. Работает одинаково как с 5 хостами, так и с 500. Поиск по группам с ограничением по области.
- 16 облачных провайдеров: AWS, DigitalOcean, Hetzner, GCP, Azure, Proxmox VE, Vultr, Linode, UpCloud, Scaleway, Tailscale, Oracle Cloud, OVHcloud, Leaseweb, i3D.net и TransIP. Виртуальные машины отображаются, IP-адреса обновляются, устаревшие хосты исчезают. Регион, тип экземпляра, ОС и статус синхронизируются в виде метаданных.
- контейнеры по SSH. Docker и Podman. Запуск, остановка, перезапуск. Без агента на удалённом сервере, без дополнительных портов. Только SSH.
- и многое другое. Визуальная передача файлов с помощью разделенного окна проводника. Выполнение команд на нескольких хостах с помощью фрагментов кода. Автоматическое извлечение паролей из связки ключей ОС, 1Password, Bitwarden, pass и механизма секретов KV HashiCorp Vault. Кратковременные SSH-сертификаты, подписанные с помощью механизма секретов SSH HashiCorp Vault. MCP-сервер для агентов ИИ, таких как Claude Code и Cursor.

https://github.com/erickochen/purple

Опубликовано в @gitgate

#ssh #tui #terminal #cockpit #vault #ai
13👍17🔥10
Useful Tools | Linux | GitOps | DevOps
purple - терминальный интерфейс для ваших серверов. Поиск, подключение, передача файлов, управление контейнерами и выполнение команд на разных хостах. Все управляется с клавиатуры. Бесплатное программное обеспечение с открытым исходным кодом. Возможности:…
agtop - взгляд изнутри на то, что делают ваши ИИ агенты программирования, работающие в терминале, где вы их запускаете.

agtop
- это панель мониторинга терминала в стиле top, которая отслеживает каждую сессию Claude Code и Codex на вашем компьютере: затраты, использование токенов, контекстная нагрузка, загрузка ЦП, вызовы инструментов и многое другое. Все в одном месте, в режиме реального времени.

Возможности:
- обнаружение сессий: автоматически находит сессии Claude Code (~/.claude/projects/) и Codex (~/.codex/sessions/).
- отслеживание затрат: расходы за сеанс с почасовой и суточной разбивкой; выставление счетов с учетом тарифного плана (включая розничные тарифы и тариф Max).
- контекстное давление: CTX% показывает, насколько заполнено контекстное окно каждого агента.
- функция Live toggle: фильтр для отображения запущенных сессий с данными о загрузке ЦП в реальном времени, процентах затрат и подсчете количества инструментов за период.
- панель производительности: графики загрузки ЦП и использования памяти за сеанс в зависимости от времени.
- панель «Процессы»: дерево процессов в реальном времени, отображающее дочерние процессы с указанием процента использования ЦП, объема памяти и командной строки.
Панель «Активность инструментов» — прокручиваемая история вызовов каждого инструмента с указанием времени; вы можете точно увидеть, что делал каждый агент.
- панель «Стоимость»: общие затраты по временным интервалам с указанием токенов для каждой модели и разбивкой по статьям расходов.
- панель конфигурации: просмотр файла CLAUDE.md/AGENTS.md, разделов памяти, навыков, серверов MCP и прав доступа для каждой сессии.
- иетрики процессов ОС: процент использования ЦП и количество PID для запущенных сессий (macOS/Linux/Windows)
- краткий обзор графиков расходов, токенов и загрузки ЦП: сводные данные о затратах, токенах и состоянии системы.
- подробный просмотр: полная разбивка затрат, распределение токенов, статистика по моделям и полная история использования инструмента.
- управление сессиями: удаление неактивных сессий с подтверждением.
- фильтр по периоду неактивности: фильтрация сеансов по возрасту (1 день, 1 неделя, 1 месяц)
- поддержка мыши: выбор элемента щелчком мыши, сортировка по столбцам, переключение вкладок;
- всплывающие подсказки при наведении курсора на заголовки столбцов.
- неинтерактивные режимы: таблица и полный JSON-дамп для написания скриптов.

https://github.com/ldegio/agtop

Опубликовано в @gitgate

#ai #top #tui #claude #codex
10🔥14👍6
LLM Wiki - персональная база знаний, которая формируется сама собой.
LLM читает ваши документы, создает структурированную вики-систему и поддерживает ее в актуальном состоянии.

Возможности:
- двухэтапная цепочка обработки информации: LLM сначала анализирует данные, а затем генерирует вики-страницы с отслеживанием источника и инкрементальным кэшированием.
- граф знаний 4-Signal: модель релевантности с прямыми связями, пересечением источников, моделью Адамика-Адара и сходством типов.
- Louvain Community Detection: автоматическое обнаружение кластеров знаний с оценкой сплоченности.
- Graph Insights: неожиданные связи и пробелы в знаниях с помощью глубокого исследования в один клик.
- векторный семантический поиск: опциональный поиск на основе встраивания данных через LanceDB, поддерживает любые конечные точки, совместимые с OpenAI.
- постоянная очередь загрузки: последовательная обработка с восстановлением после сбоя, отменой, повторной попыткой и визуализацией хода выполнения.
- импорт папок: рекурсивный импорт папок с сохранением структуры каталогов и контекста папок в качестве подсказки для классификации LLM.
- глубокие исследования: поисковые запросы по темам, оптимизированные для LLM, многопоточный веб-поиск, автоматическая загрузка результатов в вики.
- асинхронная система проверки: LLM помечает элементы для оценки человеком, предопределенных действий и предварительно сгенерированных поисковых запросов.
- Chrome Web Clipper: захват веб-страниц одним щелчком мыши с автоматической загрузкой в ​​базу знаний.

https://github.com/nashsu/llm_wiki

Опубликовано в @gitgate

#ai #llm #wiki
10👍18🔥8
This media is not supported in your browser
VIEW IN TELEGRAM
Skyvern - автоматизирует рабочие процессы в браузере, используя LLM-ы и компьютерное зрение. Он предоставляет SDK, совместимый с Playwright, который добавляет функциональность ИИ поверх Playwright, а также конструктор рабочих процессов без кода, который помогает как технически подкованным, так и нетехническим пользователям автоматизировать ручные рабочие процессы на любом веб-сайте, заменяя ненадежные или неэффективные решения для автоматизации.

Традиционные подходы к автоматизации браузера требовали написания пользовательских скриптов для веб-сайтов, часто полагаясь на анализ DOM и взаимодействие на основе XPath, что приводило к сбоям при изменении структуры веб-сайта.

Вместо того чтобы полагаться исключительно на взаимодействие с помощью XPath, определяемого кодом, Skyvern использует LLM в области Vision для изучения веб-сайтов и взаимодействия с ними.

DВозможности:
- может работать на веб-сайтах, которые он никогда раньше не видел, поскольку способен сопоставлять визуальные элементы с действиями, необходимыми для завершения рабочего процесса, без какого-либо написания пользовательского кода.
- устойчив к изменениям в структуре сайта, поскольку наша система не использует заранее определенные XPath-метки или другие селекторы при навигации.
- способен взять один рабочий процесс и применить его к большому количеству веб-сайтов, поскольку он умеет анализировать взаимодействия, необходимые для завершения этого процесса.

https://github.com/Skyvern-AI/skyvern

Опубликовано в @gitgate

#ai #vision #automation
11👍8🔥4
Hermes Agent - самосовершенствующийся ИИ-агент, разработанный Nous Research.

Это единственный агент со встроенным циклом обучения - он создает навыки на основе опыта, улучшает их в процессе использования, подталкивает себя к сохранению знаний, анализирует собственные прошлые разговоры и строит углубленную модель вашей личности на протяжении нескольких сессий.

Запустите его на VPS за 5 долларов, кластере GPU или бессерверной инфраструктуре, которая практически ничего не стоит в режиме ожидания. Он не привязан к вашему ноутбуку - общайтесь с ним из Telegram, пока он работает на облачной виртуальной машине.

Используйте любую модель, какую захотите - Nous Portal, OpenRouter (более 200 моделей), NVIDIA NIM (Nemotron), Xiaomi MiMo, z.ai/GLM, Kimi/Moonshot, MiniMax, Hugging Face, OpenAI или вашу собственную конечную точку. Переключитесь на модель Hermes - никаких изменений в коде, никакой привязки к конкретной модели.

https://github.com/NousResearch/hermes-agent

Подсказал: Eliot Spencer - @tehn0mad

Опубликовано в @gitgate

#ai #agent #tg #telegram #openrouter
10👍10🔥4