Сергей Булаев AI 🤖

This media is not supported in your browser

На GitHub появилось что-то интересное — ScreenPipe, мощное настольное приложение с открытым исходным кодом.

Что умеет?
• Следит за вашим ПК 24/7.
• Записывает экран, анализирует текст через OCR, обрабатывает звук и делает транскрипцию.
• Всё это хранится локально в базе данных.

Идеальный инструмент для тех, кто хочет автоматизировать сбор информации или следить за своими действиями на компе. Используйте эти данные, чтобы ответить на вопросы, не беспокоясь о том, что упустите какие-либо детали.

По сути, это rewind.ai x cursor.com в одном флаконе.

🐙

GitHub 9.5k ⭐️

🌐

Сайт

@tips_ai #tools

Please open Telegram to view this post

VIEW IN TELEGRAM

1573

2.11K views07:14

Сергей Булаев AI 🤖

Forwarded from Tips AI | IT & AI

1:15

Media is too big

VIEW IN TELEGRAM

Я однажды упоминал прекрасное приложение от [ElevenLabs], так вот они следом за [NoteBookLM] добавили на IOS — GenFM.

GenFM может создавать умные персональные подкасты из любых ваших PDF-файлов, статей, электронных книг, ссылок с YouTube или текста на 32 языках (ru пока нет). На Android будет в ближайшее время.

Качество голосов у ElevenLabs на голову выше, чем у Microsoft, так еще UI приложения радует глаз. И все бесплатно.

• IOS | ANDROID

@tips_ai #tools

2041

2.05K views07:00

Сергей Булаев AI 🤖

Forwarded from Tips AI | IT & AI

Бенчмарков для LLM сейчас очень много. От математики и кодинга до эмпатии модели.

Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.

Среди всего, что есть, я чаще смотрю именно их:

LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.

EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.

Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.

LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.

SWE-Bench — для программистов.

Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.

OpenRouter — удобно смотреть, что популярно и что используют.

Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.

@tips_ai #tools

1266

4.09K views19:38

About

Blog

Apps

Platform