Сергей Булаев AI 🤖
10.8K subscribers
685 photos
623 videos
2 files
687 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
Forwarded from Tips AI | IT & AI
This media is not supported in your browser
VIEW IN TELEGRAM
На GitHub появилось что-то интересное — ScreenPipe, мощное настольное приложение с открытым исходным кодом.

Что умеет?
• Следит за вашим ПК 24/7.
• Записывает экран, анализирует текст через OCR, обрабатывает звук и делает транскрипцию.
• Всё это хранится локально в базе данных.

Идеальный инструмент для тех, кто хочет автоматизировать сбор информации или следить за своими действиями на компе. Используйте эти данные, чтобы ответить на вопросы, не беспокоясь о том, что упустите какие-либо детали.

По сути, это rewind.ai x cursor.com в одном флаконе.

🐙GitHub 9.5k ⭐️
🌐Сайт

@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
1573
Forwarded from Tips AI | IT & AI
Media is too big
VIEW IN TELEGRAM
Я однажды упоминал прекрасное приложение от [ElevenLabs], так вот они следом за [NoteBookLM] добавили на IOS — GenFM.

GenFM может создавать умные персональные подкасты из любых ваших PDF-файлов, статей, электронных книг, ссылок с YouTube или текста на 32 языках (ru пока нет). На Android будет в ближайшее время.

Качество голосов у ElevenLabs на голову выше, чем у Microsoft, так еще UI приложения радует глаз. И все бесплатно.

IOS | ANDROID

@tips_ai #tools
2041
Forwarded from Tips AI | IT & AI
Бенчмарков для LLM сейчас очень много. От математики и кодинга до эмпатии модели.

Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.

Среди всего, что есть, я чаще смотрю именно их:

LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.

EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.

Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.

LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.

SWE-Bench — для программистов.

Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.

OpenRouter — удобно смотреть, что популярно и что используют.

Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.

@tips_ai #tools
1266