Machine learning Interview

🎙️ VoxCPM: Инновационная TTS-система для реалистичной генерации речи

VoxCPM — это передовая система синтеза речи без токенизации, обеспечивающая контекстно-осознанное создание речи и точное клонирование голоса. Она использует диффузионную архитектуру для генерации непрерывных представлений речи, что позволяет достичь высокой выразительности и стабильности.

🚀Основные моменты:
- Контекстно-осознанная генерация речи с естественной интонацией.
- Точное клонирование голоса с минимальным количеством образцов.
- Высокая эффективность синтеза, поддержка потоковой передачи.

📌 GitHub: https://github.com/OpenBMB/VoxCPM

#python

❤15👍9🔥1

4.45K views13:33

Machine learning Interview

🤖 Многоагентная система кодинга

Этот проект представляет собой многоагентную ИИ-систему, которая использует оркестратор для координации работы исследовательских и кодирующих агентов. Оркестратор разбивает задачи на подзадачи и управляет процессом, обеспечивая стратегический подход к решению задач.

🚀 Основные моменты:
- Достижения: 12-е место в TerminalBench, превосходя Claude Code.
- Оркестратор управляет делегированием и верификацией задач.
- Агенты работают с уникальными контекстами и инструментами.
- Инновационный подход к совместному использованию знаний через контекстный хранилище.

📌 GitHub: https://github.com/Danau5tin/multi-agent-coding-system

#python

❤10👍6🔥4

3.83K views13:04

Machine learning Interview

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Создание видео с LongCat-Video

LongCat-Video — это мощная модель генерации видео с 13.6 миллиарда параметров, способная выполнять задачи *Text-to-Video*, *Image-to-Video* и *Video-Continuation*. Она обеспечивает высокое качество и эффективность, особенно в создании длинных видео без потери качества.

🚀 Основные моменты:
- Унифицированная архитектура для различных задач генерации видео.
- Способность генерировать видео длительностью в минуты.
- Эффективный процесс генерации с высоким разрешением.
- Сравнимые результаты с ведущими коммерческими решениями.

📌 GitHub: https://github.com/meituan-longcat/LongCat-Video

#python

🔥5❤2👍2🥱1

2.91K views10:45

Machine learning Interview

🌍🗣️ Omnilingual ASR: Многоязычное распознавание речи для 1600+ языков

Omnilingual ASR — это открытая система распознавания речи, поддерживающая более 1,600 языков, включая редкие. Она позволяет добавлять новые языки с минимальными примерами, делая технологии распознавания более доступными и инклюзивными для различных сообществ.

🚀Основные моменты:
- Поддержка более 1,600 языков, включая уникальные.
- Простота добавления новых языков без больших наборов данных.
- Использует нулевое обучение и гибкие модели для адаптации.
- Доступен на Hugging Face для демонстрации и использования.

📌 GitHub: https://github.com/facebookresearch/omnilingual-asr

#python

GitHub

GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages

Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr

😁5👍3🔥2🥰1

4.03K views19:15

Machine learning Interview

🌉🤖 CodexMCP: Интеграция Claude Code и Codex

CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно сотрудничать в программировании. Проект предлагает улучшенные функции, такие как многократные диалоги и параллельные задачи, что делает взаимодействие AI более интеллектуальным и продуктивным.

🚀Основные моменты:
- Поддержка многократных диалогов и параллельного выполнения задач.
- Усовершенствованное управление контекстом с сохранением сессий.
- Интеграция с Claude Code для анализа требований и архитектуры.
- Возможность отслеживания деталей вывода и обработки ошибок.

📌 GitHub: https://github.com/GuDaStudio/codexmcp

#python

👍10🥰5🔥1

3.76K views15:46

Machine learning Interview

🔥 TorchCode: Практика для собеседований по PyTorch

TorchCode предлагает структурированную среду для тренировки навыков программирования, необходимых для собеседований в области машинного обучения. Решайте задачи по реализации операторов и архитектур, получая мгновенную обратную связь и подсказки.

🚀Основные моменты:
- 40 задач, часто встречающихся на собеседованиях
- Автоматическая проверка корректности и производительности
- Мгновенная обратная связь по каждому тесту
- Подсказки и эталонные решения для изучения
- Возможность запуска в браузере без установки

📌 GitHub: https://github.com/duoan/TorchCode

#python

🔥14❤5🥰2

4.07K views13:06

Machine learning Interview

🚀 Автономные исследования ИИ с autoresearch

Этот репозиторий предлагает концепцию автономного обучения ИИ, где агент сам модифицирует код и проводит эксперименты. С помощью простого интерфейса program.md пользователи могут настраивать агента для оптимизации моделей, не вмешиваясь в код напрямую. Идея заключается в том, чтобы дать агенту 5 минут на обучение, после чего он оценивает результаты и продолжает итерации.

🚀 Основные моменты:
- Автономный агент модифицирует train.py для оптимизации модели.
- Обучение проходит в фиксированное время — 5 минут.
- Легкий интерфейс для настройки через program.md.
- Поддержка только одного NVIDIA GPU.

📌 GitHub: https://github.com/karpathy/autoresearch

#python

👍7❤1

2.7K views14:01

Machine learning Interview

🚀 Автоматизация оптимизации GPU-ядра с AutoKernel

AutoKernel - это инструмент для автономной оптимизации GPU-ядр на основе моделей PyTorch. Он профилирует модели, выявляет узкие места и автоматически генерирует оптимизированные ядра Triton или CUDA C++. Пользователь может просто запустить процесс и проснуться с готовыми улучшениями.

🚀 Основные моменты:
- Автономное извлечение и оптимизация GPU-ядр.
- Поддержка различных моделей PyTorch.
- Интеграция с KernelBench для глубокого тестирования.
- Высокая скорость экспериментов — до 320 за ночь.
- Проверка корректности и производительности на каждом этапе.

📌 GitHub: https://github.com/RightNow-AI/autokernel

#python

⚡13👍3❤1

3.4K views10:00

Machine learning Interview

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Умные агенты с OpenSpace: эволюция и экономия 💰

OpenSpace — это движок, который позволяет AI-агентам учиться и развиваться, превращая каждую задачу в возможность для улучшения. Он объединяет навыки, которые автоматически адаптируются и улучшаются, обеспечивая совместное использование знаний между агентами.

🚀 Основные моменты:
- Саморазвивающиеся навыки, которые учатся на реальном опыте
- Совместный интеллект: улучшения одного агента доступны всем
- Снижение затрат на 46% благодаря более эффективному использованию токенов
- Легкость в обмене навыками между агентами
- Реальные результаты: агенты зарабатывают в 4.2 раза больше

📌 GitHub: https://github.com/HKUDS/OpenSpace

#python

🔥9❤3🤣3

3.68K views11:39

Machine learning Interview

🧩 Meta-Harness: Оптимизация моделей для конкретных задач

Meta-Harness — это фреймворк для автоматизированного поиска по моделям, который управляет хранением и отображением данных во время работы модели. Репозиторий включает в себя сам фреймворк и два примера из статьи.

🚀Основные моменты:
- Удобный фреймворк для применения к новым доменам.
- Два примера: текстовая классификация и Terminal-Bench 2.
- Оптимизация работы моделей с помощью адаптивных решений.

📌 GitHub: https://github.com/stanford-iris-lab/meta-harness

#python

❤7

3.34K views11:00

Machine learning Interview

🚀 Оптимизированные GPU ядра для LLM

TileKernels предлагает высокопроизводительные GPU ядра, разработанные с использованием TileLang. Проект фокусируется на эффективных операциях для больших языковых моделей, включая маршрутизацию экспертов и квантование, что позволяет достигать максимальной производительности оборудования.

🚀 Основные моменты:
- Высокая производительность для операций LLM
- Поддержка маршрутизации Mixture of Experts
- Квантование с различными форматами
- Удобные высокоуровневые обертки для PyTorch
- Активное улучшение качества кода и документации

📌 GitHub: https://github.com/deepseek-ai/TileKernels

#python

GitHub

GitHub - deepseek-ai/TileKernels: A kernel library written in tilelang

A kernel library written in tilelang. Contribute to deepseek-ai/TileKernels development by creating an account on GitHub.

👍8

4.48K views16:15

Machine learning Interview

🎨 GPT Image 2 Skill Gallery 🚀

Этот репозиторий предлагает галерею прометав для генерации изображений с использованием GPT Image 2. Он включает в себя библиотеку изображений и примеры для создания различных визуальных материалов, таких как постеры, макеты и графика для игр. Идеально подходит для исследовательских проектов и креативных задач.

🚀Основные моменты:
- 162 готовые подсказки для генерации изображений
- Поддержка различных агентских сред, включая Codex и Claude Code
- Примеры для редактирования изображений и создания уникальных визуалов
- Лицензия CC BY 4.0

📌 GitHub: https://github.com/wuyoscar/gpt_image_2_skill

#python

👌3👍1

3.44K views11:01

Machine learning Interview

🤖 Оптимизация работы с Claude Code через DeepSeek

Deepclaude позволяет использовать Claude Code с более дешевым и эффективным бэкендом DeepSeek V4 Pro, сохраняя привычный интерфейс. Это решение значительно снижает затраты на кодирование, обеспечивая поддержку автономных циклов и многошаговых операций.

🚀 Основные моменты:
- Сравнительно низкая стоимость: $0.87/M токен.
- Поддержка чтения, редактирования файлов и выполнения команд.
- Возможность переключения между бэкендами без перезапуска.
- Высокая производительность с автоматическим кэшированием контекста.

📌 GitHub: https://github.com/aattaran/deepclaude

#python

❤10👍9🔥4🤔2

4.22K views11:04

About

Blog

Apps

Platform