Big Data AI
16.8K subscribers
908 photos
117 videos
19 files
911 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
⚡️ Обход капчи с GPT4o

Мощный инструмент для обхода различных капч (головоломок, текста, рекапчи) с использованием Python, Selenium и Open air GPT-4o.


📌 Github

#Python #Selenium #OpenAI #GPT4


@bigdatai
👍6🔥21
Nvidia не смогла получить от TSMC выделенную линию для упаковки ИИ-чипов

💡 Nvidia не смогла получить от TSMC выделенную линию для упаковки ИИ-чипов, используя метод CoWoS. Основатель Nvidia Дженсен Хуанг встретился с руководителями TSMC, но получил отказ. TSMC признала, что не сможет удовлетворить спрос на компоненты для ИИ-систем до 2026 года, и решила сохранять равные условия для всех клиентов. Хотя TSMC ранее предоставляла привилегии крупным клиентам, как Apple, ситуация с Nvidia отличается. Компания будет жестко отстаивать свои интересы в переговорах. 🌐

#python #machinelearning #neuralnetwork #ml

@bigdatai
👍5🔥31
🔥 Thyme: Think Beyond Images

Thyme — это инновационная модель, которая улучшает обработку изображений и сложные задачи рассуждения, используя автономное генерирование и выполнение операций через исполняемый код. Она сочетает в себе методы супервайзинга и обучения с подкреплением, обеспечивая высокую точность выполнения кода.

🚀 Основные моменты:
- Автономная генерация и выполнение операций с изображениями.
- Комбинация супервайзинга и обучения с подкреплением.
- Поддержка высокоразрешающей перцепции и сложного рассуждения.
- Использует алгоритм GRPO-ATS для оптимизации работы.

📌 GitHub: https://github.com/yfzhang114/Thyme

#python

@bigdatai
🧩 Multi-View 3D Point Tracking

MVTracker — это инновационный инструмент для отслеживания 3D-точек с использованием данных с нескольких камер. Он объединяет многоview-функции в единую 3D-точечную облачную модель, применяя корреляцию на основе kNN для учета пространственно-временных взаимосвязей. Модель адаптируется к различным условиям съемки и эффективно справляется с затенениями.

🚀Основные моменты:
- Первое решение для отслеживания 3D-точек с нескольких ракурсов.
- Использует трансформеры для итеративного улучшения треков.
- Поддерживает работу с различными настройками камер без оптимизации для каждой последовательности.
- Доступен через PyTorch Hub для быстрого начала работы.

📌 GitHub: https://github.com/ethz-vlg/mvtracker

#python
1👍1🔥1
⚡️ FastVGGT: Ускорение 3D-реконструкции без обучения

FastVGGT предлагает метод ускорения для 3D-реконструкции, достигая до 4× более быстрой работы без потери точности. Он использует схожесть карт внимания для оптимизации процесса.

🚀Основные моменты:
- Ускорение работы без необходимости в обучении.
- Поддержка длинных последовательностей.
- Высокая точность при быстром выводе.
- Оценка на наборе данных ScanNet.

📌 GitHub: https://github.com/mystorm16/FastVGGT

#python
🧠 Qwen3-ASR Toolkit: Умный инструмент для транскрипции аудио

Qwen3-ASR Toolkit — это мощный Python-инструмент для работы с API Qwen-ASR, позволяющий обрабатывать аудио и видео любой длины. Он преодолевает ограничение в 3 минуты, умно разбивая длинные файлы и обрабатывая их параллельно, что значительно ускоряет транскрипцию.

🚀 Основные моменты:
- Обходит 3-минутное ограничение API для транскрипции.
- Умное разделение аудио с использованием детекции активности голоса.
- Параллельная обработка для быстрого получения результатов.
- Автоматическая очистка текста от артефактов ASR.
- Поддержка множества форматов медиа благодаря FFmpeg.

📌 GitHub: https://github.com/QwenLM/Qwen3-ASR-Toolkit

#python
👍31
🎥📊 SpatialVID: Обширный видеодатасет с пространственными аннотациями

SpatialVID предлагает более 21,000 часов видео с детализированными 3D аннотациями, включая позиции камер и карты глубины. Этот датасет создан для улучшения моделей пространственного интеллекта и подходит для исследований в области видео и 3D-визуализации.

🚀Основные моменты:
- Более 2.7 миллиона клипов с разнообразными сценами
- Аннотации включают динамические маски и структурированные подписи
- Поддержка реальных динамических сцен с точными данными о движении камер
- Уникальный ресурс для повышения обобщающей способности моделей

📌 GitHub: https://github.com/NJU-3DV/SpatialVID

#python
3👍1
🤖 Tongyi DeepResearch: мощная языковая модель для глубокого поиска

Tongyi DeepResearch — это языковая модель с 30,5 миллиарда параметров, специально разработанная для глубоких информационно-ориентированных задач. Она демонстрирует выдающиеся результаты на различных бенчмарках, включая Humanity's Last Exam и WebWalkerQA, благодаря автоматизированному синтезу данных и передовым методам обучения с подкреплением.

🚀Основные моменты:
- Высокая производительность на сложных задачах поиска.
- Полностью автоматизированный процесс синтеза данных.
- Совместимость с несколькими парадигмами вывода.
- Эффективное обучение с использованием данных агентных взаимодействий.

📌 GitHub: https://github.com/Alibaba-NLP/DeepResearch

#python
2
🧬 ShinkaEvolve: Эволюция программ с помощью ИИ

ShinkaEvolve — это фреймворк, который сочетает большие языковые модели с эволюционными алгоритмами для автоматизации научных открытий. Он позволяет улучшать научный код, используя креативные возможности ИИ и оптимизацию через эволюцию, поддерживая параллельную оценку кандидатов.

🚀 Основные моменты:
- Комбинирует LLM и эволюционные алгоритмы.
- Поддерживает параллельную оценку на локальных машинах и кластерах.
- Хранит архив успешных решений для передачи знаний.
- Оптимизирует производительность при сохранении корректности кода.
- Идеален для научных задач с доступными проверяющими.

📌 GitHub: https://github.com/SakanaAI/ShinkaEvolve

#python