Big Data AI
16.9K subscribers
940 photos
122 videos
19 files
935 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🚀 Tavily Deep Research: как работает новый поисковый движок Hugging Face

Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.

🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»

🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета

Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный

Это подход «не просто найти информацию, а переварить и подать её как исследователь».

https://huggingface.co/blog/Tavily/tavily-deep-research
6👍2
✔️ По данным The Verge, OpenAI готовит ускоренный релиз GPT 5.2 уже на следующей неделе - в ответ на запуск Google Gemini 3.

Главная цель обновления - сократить отставание и усилить ChatGPT за счёт:
• более быстрых и надёжных рассуждений
• меньших задержек ответа
• лучшей управляемости через инструкции и профили

Ожидаются улучшения в скорости отклика, снижении ошибок при вызове инструментов и более предсказуемом поведении модели — то есть в тех аспектах, которые пользователи ощущают ежедневно.

📌 Источник: theverge.com/report/838857/openai-gpt-5-2-release-date-code-red-google-response
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍1
DeepSeek V3.2 сейчас лучшая open source-модель на Cortex-AGI: 38.2%.

Лидером остается Gemini 3.0 Pro с 45.6%.

Что такое Cortex-AGI?
- Это бенчмарк на абстрактное рассуждение и логику.
- Задачи процедурно генерируются, разбиты на 10 уровней сложности.
- Нельзя опереться на запоминание данных, модель должна реально рассуждать.
- Платформа сравнивает проприетарные модели и open source решения в одном строгом тесте.

Open source уже приближается к закрытым решениям по способности к логическому выводу. DeepSeek сокращает разрыв, а Gemini удерживает лидерство.
12👍2🔥1
📉 Производительность и зарплаты давно разошлись - и ИИ, вероятно, только расширит этот разрыв.

До примерно 1970-х рост выпуска на работника и рост оплаты труда двигались вместе.

После производительность продолжила резко расти, а почасовая компенсация застыла. Это почти наверняка означает, что добавленная стоимость начала уходить владельцам капитала, а не обычным работникам.

ИИ усиливает тенденцию: он повышает эффективность, но выгоды могут закрепляться у тех, кто владеет технологиями и инфраструктурой, а не у тех, кто их использует.
👎5👍3🌚2😭21🤔1
✔️ Anthropic выложила датасет из 1250 диалогов.

Проект Anthropic Interviewer - инструмент для автоматизации социологических исследований. Он позволяет проводить глубокие интервью в промышленных масштабах, делегируя роль интервьюера ИИ.

Компания опубликовала результаты первого масштабного эксперимента: массив из 1250 транскриптов бесед. В выборку попали представители массовых профессий, ученые и работники креативных индустрий. ИИ выяснял, как специалисты реально интегрируют нейросети в свои рабочие процессы и как оценивают карьерные риски. Датасет доступен на HuggingFace под лицензией CC-BY.
anthropic.com
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2
🤖 StreamVLN — новый подход к Vision-Language Navigation
github.com/InternRobotics/StreamVLN

Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.

Что делает StreamVLN интересным:

🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов

📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.

Репозиторий: github.com/InternRobotics/StreamVLN
1
🎨 Создание изображений с LongCat-Image

LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.

🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков

📌 GitHub: https://github.com/meituan-longcat/LongCat-Image

#python
👍3🔥21
⚡️ Google DeepMind представила FACTS Benchmark - новый набор тестов для оценки фактической точности LLM.

Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста

- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.

Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.

https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
3
⚡️ Корпоративный рынок LLM: Anthropic выходит в лидеры

Картина рынка за последние два года изменилась радикально.

Главные цифры:
- Anthropic теперь получает около 40% всех корпоративных расходов на LLM. Для сравнения: 24% год назад и всего 12% в 2023
- OpenAI за тот же период потеряла почти половину доли - с 50% в 2023 до 27% сейчас
- Google растет быстрее всех: с 7% в 2023 до 21% в 2025

Что происходит на самом деле:
- Корпоративные клиенты массово перераспределяют бюджеты в пользу Anthropic и Google
- OpenAI теряет доминирование, которое казалось недосягаемым еще два года назад
- Рынок быстро консолидируется: Anthropic, OpenAI и Google вместе занимают 88% корпоративного использования LLM API

Корпоративный ИИ перешел из фазы экспериментов в фазу прагматичного выбора. Побеждают не самые громкие модели, а те, кто дает стабильность, безопасность и предсказуемое качество на больших масштабах.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63👎1
✔️ Financial Times назвала Дженсена Хуанга «Человеком года».

Деловое издание отметило ключевую роль Хуанга в трансформации полупроводниковой индустрии и глобальном распространении ИИ. NVIDIA оказалась в центре беспрецедентной инвестиционной программы частного сектора, что позволило ей первой в мире преодолеть рубеж рыночной капитализации в $5 трлн. и стать самой дорогой компанией на планете.

FT утверждает, что 2025 год войдет в историю как время, когда дата-центры окончательно закрепились в статусе критически важной инфраструктуры. Наращивание вычислительных мощностей для ИИ превратилась в драйвер экономики, обеспечив значительную долю роста ВВП США.
ft.com
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
🧠 Skill Seeker: Автоматизация создания Claude AI навыков

Skill Seeker позволяет быстро преобразовать любую документацию в навыки для Claude AI. Инструмент автоматически извлекает, организует и улучшает контент, создавая готовые к загрузке пакеты. Это экономит время и усилия разработчиков, позволяя им сосредоточиться на более важных задачах.

🚀Основные моменты:
- Автоматический сбор данных с любых сайтов документации
- AI-улучшение для создания качественных справочных материалов
- Поддержка множества языков программирования
- Готовые шаблоны для популярных фреймворков
- Бесплатное локальное улучшение без API-расходов

📌 GitHub: https://github.com/yusufkaraaslan/Skill_Seekers

#python
6🔥2
🚀 Безкодовое будущее с LLM!

Nokode — это веб-сервер без приложения, который использует LLM для обработки запросов. Он демонстрирует, как можно создать CRUD-приложение без написания кода, полагаясь на AI для генерации SQL, HTML и обработки пользовательских отзывов. Несмотря на высокую стоимость и медлительность, проект показывает потенциал AI в управлении логикой приложений.

🚀Основные моменты:
- Полностью безкодовая архитектура.
- Использует LLM для генерации ответов на HTTP-запросы.
- Реализует базовые CRUD-функции.
- Высокая стоимость и медлительность обработки запросов.
- Потенциал для будущих улучшений в производительности.

📌 GitHub: https://github.com/samrolken/nokode

#javascript
3🥱2👍1🤨1
👀 Занимательный подкаст про то, как устроено настоящее образование в ML — и почему оно начинается не с изучения нейросетей, а с матанализа.

Руководитель Школы анализа данных Яндекса Алексей Толстиков в Machine Learning Podcast рассказал, зачем сильным ИИ-специалистам нужен мощный математический фундамент, как в образовании сочетать теорию с актуальными задачами из индустрии и почему топовые специалисты преподают в ШАДе не только ради денег. А ещё он ответил на актуальные вопросы: действительно ли LLM заменят живого ментора и нужно ли отказаться от лекций в пользу практики.

Слушать и ловить образовательные инсайты тут

@bigdatai
5🔥1
🚀 4D Видео Представление с Trace Anything

Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.

🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.

📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything

#python
👍41🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Интересная утечка - Google работает над TorchTPU, секретным проектом, который позволит PyTorch работать нативно на TPU от Google, обходя легендарную привязку NVIDIA к CUDA.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115🔥3
Forwarded from Machinelearning
📌Итоги года от Андрея Карпаты.

2025 год был захватывающим годом для языковых моделей.

Они проявились как новый вид интеллекта, одновременно гораздо более умный и гораздо более глупый, чем я ожидал. Я думаю, что индустрия не реализовала хотя бы 10% их потенциала даже при нынешних возможностях.

Я одновременно верю и в то, что мы увидим быстрый и непрерывный прогресс, и в то, что впереди еще очень много работы.

Пристегнитесь.


🟡Обучение с подкреплением на основе проверяемых вознаграждений (RLVR)

В 2025-м стек обучения LLM дополнился новой ключевой стадией оптимизации по объективным наградам. Он заставляет модели самостоятельно находить стратегии рассуждения.

Прогресс года в том, что создание моделей стало не про увеличение размера модели, а про более длительные RLVR-прогоны.

Это также дало новый рычаг управления: "время размышления" на инференсе. Первопроходец - OpenAI o1, а переломный момент - o3.

🟡Интеллект современных LLM принципиально отличен от человеческого

Интеллект LLM формируется под давлением специфических оптимизаций и на выходе мы имеем резкие всплески способностей в рядом с грубыми ошибками.

Из-за этого бенчмарки теряют смысл: под них напрямую оптимизируются, что не ведёт к созданию AGI.

🟡Cursor - это новый слой LLM-приложений

Это не просто интерфейс к условной модели, а сложная оркестрация работы LLM под конкретные вертикали, c управляемым контекстом, вызовами и интерфейсом.

Cursor создаёт отдельную ценностную прослойку между LLM-лабораториями и конечными пользователями.

🟡Claude Code

В отличие от облачных агентов, он использует ваши данные, контекст и инструменты для ризонинга и вызова инструментов.

Его фишка - в низкой задержке, приватности и глубокой интеграции в рабочее окружение. Это сдвиг от ИИ как «сайта» к напарнику-помощнику в вашей системе.

Я думаю, OpenAI допустили ошибку, сосредоточив свои усилия по созданию агентов в облаке и управляемых из ChatGPT, вместо localhost.


🟡Вайб-кодинг

В 2025 году ИИ преодолел порог, позволяющий через текстовые инструкции создавать работающие программы.

Это демократизирует программирование, позволяя непрофессионалам писать код, а экспертам - быстро прототипировать без глубокого погружения.

Код становится эфемерным, гибким и бесплатным ресурсом.

Забавно, что я придумал термин «вайб-кодинг» в этом твите с мыслями из душа, совершенно не представляя, как далеко это зайдет :)


🟡LLM GUI и Nano banana

Взаимодействие с ИИ через чат - это аналог командной строки 80-х, неудобный для человека.

Будущее за LLM GUI интерфейсом, где ИИ общается визуально (инфографика, анимации, веб-приложения).

Nano banana - ранний пример такого взаимодействия, в ней объединены генерация текста, изображений и общие знания.

Google Gemini Nano banana — одна из самых невероятных, меняющих парадигму моделей 2025 года.


🔜 Читать статью полностью


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2
💰 Список Сэма Альтмана - Как стать миллиардером.

1. Всё начинается с веры и одержимости.
Оптимизм, уверенность и личная вовлечённость запускают любые большие дела.

2. Завершают сильные команды.
Спокойствие + срочность + долгий горизонт важнее мнений «здесь и сейчас».

3. Делай сложное и важное.
Большие идеи мотивируют сильнее, чем лёгкие задачи без смысла.

4. Стимулы — это суперсила.
Неправильные стимулы ломают даже хорошие команды.

5. Фокус решает.
Меньше ставок, но с высокой уверенностью. Удалять лишнее — навык.

6. Результат важнее процесса.
Хороший процесс не оправдывает плохой итог.

7. Люди важнее структуры.
Бюрократия не должна мешать совместной работе.

8. Нанимай медленно, но смело.
Ищи тех, кто реально делает, а не просто умных.

9. Суперзвёзды дают непропорциональный эффект.
Оценивай вклад, а не средний уровень.

10. Быстро итерируйся.
Ошибаться можно — медлить нельзя.

11. Масштаб и экспоненты меняют правила игры.
Рост и накопительный эффект создают магию.

12. Бездействие — скрытый риск.
Время идёт быстрее, чем кажется.

13. Вставай и продолжай.
Упорство решает.

14. Лучшее в работе — люди рядом с тобой.
9🤡7👍6🤣5🔥1
LLaDA2.0 — способ превратить обычные LLM в diffusion-модели без обучения с нуля.

Что делают:
существующую autoregressive модель «перепрошивают» через 3-фазное обучение, сохраняя все знания, но меняя способ генерации текста.

Что это даёт:
- параллельный вывод вместо токен-за-токеном
- выше скорость и эффективность
- лучшее качество на больших масштабах

Результаты:
- LLaDA2.0-mini — 16B
- LLaDA2.0-flash — 100B
Обе модели превосходят предыдущее поколение по качеству и производительности.

Почему это важно:
это шаг к быстрым LLM без главного узкого места autoregressive генерации.

Paper: https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf
HuggingFace: https://hf.co/collections/inclusionAI/llada-20
4👍1🔥1
🚀 Эффективный фреймворк для сетевых приложений на C++23

asyncio — это фреймворк для создания сетевых компонентов с использованием корутин C++20 и событийного цикла libuv. Он упрощает взаимодействие между задачами через каналы, обеспечивая высокую производительность и простоту в использовании.

🚀 Основные моменты:
- Поддержка корутин для асинхронного программирования.
- Использует события libuv для обработки сетевых операций.
- Легкая интеграция с другими библиотеками через vcpkg.

📌 GitHub: https://github.com/Hackerl/asyncio

#cpp
👍2
⚡️ Wan-Move-14B-480P - открытая image-to-video модель, превращающая одну картинку в короткое видео (~5 секунд, 480p) с **контролируемым движением объектов**.

Построена на базе Wan I2V, но расширена motion-контролем через latent trajectory guidance — можно задавать траектории движения на уровне точек и объектов.

Код, веса и MoveBench для оценки качества движения доступны публично (Apache-2.0).
🔹 Подходит для генерации анимаций,, визуализации идей и исследований в области controllable video generation.

https://huggingface.co/Ruihang/Wan-Move-14B-480P
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🤖 Симулятор Интеллектуальных Роботов (IR-SIM)

IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.

🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.

📌 GitHub: https://github.com/hanruihua/ir-sim

#python
👍5