Анализ данных (Data analysis)

Статья Step-DeepResearch где показано, что даже 32B-модель может делать по-настоящему глубокие исследования при очень низкой стоимости инференса.

📊 На бенчмарке ResearchRubrics модель получает 61.42, а полный отчет стоит меньше 0,50 RMB.

Идея проста: большинство агентов ведут себя как поисковики. Они собирают факты, но не превращают их в проверенный, связный отчет.

Здесь исследование понимается как длинный цикл: понять реальную задачу - составить план - искать источники - сравнивать и проверять - исправлять ошибки - писать отчет.

🧩 Цикл разбили на 4 базовых навыка:
• планирование
• поиск информации
• рефлексия и проверка
• написание отчета

Данные собирали из реальных отчетов, восстанавливая исходные вопросы и планы, а также из вопросов, связанных с базами знаний и документами.

⚙️ Обучение шло в 3 этапа:
1) сначала обучают базовым навыкам
2) затем учат полным цепочкам с инструментами
3) далее добавляют обучение через попытки и проверку, где чек-лист оценивает отчет и награда дается только за полностью пройденный результат

📌 Авторы также представили ADR-Bench, где эксперты сравнивают два отчета бок о бок, а рейтинг строится по системе Elo.

https://arxiv.org/pdf/2512.20491

❤18👍5🔥5

4.45K views06:33

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Эрик Шмидт (ex-CEO Google): «Всё, чему я учился годами: теперь делает ИИ»

Эрик Шмидт рассказал, что его молодость прошла за кодом: в 20 лет он писал программы днём и ночью: в колледже и аспирантуре и именно это построило его карьеру.

Сегодня всё иначе:

«Каждый из вас носит в кармане суперкомпьютер и суперпрограммиста.»

По словам Шмидта, теперь ИИ способен выполнять всё то, чему он учился годами.
Это не про «конец программирования», а про то, что правила игры меняются.

Выигрывать будут те, кто не сопротивляется, а учится работать вместе с ИИ, как с инструментом, который усиливает человека.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍45❤7🥱6🔥3🤔1

5.02K views06:00

Анализ данных (Data analysis)

Южная Корея обвинила 10 человек, включая экс-топов Samsung, в утечке секретов DRAM в Китай 🏭🇰🇷➡️🇨🇳

Прокуратура утверждает, что группа передала Китаю производственные секреты Samsung по 10-нм DRAM, которые попали к ChangXin Memory Technologies (CXMT).

10-нм DRAM (Dynamic Random Access Memory) - это динамическая память с произвольным доступом следующего поколения, где «10 нм» указывает на технологический процесс уменьшения размеров транзисторов и ячеек памяти, позволяющий упаковать больше памяти на кристалл, повышая плотность и энергоэффективность.

DRAM производится через сотни строго упорядоченных шагов.

Небольшое отклонение - и хорошая пластина становится браком.

По версии следствия:

- сотрудник компании переписывал процесс вручную, обходя цифровой контроль
- заметки использовали, чтобы восстановить и адаптировать процесс под оборудование CXMT
- дело также затрагивает попытки получить технологии SK hynix через подрядчика

Сообщается, что 5 фигурантов арестованы, остальные проходят без задержания (обвинения по закону о защите промышленных технологий).

Ущерб Samsung оценивается в $7–13 млрд.

На создание такой памяти обычно уходят годы и приходится множество неудачных запусков.

news.yahoo.co.jp/articles/f2f6b69b1ba1395c51a0538a1b24328f776254de

1❤10🔥6😐4👍1🥰1

4.6K views17:01

Анализ данных (Data analysis)

👨‍🎓 Harvard выложил в открытый доступ учебник по ML-системам и это редкий случай, когда материал действительно полезный.

В учебнике показан полный цикл: от понимания основ до построения продакшн-систем, которые можно запускать в реальном мире.

Что в книге и почему она стоит внимания:

- вы самостоятельно собираете autograd, оптимизаторы, attention и мини-PyTorch — чтобы увидеть, как устроены фреймворки изнутри

- разбираетесь в базах: батчи, архитектуры, процесс обучения
- учитесь оптимизировать производительность: работать с ускорителями, бенчмарками и настраивать модели

📚 То есть это не вводная книжка, а полноценный roadmap от теории к продакшну.

📌Репозиторий: https://github.com/harvard-edge/cs249r_book
📌PDF: https://mlsysbook.ai/assets/downloads/Machine-Learning-Systems.pdf

🔥34👍13❤5🙏2

6.7K viewsedited 05:35

Анализ данных (Data analysis)

🇨🇳 Китайские техногиганты устраивают охоту за ИИ-талантами

Крупные компании резко поднимают бонусы и зарплаты, чтобы никто не уходил к конкурентам.

ByteDance увеличивает бонусы на 35% и закладывает на пересмотр зарплат +150%. Вилки доходов расширяют по всем уровням - рынок перегревается.

Tencent активно переманивает специалистов: по сообщениям, отдельные оферы доходят до 2x от текущих зарплат. Плюс в компании появился новый главный AI-учёныйБ бывший исследователь OpenAI Яо Шунью.

Инженеры, которые умеют строить и поддерживать системы обучения и инференса LLM, на вес золота. Маленькая команда может тормозить целые продуктовые направления.

Внутри Tencent усиливают AI-инфраструктуру: распределённое обучение, масштабное развёртывание моделей, большие данные и ML-пайплайны.

И цифры это подтверждают: индекс новых вакансий по ИИ на платформе Maimai вырос на 543% за 2025 год.

Китай делает ставку на ИИ.

scmp.com/tech/tech-trends/article/3338168/chinas-tech-giants-offer-lavish-year-end-bonuses-amid-ai-talent-war

❤14🔥6👍3

4.37K views07:03

Анализ данных (Data analysis)

🙂

Tongyi Lab, похоже, вот-вот выпустит Qwen-Image-Edit-2512

Вчера, на просторах сети Х, Tongyi Lab запостила тизер "новогоднего подарка, который уже в пути".

Так как все очень сильно и давно ждут Z-Image Base и Edit и Omni, сверхразумы Redditа пошли разгадывать таинственный пост.

Розыскную бригаду собирать не пришлось - новинку спойлернул gemini-code-assist в репозитории Modelscope : это будет qwen-image-2512

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍2🥰2

3.82K views09:20

Анализ данных (Data analysis)

Forwarded from Machinelearning

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

🎄🎄 Qwen-Image: обновление как раз к Новому году

Свежая версия Qwen-Image получила заметный апгрейд качества.

Модель стала генерировать намного реалистичнее и аккуратнее, особенно в сложных сценах.

Что изменилось:

• более естественные генерации людей, меньше «искусственного» эффекта
• детальнее лица и мимика
• улучшены натуральные текстуры: вода, шерсть, материалы, пейзажи
• намного аккуратнее текст на картинках: лучше верстка и точность в композиции

Модель прошла более 10 000 слепых сравнений на AI Arena и показала результат уровня топов среди open-source, оставаясь конкурентной даже рядом с закрытыми решениями.

▪Qwen Chat: https://chat.qwen.ai/?inputFeature=t2i
▪Hugging Face: https://huggingface.co/Qwen/Qwen-Image-2512
▪ModelScope: https://modelscope.ai/models/Qwen/Qwen-Image-2512
▪GitHub: https://github.com/QwenLM/Qwen-Image
▪Блог: https://qwen.ai/blog?id=qwen-image-2512
▪Демо HF: https://huggingface.co/spaces/Qwen/Qwen-Image-2512
▪Демо ModelScope: https://modelscope.cn/aigc/imageGeneration
▪API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=group-qwen-image-max

@ai_machinelearning_big_data

#qwen #qwenimage #openaimodels #imagemodels

❤5🔥3👍2

3.06K views09:26

Анализ данных (Data analysis)

💰

Цены на видеокарты в 2026 году могут резко подпрыгнуть и снова причина в памяти.

Сообщается, что уже в начале года AMD может поднять цены (январь), а Nvidia подтянется в феврале. И эти подорожания могут тянуться месяцами.

Причина проста: память стала главным элементом себестоимости. В среднем она занимает до 80% BOM у видеокарт, а её стоимость к Q2 2026 может вырасти ещё на 40%.

ИИ разогрел рынок настолько, что 64 ГБ DDR5 подорожали с $150 до $500 меньше чем за два месяца. В 2025 году производителей спасали фиксированные контракты на поставку памяти, они сглаживали скачки VRAM. Теперь контракты заканчиваются, и рост DRAM/GDDR напрямую попадает в себестоимость.

В итоге доля «чип GPU + VRAM» может подбираться к тем же 80% стоимости платы.

По утечкам, флагманские RTX 5090 в 2026 году могут добраться до ценника около $5000 - главным образом из-за огромного спроса со стороны индустрии ИИ.

Ждать «чудесных скидок» по видеокартам в ближайшее время не стоит.

Источник: wccftech .com/amd-and-nvidia-are-expected-to-hike-gpu-prices-early-2026/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🔥2

4.51K views08:03

Анализ данных (Data analysis)

🐳

DeepSeek начал новый год с серьёзной статьи.

В первый день года команда представила работу, посвящённую одной из самых болезненных проблем современных нейросетей: нестабильности обучения в сложных архитектурах.

И предложили решение: подход под названием mHC (Manifold-Constrained Hyper-Connections).

Смысл в том, что исследователи взяли мощную, но нестабильную архитектуру Hyper-Connections и ввели ограничения на внутренние связи.

1. Проекция на многообразие (manifold)
Вместо того, чтобы оставлять Hyper-Connections свободными, mHC накладывает на них ограничение, они проектируются на особое многообразие (матрицы с особыми свойствами).
Это восстанавливает identity-mapping, благодаря чему сигнал остаётся устойчивым даже через десятки или сотни слоёв.

2. Стабильность и масштабируемость
Благодаря этому ограничению сеть перестаёт «взрывать» или «затухать» сигнал при глубоком обучении, и её можно эффективно использовать в больших моделях без ухудшения качества и без сложных ухищрений.

3. Инфраструктурные оптимизации
Авторы также добавили инженерные улучшения:
- слияние ядер (kernel fusion)
- уменьшение накладных расходов по памяти
- эффекты смешанной точности
Это делает mHC быстрым и эффективным в реальных задачах даже при масштабных тренировках.

Результат впечатляет:

• обучение становится стабильнее на крупных масштабах
• модели лучше масштабируются
• повышается производительность
• снижается потребление памяти
• mHC обгоняет классические Hyper-Connections

Другими словами, DeepSeek показывает, что путь в будущее - не только большие модели, но и архитектуры, которые устойчивы изнутри.

#AI #DeepSeek #MachineLearning #NeuralNetworks #Research

https://arxiv.org/abs/2512.24880

https://www.youtube.com/watch?v=gT-0Qryi5KA

Please open Telegram to view this post

VIEW IN TELEGRAM

👍28❤12🔥4

4.11K viewsedited 14:38

Анализ данных (Data analysis)

OpenAI готовит новую аудио-модель в связке с собственным аудио-устройством.

OpenAI активно развивает свои технологии голосового ИИ, готовя платформу для будущего персонального устройства с упором на голосовой интерфейс, релиз которого ожидается примерно через год.

Внутренние команды уже объединены, а новая архитектура голосовой модели должна выйти в первом квартале 2026 года.

Что уже известно по ранним результатам:

• нас ждет более естественная и эмоциональная речь
• мгновенный ответа
• понимание мгновенных перебиваний

Все это критически важно для голосового ассистента, который не просто отвечает на вопросы, а активно взаимодействует и помогает пользователю в повседневной жизни.

https://www.theinformation.com/articles/openai-ramps-audio-ai-efforts-ahead-device

#AI #OpenAI #VoiceAI #Innovation #Future

❤7👍3🔥3

4.17K views16:22

Анализ данных (Data analysis)

🇨🇳 IQuest-Coder: Новая open-source модель для Кодинга, которая превосходит Claude Sonnet 4.5 и GPT-5.1 - и это модель всего 40B параметров.

На бенчмарках IQuest-Coder выглядит внушительно:

SWE-Bench Verified — 81.4%
BigCodeBench — 49.9%
LiveCodeBench v6 — 81.1%

Проект поддерживает хедж-фонд UBIQUANT, который уже много лет активно развивает ИИ
(команды AILab, DataLab, Waterdrop Lab).

Контекст до 128K токенов.

https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct

👍18🔥12❤7🤔3😐2

4.03K views05:35

Анализ данных (Data analysis)

🎥 КК ИИ-слоп теперь влияет на политические решения

В Польше заявляют, что в TikTok завирусилист сгенерированные ИИ ролики, убеждающие молодёжь поддержать выход страны из ЕС, так называемый “Polexit”.

Польское правительство просит ЕС открыть расследование против TikTok по линии Digital Services Act.

По их словам, ролики выглядят как организованная кампания.

Особенность таких видео в том, что:

• ИИ создаёт реалистичных “говорящих людей”
• сценарии можно быстро менять
• таргетинг идёт точечно, например, на аудиторию 15–25 лет
• масштабирование происходит автоматически

То есть за короткое время можно запустить сотни убедительных роликов, создающих ощущение «органичного мнения общества», хотя за ними может стоять один оператор.

Вопросы, которые теперь обсуждают в ЕС:

• как отличать реальных людей от ИИ-персонажей
• кто несёт ответственность за массовую манипуляцию
• как соцсети должны реагировать на такие кампании

ИИ меняет не только технологии, он начинает менять и общественные дискуссии.

notesfrompoland.com/2025/12/31/poland-calls-for-eu-action-against-ai-generated-tiktok-videos-calling-for-polexit/

❤17👍12🤣7🔥3🤔1😱1

4.08K viewsedited 13:11

Анализ данных (Data analysis)

✔️

Meta лихорадит: Янн ЛеКун резко прошёлся по Александру Вану и намекнул на новые проблему Meta.

Янн ЛеКун публично раскритиковал нового лидера AI-направления Александра Вана, назвав его «неопытным» и подчеркнув, что у него нет понимания, как устроены настоящие исследования и что вообще нужно исследовать

«Он быстро учится, он знает, чего не знает…
Но у него нет опыта в исследованиях - как их вести, как строить процессы и что действительно важно для учёных», - сказал ЛеКун.

По сути - это прямой удар по новой стратегии Meta в AI.

И всё больше разговоров о том, что компанию могут ждать новые увольнения и уходы ключевых специалистов.

Code Red для Meta?
Похоже, внутри компании начинается серьёзный пересмотр курса.

https://www.businessinsider.com/yann-lecun-alexandr-wang-criticism-inexperienced-meta-ai-future-2026-1

*Принадлежит Meta, которая признана экстремистской организацией и запрещена в РФ.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10🤔7👍4❤3

3.56K views07:05

Анализ данных (Data analysis)

⚡️ Разные ответы ChatGPT и Grok на политически сложный вопрос

Обе модели спросили- было ли преступлением, если бы Трамп арестовал Мадуро (вопрос, который сегодня обсуждается очень активно).

Ответ ChatGPT - «да»
— исходит из предположения, что Мадуро был избран легитимно
— опирается на Устав ООН и мнение «международных экспертов»
— чувствуется анти-американский уклон в формулировках

По тону это звучит почти как лекция юриста-либерала из Ivy League.

Ответ Grok - «нет»
— называет режим Мадуро мошенническим
— объясняет полномочия президента США как главнокомандующего
и право направлять военных на исполнение федеральных ордеров

Чтобы не выдавали модели, всегланужно проверять источники, сравнивать аргументы и не принимать выводы ИИ «на веру».

https://x.com/ArthurMacwaters/status/2007727857242689560/photo/1

❤16🤣14👍7🔥3😐2

3.35K viewsedited 13:29

Анализ данных (Data analysis)

⚡️ Google показала интересный пример того, как мультимодели уже помогают в гуманитарных исследованиях.

Gemini 3.0 Pro смогла расшифровать загадочные пометки в «Нюрнбергской хронике», которым более 500 лет. В модель залили сканы страниц и попросили не просто переписать текст, а объяснить, что означают заметки с учетом контекста.

Оказалось, что круговые таблицы на полях были попыткой примирить две конкурирующие библейские хронологии и вычислить год рождения Авраама.

Сложность состояла в том, что заметки смешивали латинские сокращения, римские цифры и обрывки надписей.

Gemini связала вычисления с системой датировки Anno Mundi (год от сотворения мира), привязала их к традициям Септуагинты и еврейской Библии, а затем перевела в «до н.э.», получив расхождение примерно в 100 лет.

siliconangle. com/2026/01/01/googles-gemini-3-0-pro-helps-solve-long-standing-mystery-nuremberg-chronicle/

👍22❤7🔥4

1.77K views08:02

About

Blog

Apps

Platform