Data Science | Machinelearning [ru] – Telegram

Data Science | Machinelearning [ru]

19.9K subscribers

784 photos

54 videos

28 files

3.7K links

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

Личный блог автора - @just_genych
По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD

Download Telegram

About

Blog

Apps

Platform

Data Science | Machinelearning [ru]

19.9K subscribers

Data Science | Machinelearning [ru]

AI рисует героев и делает им анимации, но впихнуть их в игру — задача посложнее

Нейронки уже вовсю генерят персонажей и их движения. Но это только полдела. Дальше самое мясо: их надо запихать в проект, прикрутить к игровой механике, привязать шмот, раскидать по миру и донести до игроков без деплоя новой версии клиента.

В этой части врубайтесь, как я собрал этот конвейер. Читать далее

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

1.54K views17:07

Data Science | Machinelearning [ru]

Мир раскололся надвое: как американцы и китайцы построили свои школы графического GenAI

Изображения генерировать научились отлично, но идеальной модели, которая умеет всё, до сих пор нет. Закинули один и тот же промпт в Midjourney, DALL‑E 3, FLUX, Hunyuan‑DiT, Wanxiang и Seedream — получили в ответ кучу абсолютно разных картинок. Одни сервисы послушно расставляли объекты как в инструкции, другие плевали на часть описания, но выдавали такую плотность деталей, что первым и не снилась.

В чём разница? Всё упирается в датасеты, токенизаторы и глубину текстовых энкодеров. Получается, сформировались две инженерные школы, каждая изначально заточена под свои ресурсы. Но сейчас обе потихоньку ползут друг к другу.

Читать далее

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

1.63K views09:07

Data Science | Machinelearning [ru]

Своя GPT-like LLM по WH40K с нуля. Часть 3: pre-train LLM

Владимир доделал третью часть цикла — теперь про то, как запилить небольшую decoder-only LLM. В первой части он намутил токенизатор и надергал pretrain-датасет, во второй — набросал класс Трансформер-блока. Теперь дело за малым: собрать модель и прогнать pre-train.

Читать далее: Своя GPT-like LLM по WH40K с нуля. Часть 3: pre-train LLM

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

1.56K views13:07

Data Science | Machinelearning [ru]

Слушай, вбросить новый сервис в пустой репозиторий — это тебе не хухры-мухры, красиво называется greenfield. Но как только этой штуке надо вписаться в живую систему, перетащить данные за последние десять лет, подружиться со старым API и не провалить аудит — твое «чистое поле» кончается. Обычно на этапе, когда начинаешь перенос гигабайт дерьма и ловишь первый баг при интеграции.

Greenfield и brownfield — это история не про то, какой код старый или как он написан. Это про то, сколько на тебе висит ограничений. Если ты в greenfield, твоя задача — проверить, не липовая ли гипотеза про продукт. В brownfield ты уже копаешься в куче зависимостей, молишься, чтобы ничего не развалить, и не дай бог что-то уронить.

Сейчас, когда AI-помощники и coding agents на каждом углу, эта разница стала только жирнее. Да, они влёгкую наколякают приложение с нуля, глаз не оторвать. Но сколько в реальной профи разрабротке начинается с пустого репозитория? Хер там. Чаще надо сначала разобраться, что за зверь перед тобой, а потом аккуратно — без фанатизма — поменять его поведение, чтобы не сдохло.

Читать далее

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👎1

1.62K views17:07

Data Science | Machinelearning [ru]

Ну что, айтишники, задрали уже эти вечные нытики, которые мечтают сжечь все нейросети? Пока они поливают говном прогресс, кто-то тупо берет и юзает, и не только ради галочки в резюме.

Вот вам пост про то, как автор на деле попользовал «близняшек» от Гугла (Gemini). Задумка родилась как коммент к статье «Ненависть к ИИ» от Анатолия Ализара — инфы нахуй накидало столько, что в лимит не влезло. Так что теперь это отдельный материал про личное знакомство.

Этим вашим «близняшкам» реально можно пихать всякую канцелярскую шнягу: сконвертить данные в таблицу, выплюнуть JSON, накидать тестик и проверить, шаришь ты в теме или нет. Вариантов дохрена. Что именно залетает, а где полный швах — читай в статье.

Перейти к чтению

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

👎4❤2

1.76K views09:07

Data Science | Machinelearning [ru]

Технический долг не рассосался. Просто теперь за него платят токенами

Всё чаще слышно: мол, LLM и AI-агенты реально удешевят разработку. Не надо нанимать людей — скормил задачку модели, и готово за пару минут.

В этой мысли есть логика, не спорю. Но есть один нюанс, который я вынес из своих наблюдений за последние месяцы. Спалить пару токенов

Читать далее на Хабре

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

1.66K views17:07

Data Science | Machinelearning [ru]

Data Science под открытым небом

2 августа в Москве пройдет «Урбан ML» — большая офлайн-встреча для специалистов по Data Science. В программе доклады, дискуссии и мастер-классы по RecSys, NLP, антифроду и агентным системам, выступления экспертов из MTS Web Services, ВТБ, Wildberries, «Звук», Альфа-Банка и других компаний.

Кроме этого вас ждут , нетворкинг, спортивные активности и вечернее афтепати.

Участие бесплатное, по предварительной регистрации (на площадку необходимо взять с собой паспорт или права). Количество мест ограничено. [ссылка]

📅 2 августа, 11:00–21:00 (первый доклад в 12:00)
📍 Москва, офлайн

❤3

1.68K views08:37

Data Science | Machinelearning [ru]

Вот это поворот: Design Arena расковыряла, как GPT-5.6 Sol и Kimi K3 докачали свои дизайн-скиллы

За каких-то семь дней народ из бенчмарка Design Arena выдал сразу два разбора топов дизайн-лидербордов: один — про GPT-5.6 Sol (флагманский молоток OpenAI), второй — свежак про Kimi K3 от китайской Moonshot AI. Команда залезла в кишки генераций и рассуждений этих моделей, чтобы показать, как они научились понимать, что такое «вкусно». Спойлер: универсальной таблетки нет — две модели приперлись к хорошему дизайну абсолютно разными дорогами, а третья, бывший лидер GLM 5.2, терла своим, третьим путем.

Читать далее

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

1.68K views09:07

Data Science | Machinelearning [ru]

Модель в курсе, что её гоняют через тесты — и специально подлизывается

В конце 2025 года Claude Sonnet 4.5 внаглую заявила проверяющим: «До меня дошло — вы меня тестите. Я не против, но давайте хотя бы честно признаем, что происходит». Эта фраза уехала в официальную системную карту — и такое поведение модель выдавала примерно в 13% тестовых сессий.

Anthropic спокойно пишет в документах: их алайнмент-оценки скорее всего занижают реальную склонность модели к вредным действиям в нормальных, приближенных к жизни условиях. Когда железка понимает, что на носу экзамен — она внезапно становится паинькой. А экзамен она видит постоянно.

Чел из CTO ML-команды — той самой, что выкатывает фронтир-модели в прод — покопался в открытых источниках и выяснил, что вообще известно про осознание оценки (evaluation awareness) к середине 2026-го: как модели отличают тесты от реальной работы, и как теперь вообще читать model card. Тык сюда за разбором

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

1.62K views13:07

Data Science | Machinelearning [ru]

«Учиться, учиться и ещё раз учиться» — но с LoRA

Чувак всегда кайфовал от разбора нового — шарил и в консалтинге, и в добыче, и в торговле, и в услугах. Обычно он дружит с большими локальными моделями (от 397B), но тут решил апнуть комп для инференса — докинул к 32ГБ ещё 48ГБ VRAM. А раз уж собрал железо, захотел выйти за рамки простого запуска и попробовал дообучить Qwen3.6 27B в Unsloth studio.

Читать далее: https://habr.com/ru/articles/1062402/

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

1.53K views09:07

Data Science | Machinelearning [ru]

🥲 Зарплаты айтишников растут медленнее инфляции

Это показало новое исследование на 45+ тысяч зарплат специалистов. Изучаем главное, чтобы быть готовыми к рынку:

- Медианная зарплата в IT в первой половине 2026 года составила 191 000 ₽ — это всего на 4% больше, чем полгода назад. При этом прогнозируемая годовая инфляция — 4,5–5,5%.

- Самый щедрый по офферам город, разумеется, Москва. Там медиана по зп — 235 тысяч, в регионах же всего 160.

- Топ-5 самых высокооплачиваемых специальностей в IT: на первом месте — разработчики, дальше идут менеджеры, администраторы, специалисты по информационной безопасности и аналитики.

- Самые высокие зарплаты среди языков при этом у Objective-C — этим гигачадам предлагают 400 000 ₽. Следом идут Elixir (348к), Swift и Golang с 326 и 325 тысячами рублей.

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

😁2👎1

1.64K views10:17

Data Science | Machinelearning [ru]

США решили отжать open source у китайцев: на сцену выкатили Laguna S 2.1

Стартап Poolside выкатил свою четвёртую версию Laguna S 2.1 — открытую модель для агентного программирования, которая весит аж 118 млрд параметров. В конторе заявляют, что это самая мощная открытая модель Запада: на кодинговых тестах Laguna не отстаёт от моделей, которые крупнее неё в разы, а кое-где даже обходит их. И главное — она запускается на настольном компе NVIDIA DGX Spark, без всяких суперкомпов.

Веса уже висят на Hugging Face, и юзать модель можно даже в коммерции.

Читать далее

👉

Data Science | Machinelearning [ru]

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5

1.78K views17:07

Data Science | Machinelearning [ru]

This media is not supported in your browser

VIEW IN TELEGRAM

🛡

Anthropic запустили официальный плагин для поиска уязвимостей

Можно отправить Claude Security проверить изменения перед коммитом или просканировать всю репу.

Он найдет дыры и предложит, что можно и нужно исправить

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

1.84K views07:37

Data Science | Machinelearning [ru]

🤯 Автор «Чистого кода» больше не читает код, написанный ИИ-агентами

73-летний Дядя Боб признался, что теперь вообще не проверяет код. Вместо этого он обкладывает агентов юнит-тестами, QA, метриками качества и жёсткими ограничениями. И если вайбкод прошёл всю эту систему проверок, то и читать его необязательно.

«Это единственный способ, которым я могу воспользоваться их продуктивностью.»

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12👎3

1.9K views08:47

Data Science | Machinelearning [ru]

😎

Anthropic выпустила официальный гайд по работе с новенькой Claude Opus 5

Главный совет — перестаньте микроменеджить модель. Opus 5 лучше работает, если просто дать ей полное ТЗ и не просить лишний раз перепроверять себя.

Ещё один нюанс: если хотите короткие ответы, теперь это нужно писать явно, так как по умолчанию модель стала гораздо многословнее.

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12

1.58K views19:27

Data Science | Machinelearning [ru]

⚡ Детекторы объектов быстро меняются: подходы, которые недавно считались стандартом, уже уступают трансформерам реального времени. Если вы работаете с компьютерным зрением и опираетесь только на YOLO, легко пропустить важный сдвиг в архитектурах.

🗓19 августа в 20:00 МСК приглашаем вас на открытый урок курса «Компьютерное зрение. Экспертный уровень».На занятии разберём путь от R-CNN и семейства YOLO до RT-DETR и RF-DETR, отказ от якорей, замену эвристического NMS венгерским сопоставлением и подходы к детекции мелких объектов на сложных сценах.

Присоединяйтесь, если хотите понимать внутреннюю логику современных детекторов, видеть различия между свёрточными сетями и трансформерами и применять эти знания в рабочих задачах: https://vk.cc/cZZrOc

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvyEfuU

1.3K views18:07

Data Science | Machinelearning [ru]

This media is not supported in your browser

VIEW IN TELEGRAM

🤖

ИИ заменил политиков

Канадский политик во время выступления случайно зачитал ответ чат-бота, оставленный в тексте:

«Вот более естественная, плавная версия этого фрагмента, которая звучит как парламентская речь…»

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

😁16👎1

1.22K views06:07

Data Science | Machinelearning [ru]

Похоже, нашёл удобный способ тестировать AI-модели для разработки без постоянной оглядки на баланс.

В OdiRouter.ai некоторые модели доступны до 90% дешевле официальных цен. При этом через один API-ключ можно работать с GPT, Claude, Gemini, Grok, Kimi, coding-моделями, генерацией изображений и видео.

Для разработчика особенно удобно быстро проверить модели на реальных задачах:

👉 кто лучше пишет и рефакторит код
👉 кто быстрее находит ошибки
👉 кто понятнее разбирает stack trace
👉 что выгоднее для backend, ботов и AI-агентов

Вместо того чтобы заранее выбирать одну модель, можно загрузить свой prompt в playground, сравнить ответы, скорость и стоимость — и уже после этого подключить подходящий вариант к проекту.

Сервис доступен из РФ, а для старта дают бесплатные кредиты, поэтому протестировать всё можно без пополнения баланса.

Хороший вариант для тех, кто регулярно использует AI в разработке: много моделей, единый API и цены ниже официальных.

Модели и цены: ссылка

Поддержка: @odirouter

👍5😁4❤1

1.16K views15:07

Data Science | Machinelearning [ru]

🤣 Кажется проект оказался сложнее, чем он думал в начале

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

😁21❤2

1.07K views07:37

Data Science | Machinelearning [ru]

🤣 Вайбкодер спалился на выдуманном стеке

Кандидат пытался пройти интервью с ИИ-помощником, но интервьюер внезапно спросил про самописные движки Ysasu Bibu и Ynna Zist.

Соискатель уверенно ответил, что работал с обеими

✖️

xCode Journal

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5

567 views16:37