Нескучный Data Science
11.9K subscribers
313 photos
17 videos
1 file
181 links
Нюансы работы в Data Science, о которых ты не узнаешь в школе
👨‍💻 Managing AI Director, Sber @smirnovevgeny
https://www.linkedin.com/in/smirnov-evgeny/

По вопросам сотрудничества @datascience_assist

Регистрации в Роскомнадзор № 5278866657
Download Telegram
D >< Vision митап по Computer Vision

🤔 Чувствуете, что крутые разработки в Computer Vision остаются в тени других популярных тем в ИИ? Что на многих конференциях CV-секции зачастую не соответствуют вашим интересам и возникающим на работе задачам? Мы — тоже.

💪 MWS AI (МТС) и VisionLabs проведут митап, цель которого – объединить и поддержать сообщество, глубоко увлечённое Computer Vision. Мы сознательно делаем фокус на CV, чтобы подчеркнуть его непреходящую важность и уникальные исследовательские задачи. И рассматриваем Computer Vision во всей его широте — и discriminative, и generative, и multimodal подходы.

👉 Регистрируйтесь на митап и участвуйте очно или подключайтесь в формате онлайн.
5🔥117👍3👏1
📊 Датасеты для студентов и исследователей

🤓 Скоро начнётся новый учебный год. Это значит, что всё больше студентов будут осваивать анализ данных.
Одна из самых частых проблем на старте — банально нет данных для практики. Об этом мне не раз жаловались преподаватели курсов по Data Science.
Помню, как в студенчестве я анализировал гигабайты данных одной крупной компании с помощью BigARTM, а мой однокурсник — коллекцию из десятка русских сказок. Как думаете, чей опыт оказался более релевантным для работы в бигтехе? 😉


Мы решили помочь студентам и преподавателям: собрали в одном месте наши открытые анонимизированные датасеты из соревнований по анализу данных.
Их можно использовать в курсовых, дипломах, научных статьях или просто для оттачивания навыков, например, после курса DL in Finance.

💪 Уверен, что умение работать с реальными (пусть и обфусцированными) гигабайтами данных во время учёбы — это конкурентное преимущество, которое оценят работодатели в вашем резюме.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2813👍11🙈1
Forwarded from BigData Team (BDT)
🇰🇿 Сделано в Казахстане — для всего мира

BigData Team — это международная команда экспертов, работавших в Amazon AWS, Samsung, Yandex, Ebay.

Мы создаём IT-образование мирового уровня здесь, в Казахстане, с грантовой поддержкой Tech Orda и Astana Hub. История началась шесть лет назад, когда мы начали обучать в Казахстане ведущих специалистов в сфере Big Data и Machine Learning.

🔥А сегодня открываем набор на 36 международных грантов с поддержкой наших партнеров, чтобы к нашим слушателям из Казахстана присоединились коллеги со всего мира.

🇰🇿 Если вы из Казахстана
— гранты Tech Orda покрывают более 50% обучения
подробности и инструкции, успейте до конца августа!

🌍 Если вы из другой страны
— 32 международных гранта с покрытием 50% (950 $)
— 4 гранта с покрытием 100% (1 900 $)

📚 8 месяцев обучения:
— общая база по Python, промышленной разработке, Big Data и ML
— в конце — твой выбор трека: Big Data Engineer или Machine Learning Engineer
— 10–20 часов в неделю, онлайн, с менторами и проектами

📅 Дедлайны международных грантов:
— I волна — до 24 августа, 23:59
— II волна — до 31 августа, 23:59
— III волна — до 7 сентября, 23:59

🤝 И да, мы ждём участников минимум из 5 стран — так что зовите друзей, коллег и бывших однокурсников.

📌 Как подать заявку на международный грант
1️⃣ Зарегистрируйтесь и пройдите тестирование на платформе Learn BDT💻:
— откройте разделы grant, grant extended, grant profile и CV
 — выполните все тесты и загрузите резюме
2️⃣ Ждите результаты на почту — и подпишитесь на наш Telegram, чтобы не пропустить новости

Заполняйте заявку на грант и подавайтесь до ближайшего дедлайна (вот тут объяснили почему раньше — лучше).
Удачи! 🍀

BigData Team: the way you learn best
Py4BDA | Python | Machine Learning | Big Data | BD/ML Engineer

#study #BDMLE #BigDataTeam
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥129🤣6👍4
Где искать настоящий аплифт от ИИ?

С появлением генеративного ИИ многие испугались: «Всё, он заберёт нашу работу».
И да, это действительно похоже на промышленную революцию — только не на заводах, а в сфере услуг и творческих профессиях. Однако не все так плохо, если вы знакомы с термином - блендинг.

Когда вы используете ИИ, на самом деле вы блендите: 🧠 ваш естественный интеллект и 🤖 искусственный интеллект. Размер аплифта зависит от того, насколько они «ортогональны». Если вы уже пишете отличный код и подключаете ИИ для подсказок — получите прирост скорости и качества. Но это будет скорее «чуть-чуть лучше». ИИ здесь просто закрывает последнюю милю оптимизации — вы пройдете последнюю милю по повышению эффективности подобно тому, как Лаборатория внедрила нейронные сети в кредитный скоринг.

Прорывные продукты появляются тогда, когда удаётся объединить экспертизу из двух (или более) довольно ортогональных сфер. Ваша задача — взять область, где вы сами эксперт, и добавить к ней одну или несколько областей, где роль эксперта может взять на себя ИИ. Такой бленд и даёт дизрапт аплифт, а не косметический апгрейд.

Кажется, мысль простая. Так почему же мы не видим вокруг сплошных сверхрезультатов?
Потому что ЕИ нужно взять на себя роль продакта: решить, как собрать ансамбль, как запустить А/Б-тесты и настроить мониторинг качество. В такой схеме всегда есть риск «переобучения», особенно учитывая сверхожидания у ЕИ относительно возможностей ИИ и незнание ЖЦМ.

Но у меня для вас хорошие новости: у дата-сайентистов самые высокие шансы строить такие ансамбли. Просто потому что у нас уже есть экспертиза в блендинге моделей.

Так что жду от подписчиков не просто pet-проекты, а дизрапт продукты с ИИ 🚀
🔥26👍75❤‍🔥1
🚀 Как с помощью аналитики влиять на бизнес: опыт и практика на Data Driven

20 сентября в Москве пройдёт Data Driven — конференция для тех, кто хочет не просто строить дашборды, а реально двигать метрики и влиять на решения.

Что будет:
- два трека: для продуктовых и DS, а также для инженеров и BI
– доклады про то, как с помощью аналитики искать точки роста
– дискуссии и прямое общение с экспертами, включая C-level
– карьерные консультации для тех, кто думает про следующий шаг

А ещё 🎲 квизы, квесты с реальными кейсами и розыгрыш ценных призов, среди которых станция с Алисой и радиоуправляемый робот.

Ну и, конечно, 🎉 афтепати: фуршет, музыка и разговоры «без графиков и p-value».

📍 Оффлайн в Москве + онлайн-трансляция для тех, кто далеко.
👉 Регистрация тут
🔥8👍54😁1
Когда я приходил в Альфу шесть лет назад, у меня была простая цель — делать крутые вещи с топ-технологиями в реальной, прагматичной среде. В итоге, мы внедрили кучу фундаментальных изменений, их признали не только внутри компании, но и за её пределами (часть из них вы уже видели в этом канале). Однако, этот пост не про самолюбование.

Подобные истории без описания трудностей не только скучные, но и неправдоподобные, поэтому расскажу с чего мы начинали и какие трудности встречали на пути:
– слабый HR-бренд;
– нет бюджета на перекупку «звёздной» команды;
– политика «берём только синьоров по стажу»;
– купленные у вендоров решения мешают растить компетенции;
– инфраструктура для внедрения нейронок отсутствует;
– формальные процессы, которые замедляют работу;
- саботаж на протяжении нескольких лет к внедрению эффективных решений;
- карьерный рост за лакейство, вместо результатов.

К сожалению, не все удалось решить, но разруливание и существование в режиме ограничений стало значимым фактором роста всех членов команды.
С козырями все могут играть, а вы попробуйте играть теми картами, что на руках.
Выплыть помогли правильный майндсет и культура, впитанная на заре становления Тинькофф. С их помощью родилась и была реализована стратегия из трёх частей: продукт, HR и PR — все они связаны.

В следующих постах я расскажу, как это работало и что из этого может пригодиться вам.
🔥6117👍14👎5🤣5😱3😁2
Продуктовая стратегия Лаборатории

1️⃣ Решаем только те задачи, которые приносят реальный профит компании.
У коммерческой компании, в отличие от исследовательского института, есть акционеры. И эти акционеры ждут возврата инвестиций — в том числе на твою зарплату — в кратном размере. Если ROI нет, ресурсы уходят в другие направления, а в сложные времена — просто сокращаются. Поэтому команда должна решать не те задачи, которые “интересные” или “хочет компания”, а те, которые максимизируют матожидание измеримого результата. И уметь отбиваться от идей, которые точно не дадут эффекта — это тоже часть профессионализма.

2️⃣ Находим и продаём бизнесу задачи, а потом быстро внедряем их в прод.
Если менеджеры не знают, как монетизировать данные — ничего страшного, это нормально. Нужно идти к ним самим: изучать процессы, искать, где ML реально может помочь. Дальше — быстрый пилот, простая метрика, и объяснение результата в понятных терминах, чаще всего — через финансовый эффект. После этого важно не терять момент и как можно скорее внедриться в прод. Если инфраструктура не готова — поддерживать процесс на своей стороне, пока не появится возможность перенести. Иногда внедрение приходится буквально продавить — но если есть измеримый эффект, у бизнеса просто не останется аргументов.

3️⃣ Масштабируем решения и переиспользуем накопленную экспертизу.
Каждый бизнес-сегмент уникален, но типовые задачи везде примерно одни и те же. Большинство монетизируемых кейсов — это просто классификация: бинарная или многоклассовая. Решил задачу для одной бизнес-линии — почти наверняка сможешь применить решение в другой. Сделал PD-модель — построишь и склонность, и отток. Научился классифицировать тексты трансформером — сможешь классифицировать и транзакции. Главное — не начинать каждый проект с нуля, а превращать опыт в масштабируемую экспертизу.

4️⃣ Используем новые подходы для работы с моделями и данными.
Когда ML уже встроен в ключевые процессы, ценность приносит не “ещё одна модель”, а новые подходы:новые источники данных, более продвинутые методы, автоматизация пайплайнов. С таким подходом рост идёт за счёт эффективности — быстрее, дешевле, надёжнее.

В итоге 95% моделей, которые мы разрабатывали, были внедрены в бизнес-процессы. Почти все задачи — сгенерированы внутри команды и “проданы” бизнесу, что отображало нашу функцию лидера, а не сервиса. Иногда приходилось ждать по два года, иногда — буквально заставлять внедрять. Нейронные сети в кредитном скоринге мы вывели в прод первыми в России, потом перенесли на другие бизнес-линии, а позже автоматизировали их разработку в сервисе ANNA. Из этого опыта вырос центр компетенций по NLP.

🤔 Каждый пункт стратегии — это ответ на три простых вопроса: что мы делаем, чего не делаем сейчас, как и куда двигаемся дальше.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍416🔥3
HR-стратегия Лаборатории

Ключевая проблема найма опытного топ-специалиста заключается в том, что он уже нашёл себе отличное место работы, и вы вряд ли сможете его перекупить. В таком случае отличная стратегия — растить мат. ожидание за счёт числа попыток, надеясь на то, что вы сможете заинтересовать его задачей или его ровно сейчас отпугнули на текущем месте работы.

1️⃣ Нанимаем по хардам — софты растим внутри. Применение софтов на линейных позициях необходимо на порядок в меньший промежуток времени, и поэтому их недостаток проще закрыть руководителю, чем отсутствие хардов. Как показала практика моей команды, софты можно успешно развивать у любого технаря. Именно по этой причине я всегда отдам предпочтение джуну с прокаченным хардам, а не «синьору» с умением складно оправдываться за отсутствие результата.

2️⃣ Найм — задача руководителя, а не HR. Ответственность за качество и укомплектованность команды нужно брать на себя. Любая ошибка найма перекроет время, потраченное на проактивный поиск с необходимым CIR.

3️⃣Нанимаем только тех, кто хочет приносить пользу компании, а не удовлетворять свой научный интерес. Наша профессия содержит много пространства для исследований, но большая часть из них не приносит практического результата и оптимизирует сотые доли процента на синтетических датасетах. Многие эксперименты не нужно проводить, если у вас есть теоретическая база, которая может оценить масштаб ожидаемого эффекта. Нередко желание проводить такие эскперименты, говорит о недостаточном количестве практики на этапе обучения и для этого являения у меня даже есть целый термин.
Нейросетевой недотрах — огромное желание обучить нейроночку, которая не нужна или избыточна для решения бизнес-задачи.

4️⃣ Не ограничиваем скорость роста формальными временными рамками. Если вы вкладываетесь в рост софт-навыков, то ваша команда становится очень конкурентной на открытом рынке, и джун сможет продать себя за синьора и даже CDSа (знаю такой случай). В таком случае важно вовремя проводить апгрейд грейда согласно скорости достижения определённого уровня, а не за выслугу лет. В противном случае вы повысите мат. ожидание поиска топ-специалиста у конкурентов.

5️⃣Привлекаем таланты за счет HR-бренда и сарафанного радио. Время потраченное на выступления на конференциях, запущенные курсы, ведение личного блога и другие публичные активности существенно окупается скоростью найма за счет улучшения релевантности входного потока. Повышенная удовлетворенность команды включает сарафанное радио и приводит к аналогичному результату.

6️⃣ Работаем со студентами и стажерами. Большинство топ-специалистов, которых вы хотите сейчас нанять были когда-то студентами технических вузов. Сейчас вы смотрите на них и мечтаете чтобы они стали членами вашей команды, но вы упускаете большой поток студентов, которые еще не стали звездами и вам не поздно вырастить их внутри, если вы сами когда-то были настоящими синьорами.

📸 Глава Лаборатории машинного обучения в окружении джунов и миддлов, май 2022.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4016👍9👎2🤔1🙈1
PR-стратегия Лаборатории

В этом посте расскажу о ключевых элементах стратегии, которые помогли построить бренд команды — как внутри компании, так и за ее пределами.

1️⃣ Каждый член команды может стать ее амбассадором. Замыкание публичных активностей на руководителе приводит, во-первых, к неэффективному использованию его времени, а во-вторых, к потере качества — вряд ли кто-то расскажет лучше ключевого разработчика.
Отдельно горжусь тем, что удалось сменить парадигму, по которой выступать на внутренних и внешних мероприятиях могли только сотрудники нужного грейда. Самый яркий пример — выступление стажера перед коллегой на девять грейдов выше, которое стало пререквизитом для появления новой функции.
2️⃣ Подготовка к выступлениям нативно встроена в процесс работы команды. Очень сложно заставить себя и команду подготовить презентацию на двадцать слайдов на конференцию по неизвестной теме. Сильно проще — взять рабочие презентации, вычистить из них конфиденциальную информацию и обкатать на внутренней аудитории.
Эти сценарии отделяет регулярная работа: регулярные презентации бизнес-заказчикам, питчинг на внутренних синках и доработка материалов по обратной связи.
На самом деле выступление на внешней конференции не сильно отличается от внутренней презентации, и работа над обоими направлениями усиливает каждое из них.
3️⃣ Мотивируем и помогаем развивать скиллы у каждого члена команды. Чтобы из «нулевого рассказчика» сделать «опытного спикера», нужно просто вместе с ним прогнать презентацию пять раз. Побеждать в соревнованиях вдвойне приятно, если компания при этом платит премию в размере месячного оклада.

4️⃣ Распространяем контент во всех каналах коммуникации. Бизнес работает с клиентами через все возможные каналы, чтобы увеличить число касаний и охватить разные сегменты аудитории. В развитии HR-бренда нужно использовать те же принципы: адаптировать контент под конференции, статьи, подкасты, обучающие курсы и посты в телеграме.
Один директор по маркетингу сказал, что хорошая реклама должна заебать. В этом есть доля правды — ведь вы выберете известный бренд, если не разбираетесь в качестве товара.
📖 Хотите прокачаться в написании ёмких и понятных текстов?
Рекомендую книгу «Пиши, сокращай 2025: как создавать сильный текст» — Максим Ильяхов и Людмила Сарычева.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍188🔥6
Как связаны продуктовая, HR и PR стратегии?

Стратегия отвечает на вопросы — что мы делаем и что не делаем. Если её элементы противоречат друг другу, стратегия, скорее всего, не работает: становится непонятно, как двигаться и к чему стремиться.
В Лаборатории стратегия строилась на культурном базисе, поэтому все её элементы были взаимосвязаны. Посмотрим на это на примерах.

Продукт HR
1. Когда вы нанимаете сильную команду, ориентированную на исследования и научный интерес, — фокус только на бизнес-вэлью приводит к внутреннему конфликту.
2. Если в команде не развиты софт-скиллы и навык презентации, то продвигать бизнес-задачи и «продавать» правильные решения становится затруднительно.
3. Когда вы нанимаете людей с сильными софтами, но без хардов, — использовать продвинутые методы моделирования не получится.
4. Если команда не видит личной выгоды и карьерного роста, бизнес-ориентация воспринимается формально и не закрепляется в поведении.
5. Быстрый карьерный рост в коммерческой компании возможен только тогда, когда продвинутые решения из теоретических рассуждений доезжают в прод.

HR PR
1. Слабый HR-бренд ведёт к трудностям с наймом топ-команды, особенно если вы не можете конкурировать зарплатами.
2. Если профессиональное сообщество не уважает хард-скиллы вашей команды, то и сильный HR-бренд построить не выйдет.

PR Продукт
1. Внутренние выступления теряют смысл, если команда не участвует в развитии продукта.
2. Курсы, конференции и другие активности вызывают интерес у аудитории лишь тогда, когда за ними стоят реальные выдающиеся достижения — научные или бизнесовые.

Продукт HR PR
С возрастом у специалистов становится меньше времени и энергии для прорывных проектов и публичных выступлений, тогда как у студентов и стажёров, стремящихся к карьере, эти ресурсы есть. Поэтому именно они становятся естественным драйвером развития продукта, бренда и культуры компании.

🔜 В следующем посте поговорим про личные стратегии
🔥17👍108
Farewell, Альфа-Банк ❤️

Настало время поговорить о личных стратегиях — теперь это гораздо проще, ведь вы уже немного лучше понимаете стратегию и культуру, на основе которых строилась Лаборатория. Я убеждён, что в профессиональном плане важно всегда находиться там, где твои сильные стороны используются на максимум. Как вы, наверное, уже поняли, настал момент и для меня двигаться к новым вызовам — о которых расскажу в следующих постах. А пока — время подвести итоги и искренне пожелать удачи Альфа-Банку.

Начну с последнего. Альфа-Банк за последние 6 лет достиг весомых результатов, закрыл многие гэпы — и, как бывшему фанату Тинькофф, мне приходится это признавать даже в личных разговорах с близкими. Я искренне рад за Альфу и желаю не сбавлять оборотов.

Мы прошли с Альфой долгий путь. За это время удалось многое изменить и заложить крепкий фундамент для будущих поколений.
Лаборатория выросла — от одного дата-сайентиста до управления порядка сорока талантливых специалистов. Каждый появился не случайно: мы находили точки роста бизнеса, убеждали стейкхолдеров и успешно защищали ресурсы. Можно с уверенностью сказать, что все амбициозные и успешные внутренние проекты по применению нейронных сетей были придуманы внутри Лаборатории.

Особенно приятно, что наши достижения отмечены пятью внутренними «Оскарами» — и каждый из них стал возможен благодаря нейронным сетям и нашей проактивной позиции. Сегодня Лаборатория машинного обучения — это бренд в сообществе дата-сайентистов, сопоставимый с Яндексом, Тинькофф и другими компаниями, куда стремятся попасть специалисты. Молодые таланты идут туда за культурой и ценностями, которые мы транслируем внутри и вовне.
И всё это получилось, потому что мы любой ценой отстаивали интересы Акционеров, Клиентов и Команды. Вот этим я по-настоящему буду гордиться.

Хочу сказать огромное спасибо каждому члену нашей команды — за ваш выбор и вклад. Ведь перед каждым из вас открыты двери практически любой компании. Отдельное спасибо маркетингу, рискам, финансам и всем, кто был с нами первопроходцем на пути внедрения прорывных решений.

Закончу этот блок следующим напоминанием:
Тяжёлые времена рождают сильных людей, сильные люди создают лёгкие времена. Лёгкие времена рождают слабых людей. Слабые люди создают тяжёлые времена.

Мой последний рабочий день в Альфе был чуть больше двух месяцев назад.
👉 Я уже освоился на новом месте, и начинаю активный найм в новую команду - налетайте на вакансию.

P.S. Элементы стратегии и культуры на новом месте практически не изменятся 😉
43👍18😱12🔥11❤‍🔥4
Быстрее, умнее, точнее

VK запустил RecSys Challenge — соревнование по разработке алгоритмов рекомендаций.
Участникам предстоит решить одну из самых сложных проблем рекомендательных систем: предсказать, кому зайдёт ролик, который никто ещё не видел.

В основе датасет VK-LSVD:
40 млрд взаимодействий
20 млн роликов

Формат:
Студенты, исследователи, ML-инженеры — welcome
Призовой фонд — 2 500 000 рублей 💸

Читайте подробнее и регистрируйтесь до 15 декабря на сайте соревнования.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥146👎6👍4
Привет! На связи команда МТС True Tech Talents. Мы запускаем набор на 4 поток Школы аналитиков данных🥚

Обучение проходит в онлайн-формате и длится 10 месяцев. Преподаватели — эксперты нашего центра Big Data. Вы научитесь писать на Python, прокачаетесь в математике, основах машинного обучения, ML Ops, Spark и прочих вещах, без которых не выйдет работать в Data Science. Также у студентов будет возможность попасть на стажировку в МТС Web Services.

Обучение бесплатное, но места ограничены - чтобы попасть, необходимо подать заявку до 30 октября и выполнить вступительное задание. Старт обучения - 10 ноября!

Регистрируйся по ссылке, ждём тебя!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👍1😁1
Про корпоративные конфликты

Жили-были два соседних и близких по функционалу департамента. Назовем их А и Б.
Был у департаментов курирующий топ, назовем его «ПетрПетрович».
В департаменте Б есть управления Ба и Бб
И тут начальника департамента Б увольняют.

Кем заменить? Три кандидата:
◦ Зам начальника департамента А
◦ Начальник управления Ба
◦ Начальник управления Бб

Вы в камень-ножницы-бумага играли? 🙌
Вот также и эта троица — каждый против двух других и никто не может одержать верх. 🦢🦞🦈 (кэп: акула изображает щуку)

В такой ситуации «ПетрПетрович» принимает решение нанять кого-то, кто вроде бы немного со всеми тремя по чуть-чуть работал и ни с кем не поругался 😅. Назовем нового руководителя Новорук.

В итоге департамент Б «пропал с радаров» — амбициозных инициатив, которые бы дисраптили бизнес-модель или хотя бы были достойны обсуждения на борде — нет, зато со всеми смежниками мир 🕊

С этими словами Новорука и уволили спустя пару лет.

Итого, случилась корпоративная классика: наняли за бесконфликтность — уволили за бесхребетность🤷‍♂️

PS: В личку пришло несколько знакомых из разных организаций с вопросом "не их ли конторы я описал?" -- значит, ситуация не такая уж и редкая
😁32👍127🤔3💯1😎1
Для многих разработчиков моменты, когда они пишут код не по работе, а для профессионального вызова, становятся ключевыми в их росте. Именно таким вызовом может стать Yandex Cup 2025 — чемпионат, где встречаются сильнейшие разработчики, и один из треков которого посвящён машинному обучению.

Здесь реальные задачи, близкие к тому, с чем сталкиваются инженеры в продакшне: ограничения по ресурсам, шумные данные, необходимость найти баланс между скоростью и качеством.Участие — способ не просто проверить свои навыки, но и заявить о себе в профессиональном сообществе. Лучшие участники получают приглашения на упрощённый отбор в команды Яндекса.
Финал пройдёт в Стамбуле, призовой фонд — 12 млн ₽.

Регистрация заканчивается совсем скоро. Если вы чувствуете, что готовы выйти за пределы привычных задач — самое время.

💡 yandex.ru/cup/2025
🔥137😁4👍2🗿1
Forwarded from Silero News
Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России и СНГ

0️⃣ Популярные языки из 🇷🇺🇺🇦🇺🇿🇰🇿🇦🇿🇹🇯🇧🇾🇬🇪🇰🇬🇦🇲;
1️⃣ Всего 20 языков России и стран СНГ, всего 95 голосов;
2️⃣ Модели компактные и быстрые, как наши прошлые релизы;
3️⃣ Поддержка SSML, генерация аудио с SR 8000, 24000, 48000;
4️⃣ Два типа моделей - base под лицензией MIT на наших данных и ext на данных сообщества;
5️⃣ Остались непокрытыми языки Дагестана и ЧР, если хотите помочь с добавлением этих языков пишите на @silero_job.

⭐️Репозиторий - github.com/snakers4/silero-models
⬆️Статья на Хабре - habr.com/ru/articles/968988/
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍6🔥4👎2
⚡️Всем привет! 28 ноября в 10:00 приходите на конференцию AI Driver & RecSys!

На ней соберутся эксперты топовых российских IT-компаний (Сбер, T-банк, Яндекс, VK, MTS, Lamoda и др.) и вузов, чтобы обсудить будущее рекомендаций.

Что ждёт участников:
🔘Обсудим актуальные тренды и развитие рекомендательных систем
🔘Новейшие исследования в области RecSys
🔘Практические кейсы
🔘Доклады про новые открытые рекомендательные датасеты
🔘 Живое общение с профессиональным сообществом

➡️Блок Индустриальные доклады и тренды в RecSys:
Тренды RecSys

🔘Быстрый и надежный онлайн-инференс в проде: практические советы
🔘Эволюция similar-рекомендаций: как мы переосмыслили ленту похожих товаров
🔘Эволюция контентного трансформера для рекомендаций в E-com
🔘Доклад по статье SIGIR 2025 “SMMR: sampling-based MMR reranking for faster, more diverse and balanced recommendations and retrieval”
🔘Как мы улучшили музыкальные рекомендации с помощью многоруких бандитов

➡️Блок Рекомендации на последовательностях
🔘Доклад по статье ACM RecSys 2025 “Let it go? Not quite: addressing item cold start in sequential reccomendations with content-based initialization”
🔘Доклад по статье ACM RecSys 2025 “Correcting the LogQ correction: revisiting sampled softmax for large-scale retrieval”
🔘Доклад по статье ACM RecSys 2025 “Time to split: exploring data splitting strategies for offline evaluation of sequential reccomendations”
🔘eSASRec: улучшаем бейзлайн трансформенных рекомендаций

➡️Блок Эмбеддинги и векторные представления
🔘О том, как просто учитывать и немного сложнее изучать геометрию, в том числе в рекомендательных системах
🔘LM4ES: Обучение представлений пользователей из последовательностей событий с помощью LLM
🔘Быстрый инференс в графовых рекомендательных системах
🔘RecSys Challenge 2025: Обзор соревнования и наше решение

➡️Блок Open Source Датасеты
🔘Доклад о новом датасете “Yambda-5B – A large scale multi-modal dataset for ranking and retrieval”
🔘Доклад о новом датасете T-ECD (T-Tech E-commerce cross-domain dataset)
🔘Доклад о новом датасете VK-LSVD
🔘Доклад о датасете MBD


📆 28 ноября, 10:00
📍Сбер, Кутузовский пр-т, 32

➡️Регистрация по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥186🤔3👍1👎1💯1
30 ноября участвую как эксперт на карьерном митапе от self, сообщества для поддержки айтишников.

Будет доклад от CEO self о том, как выжить на рынке труда в нынешних условиях.

А я, вместе с остальными экспертами, буду в качестве ментора отвечать на вопросы участников о том, как строить карьеру.

Можно спрашивать и про харды, про софты. И в целом задавать вопросы на любую карьерную тему.

Помимо
доклада и общения с менторами вас ждет организованный нетворкинг, где вы сможете познакомиться с интересными людьми.

Время и место
🔴30 ноября, с 15:00 до 21:00
🔴Poklonka Place, корпус Е1 Поклонная ул. 3

Подробности и билеты на лендинге!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍107😁1