Дата канальи — про «специалистов» в данных / ML / AI
5.51K subscribers
216 photos
7 videos
12 files
200 links
Корпжиза аналитиков и DS. Если хотите анонимно поделиться историей на широкий круг -- го в личку @NikitaZelinskiy, аналогично по остальным вопросам
Download Telegram
Forwarded from ODS #jobs
Classic ML инженер
от 120 000 ₽/месяц
Офис, Фултайм

Привет! Мы — продуктовая команда сервисного маркетинга в СОГАЗе, которая помогает бизнесу находить наилучшие предложения для клиентов, максимизируя их ценность (CLTV). Наши решения основаны на персонализированных ML-моделях, которые анализируют поведение пользователей и автоматически подбирают оптимальные условия...(читать далее)
🤡45😁132
так и рисуются продающие презентации в корпорациях 🤣
😁4
Евротранс продает бананы...

Коллеги инвесторы.

Надеюсь никто в здравом уме такое не держит в долгосрочном портфеле.
Будьте аккуратны.
1😁21
#кейсы #корпжиза

Про корпоративные конфликты

Жили-были два соседних и близких по функционалу департамента. Назовем их А и Б.
Был у департаментов курирующий топ, назовем его «ПетрПетрович».
В департаменте Б есть управления Ба и Бб
И тут начальника департамента Б увольняют.

Кем заменить? Три кандидата:
◦ Зам начальника департамента А
◦ Начальник управления Ба
◦ Начальник управления Бб

Вы в камень-ножницы-бумага играли? 🙌
Вот также и эта троица — каждый против двух других и никто не может одержать верх. 🦢🦞🦈 (кэп: акула изображает щуку)

В такой ситуации «ПетрПетрович» принимает решение нанять кого-то, кто вроде бы немного со всеми тремя по чуть-чуть работал и ни с кем не поругался 😅. Назовем нового руководителя Новорук.

В итоге департамент Б «пропал с радаров» — амбициозных инициатив, которые бы дисраптили бизнес-модель или хотя бы были достойны обсуждения на борде — нет, зато со всеми смежниками мир 🕊

С этими словами Новорука и уволили спустя пару лет.

Итого, случилась корпоративная классика: наняли за бесконфликтность — уволили за бесхребетность🤷‍♂️

PS: В личку пришло несколько знакомых из разных организаций с вопросом "не их ли конторы я описал?" -- значит, ситуация не такая уж и редкая
4😁3411🔥6
#кейсы #корпжиза

не могу удержаться 🤷‍♂️ от токсичного комментария что 7 кругов собеседования инженеров и полугодовые ревью с увольнениями 10% лоу-перформеров сработали ожидаемо 😁😁😁

PS побуду кэпом: в таких условиях более выигрышная стратегия готовиться к собеседованиям в другие компании (и пробовать их проходить) чтобы иметь оффер в случае очередного лэй-оффа, чем овертаймить и тащить проект, от которого висты все равно достанутся канальям.

PPS кстати, вспомнил кейс, скоро напишу
1😁21🔥62😢1🙉1
Forwarded from Банки, деньги, два офшора
This media is not supported in your browser
VIEW IN TELEGRAM
Марк Цукерберг на презентации новых умных очков не смог принять звонок 4 раза подряд. @bankrollo
27🤪2
Тренировки по ML возвращаются

2️⃣7️⃣ сентября состоится первая в этом учебном году тренировка по машинному обучению ❤️

Что будет на встрече:
⚪️мы познакомимся с Kaggle
⚪️разберём первую задачу
⚪️расскажем о программе тренировок

📢 Спикер: Александр Киреев, DS Team Lead МТС, 27 медалей Kaggle

📆 Когда: 27 сентября с 11:10
🗺️ Где: Покровский бульвар, 11, ауд. R503

Подробнее про челленджи 🐭

Студентам других вузов необходимо заполнить форму для заказа пропуска не позднее чем за 24 часа до дня проведения тренировок, по организационным вопросам вы можете обращаться к Александре ▶️

#анонсы #студенты #ии
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥14👍54👏1
#ML

В первый день RecSys все воркшопы битком.

Самые именитые исследователи, крутые инженеры, призеры соревнований из Сбера и ex-Яндекса, сильные доклады, сложный комбайны архитектур.

В решающий момент вспомнил что я-таки ближе к канальям и пошел в полупустой зал где хоть что-то понятное для нашего брата: 12th Joint Workshop on Interfaces and Human Decision Making for Recommender Systems.

Здесь доклады слабо похожи на технические, в которых куча экспериментов и ablation study, доверительные интервалы, оговорки о том что результаты верны именно на этих датасетах именно при таком протоколе валидации, и все прочее что вызывает доверие исследователей.

Вот эти восемь докладов (точнее, статей, по которым доклады):

https://ceur-ws.org/Vol-4027/paper1.pdf
https://ceur-ws.org/Vol-4027/paper2.pdf
https://ceur-ws.org/Vol-4027/paper3.pdf
https://ceur-ws.org/Vol-4027/paper4.pdf
https://ceur-ws.org/Vol-4027/paper5.pdf
https://ceur-ws.org/Vol-4027/paper6.pdf
https://ceur-ws.org/Vol-4027/paper7.pdf
https://ceur-ws.org/Vol-4027/paper8.pdf


Зато идеи меня порадовали (оставим в стороне llm для интерпретации рекомендаций), попробую поделиться:

Если загрузить скриншот рекомендательной системы в ChatGPT и задать правильные вопросы — можно получить ценный фидбек по интерфейсу.

Если пользователю дать ручки / ползунки для настройки рекомендаций, и еще и сигналов больше логировать, то результат будет гораздо лучше чем бесконечно тюнить модели.

Дать возможность пользователю не только рейтинг проставлять, но весь арсенал смайликов в качестве фидбека — полезно.

Serendipity можно выкрутить на максимум сохраняя точность, если модель поддержать еще и интерфейсом (в статье блоком «удиви меня» — все совпадение со сберовской платформой AmazeMe случайные)

Общая мысль: хватит бороться за 0.0001 прироста метрик моделями, они ограничены шумом в самих данных. Грамотный интерфейс и выстроенное взаимодействие с пользователем могут дать гораздо больше в плане бизнеса.

И еще одна мысль:

Групповые рекомендации сейчас нигде в индустрии не применяются (цитата в докладе по статье), хотя два доклада из восьми были про них (второй), однако заставило задуматься над известной цитатой

Лучшие умы занимаются рекламой, а могли бы космос покорять


Так вот, представить киберпанк, в котором групповые генеративные рекомендации формируют политическую волю электората — мягко говоря, несложно. И тот кто обладает такой компетенцией — будет Урфином нашим Джюсом.
2🔥238🤣32👍1
#кейсы #ML

Про каналий, рекомендашки и рисеч // навеяно конфой.

Есть у меня хороший друг, который в 2010-2015 работал в Yahoo! Labs таким обычным Research Engineer

Кто не помнит Yahoo! — это такой был «конкурент» гугла, сейчас благополучно издыхает, и поделом.
И вот история увольнения Хаима из Yahoo! Research

Под Research канальи понимают обычно что-то с немедленным возвратом на инвестиции, бо «очень кушать хочется», поэтому рисеч лабе поставили задачу за 9 мес разработать онлайн-рекомендации для Yahoo! Таким образом, чтобы рекомендации рекламы приносили не менее 1 млн долларов в день.

Это сейчас много материалов и успешных кейсов, у джунов на собесах спрашивают ML System Design, а в качестве материалов для подготовки советуют «пересмотреть всего Бабушкина». А в 2014м, еще и на масштабах Web это был серьезный инженерный челлендж.

За несколько месяцев, с постоянными овертаймами, корпоративными приколами и регулярными «get things done» достаточно маститая команда местных инженеров с задачей справилась и приготовилась встречать каналий из HQ Yahoo!, предвкушая огромные бонусы почет и уважение.

И бонусы действительно были — но для местных манагеров.

А вот команда инженеров получила бесценный приз:

белые футболки. И кроме логотипа Yahoo! там примерно 24м шрифтом было напечатано:

10^6


PS: в этот момент Хаим дал зарок больше никогда не работать в корпорациях и вот уже второй десяток лет стартапит
2😁30👍14🔥83🥴1
#кейсы #ML

Если вы думаете что квадратно-гнездовые бывшие сотрудники силовых ведомств — костяк кибербезы только в корпорациях в СНГ, вы глубоко заблуждаетесь 😆

На RecSys многие авторы на свои постеры и / или презентации лепят QR-коды, ведущие на страницу с просидингами, например.

Что будет, если несколько сотен человек с одного WiFi (с самой конференции) туда побегут? 🤔

Верно, правило кибербезы посчитает это DDoS-атакой и заблочит IP-адрес конфы 🤦‍♂️.

Конфа же проходит в непредсказуемые даты и часы, а провайдер WiFi на площадке был заранее неизвестен 😝 (классическое коммунальное -- зима в декабре настала абсолютно непредсказуемо)  

Ох уж эти некомпетентные дармоеды, которым лишь бы запретить и заблокировать! Сколько мы с вами потратили часов чтобы с чувством несомненного интеллектуального превосходства объяснить им, недалеким, что эмбеддинги абсолютно безопасны и по эмбеддингу никто не восстановит исходный объект 🧐.

Так вот, внезапно правы оказались они! Хоть и частично:

На reproducibility треке парни перепроверили способность восстанавливать из текстовых эмбеддингов исходный текст.

Мб чуйка? А мб и правда шарят? Это что же, придется к ним нормально относиться? Да ну, бред какой 🤣🤣😅

Хорошо что кибербезы не читают ни статей ни мой канал 🤣
3😁244🐳2👻2
лайфхак -- если напечатать постер на габардине, то не нужен тубус. А делать абстракт мелким белым шрифтом на темно-синем фоне -- не лучшая затея, будем исправляться
Forwarded from Red RecSys
Никита с Сашей сегодня презентуют нашу статью на RecSys'25 в Праге.

А я смотрю на фото.

Радуюсь, что мы добрались до уверенного "Accept" в треке Late-Breaking Results. Переписывали статью в 4-страничный формат за 3 дня перед дедлайном, после реджекта на другом треке. Справились)

Если буду ещё публиковаться - надо всё-таки добираться до конференций.
227👍8❤‍🔥7🦄6🐳2
Раз вы хотите фоточек, то вот вам.

Кирилл уже упоминал что команда Сбера взяла второе место на RecSysChallenge 2025, и привел ссылку на разбор их решения.

Но чего в том посте не хватило -- ссылки на канал лидера команды -- Алексея Васильева, что я c удовольствием исправляю
1🔥278❤‍🔥2🌭1
# вакансия в RecSys

Туториалы последнего дня RecSys неожиданно совсем не порадовали:
Длиннющая лекция про квантовые вычислители и кубиты
⁃ Скучная лекция про мультиагентные системы в рекомендациях (ну как такое можно было сделать скучным?)
⁃ Гуманитарная секция с громким названием «Beyond Algorithms» про то что в других специальностях (у маркетологов, врачей и прочих) есть свои конференции по рекомендательным системам, и там они как-то без математики и моделей обходятся.

Оттого и пришлось посетить интеллектуальный клуб, а три дня после заниматься просмотром шпилей, нагуливая аппетит.

Аппетит пришел как всегда во время просмотра материалов конфы — в нашей рекомендательной платформе многое нужно прилично так доработать, и текущая команда для этого уже мала.

Поэтому нужен рукастый мидл с желанием поразбираться с современными подходами и написать пайпы для прода, желание писать статьи на конфы не обязательно — следующий RecSys (а то и два) в Штатах, ехать еще дальше -- но если будет результат (принятая статья) то поможем чем сможем.

Формальное описание вакансии
А резюме Тане
🔥107👍5