Задача со звездочкой
Недавно попалась супер сложная задача — помочь клиенту (сервис графического дизайна, аналог Canva) разработать алгоритм для улучшения дизайна документа (это может быть слайд, инфографика, изображение карточки товара и т.д.). Над подобной задачей трудятся несколько отделов в Сбере, Adobe, Microsoft, пару десятков старт-апов и теперь … мы
Чего хочется: чтобы алгоритм на входе получал текущий пользовательский док и по кнопке AI Magic превращал его в “красивый” дизайн. Причем не только эстетично расставлял text box-ы по холсту, но добавлял иконки, картинки, справлял и дописывал текст, применял модный шрифт и т.д.
Из огромных плюсов: есть довольно большая база (неск. десятков тысяч) документов, созданных дизайнерами.
Сложности:
- нечеткая постановка бизнес-задачи (а точно нужно работать с контентом? можно ли не заниматься добавлением картинок?)
- непонятно, какими метриками определять “красивый” дизайн
- как вообще построить дизайн ML эксперимента (что это?! классификация / генерация / оптимизация?)
- несколько месяцев клиент экспериментировал, но без особого успеха и результатов — сети не учатся, лосс не сходится
Спустя месяц работ, где мы сейчас:
- сформулировали гипотезу
- придумали пару дизайнов ML решения (пишите идеи в комменты, знатоки)
- смогли таки почистить данные (хитрая кластеризация тех самых профессиональных дизайнов)
- научились рендерить выходы от моделей
- получили первые baseline модели, которые уже сходятся (!) и даже генерируют осмысленные выходы (!!) (пример на фото)
- модель довольно умело расставляет основные изображения и заголовки, но все еще “слепляет” остальные элементы
Далее в планах очередной цикл переосмысления бизнес-задачи (вводные от бизнеса / продукта), генерация новых идей и куча новых экспериментов, как иначе
Недавно попалась супер сложная задача — помочь клиенту (сервис графического дизайна, аналог Canva) разработать алгоритм для улучшения дизайна документа (это может быть слайд, инфографика, изображение карточки товара и т.д.). Над подобной задачей трудятся несколько отделов в Сбере, Adobe, Microsoft, пару десятков старт-апов и теперь … мы
Чего хочется: чтобы алгоритм на входе получал текущий пользовательский док и по кнопке AI Magic превращал его в “красивый” дизайн. Причем не только эстетично расставлял text box-ы по холсту, но добавлял иконки, картинки, справлял и дописывал текст, применял модный шрифт и т.д.
Из огромных плюсов: есть довольно большая база (неск. десятков тысяч) документов, созданных дизайнерами.
Сложности:
- нечеткая постановка бизнес-задачи (а точно нужно работать с контентом? можно ли не заниматься добавлением картинок?)
- непонятно, какими метриками определять “красивый” дизайн
- как вообще построить дизайн ML эксперимента (что это?! классификация / генерация / оптимизация?)
- несколько месяцев клиент экспериментировал, но без особого успеха и результатов — сети не учатся, лосс не сходится
Спустя месяц работ, где мы сейчас:
- сформулировали гипотезу
- придумали пару дизайнов ML решения (пишите идеи в комменты, знатоки)
- смогли таки почистить данные (хитрая кластеризация тех самых профессиональных дизайнов)
- научились рендерить выходы от моделей
- получили первые baseline модели, которые уже сходятся (!) и даже генерируют осмысленные выходы (!!) (пример на фото)
- модель довольно умело расставляет основные изображения и заголовки, но все еще “слепляет” остальные элементы
Далее в планах очередной цикл переосмысления бизнес-задачи (вводные от бизнеса / продукта), генерация новых идей и куча новых экспериментов, как иначе
Так а давайте узнаем сколько человек у нас знает ответ на этот вопрос? Поймем кто шарит поглубже так сказать) Ставь пальцы вверх, если знаешь или вниз, если нет)
"Что будет когда умножишь вектор строку на вектор столбец?"
"Что будет когда умножишь вектор строку на вектор столбец?"
А давайте о каком-нибудь кейсе нашем расскажем на трансляции и со стороны технички и со стороны бизнеса.
Можете сами выбрать)
Можете сами выбрать)
Anonymous Poll
26%
Как мы делали умную корзину для сортировки мусора
21%
Разбор банковской выписки для сталеллитейного завода
43%
Система сопоставления резюме и вакансий для Сбера
43%
Оценка объемов ввозимой древесины на целлюлозно-бумажный комбинат
Ребят, мы сейчас отбираем самые крутые каналы по AI где будем поститься, где авторы – реальные технические специалисты и пишут сами.
Чтобы вот контент был, когда заходишь и обычному человеку стало не очень понятно о чем речь, зато разрабу было интересно читать)
И выбираем именно практиков, вот сейчас в @ai_newz разместились. Там автор, например, Артем Staff Research Scientist в Meta Generative AI контрибьюдит в текст2видео модель Movie Gen.
И прям оттуда крутые чуваки на нас подписались – лиды, разрабы, продукт-овнеры и ентерпренеры по AI) В общем очень рады, что вы теперь с нами❤️)
Чтобы вот контент был, когда заходишь и обычному человеку стало не очень понятно о чем речь, зато разрабу было интересно читать)
И выбираем именно практиков, вот сейчас в @ai_newz разместились. Там автор, например, Артем Staff Research Scientist в Meta Generative AI контрибьюдит в текст2видео модель Movie Gen.
И прям оттуда крутые чуваки на нас подписались – лиды, разрабы, продукт-овнеры и ентерпренеры по AI) В общем очень рады, что вы теперь с нами❤️)
Пускай вы выбрали проект для Сбера по резюмешкам (он обошел на 1 процент), но нам хочется рассказать во вторник в 16-00 об оценке объема древесины) Приходите на трансляцию тут в тг)
Продолжаем рассказывать в каких каналах постимся, потому что сами их читаем и хотим подписчиков оттуда на наш канал)
Вот мы любим длиннопосты, чтобы сесть и читать 10 абзацев про ML/DS и поэтому читаем “Бориса опять”. Он Staff MLE в eBay и пишет про то как делал CV для вертикальных ферм в живом формате дневника, сделал методичку по поиску работы https://btseytlin.github.io/intro.html и сам по ней ищет проекты поинтереснее, да и книгу пишет про ИИ научпоп, хотя можно просто смерджить все посты и книга получится.
В общем привет, ребята, из “Бориса опять” целых 284 человека)
Вот мы любим длиннопосты, чтобы сесть и читать 10 абзацев про ML/DS и поэтому читаем “Бориса опять”. Он Staff MLE в eBay и пишет про то как делал CV для вертикальных ферм в живом формате дневника, сделал методичку по поиску работы https://btseytlin.github.io/intro.html и сам по ней ищет проекты поинтереснее, да и книгу пишет про ИИ научпоп, хотя можно просто смерджить все посты и книга получится.
В общем привет, ребята, из “Бориса опять” целых 284 человека)
This media is not supported in your browser
VIEW IN TELEGRAM
А сегодня в 16-00 стрим об оценке объемов древесины с помощью CV)
Вот вам видео с комбината морозного солнечного)
Вот вам видео с комбината морозного солнечного)
Оценка объема древесины — стартанули трансляцию) Приходите, комменты и вопросы тут)
Написали текстом кейс о расчете объема древесины) Лайк с вас на висишке)
https://vc.ru/u/3808598-yaroslav-shmulev/1642629-privet-ya-yaroslav-i-hochu-rasskazat-kak-proizvodili-podschet-obema-drevesiny-s-pomoshyu-computer-vision
https://vc.ru/u/3808598-yaroslav-shmulev/1642629-privet-ya-yaroslav-i-hochu-rasskazat-kak-proizvodili-podschet-obema-drevesiny-s-pomoshyu-computer-vision
Ребят, а мы запустили подкаст)
Будем звать самых крутых ребят из AI)
И сегодня у нас — Аня Подображных! Топ-3 продукт-менеджеров России и по нашему мнению топ-1 в AI!
На подкасте обсудили:
- Как избежать ошибок и плохих советов от банковского ии-ассистента?
- Как ведет себя детский финансовый ии-помощник?
- Что делать если сотрудники не хотят внедрять ИИ из-за угрозы увольнения?
—
у нас со звуком не оч, зато у Ани все супер, а мы ее пришли слушать)))
https://www.youtube.com/watch?v=nGT9M_xv_0g&feature=youtu.be
Будем звать самых крутых ребят из AI)
И сегодня у нас — Аня Подображных! Топ-3 продукт-менеджеров России и по нашему мнению топ-1 в AI!
На подкасте обсудили:
- Как избежать ошибок и плохих советов от банковского ии-ассистента?
- Как ведет себя детский финансовый ии-помощник?
- Что делать если сотрудники не хотят внедрять ИИ из-за угрозы увольнения?
—
у нас со звуком не оч, зато у Ани все супер, а мы ее пришли слушать)))
https://www.youtube.com/watch?v=nGT9M_xv_0g&feature=youtu.be
А вы любите метаалллл?!??!?!?!?
Но сегодня у нас древесииинаааа
Выложили запись трансляции по "Оценке объемов древесины на целлюлозно-бумажном комбинате с помощью ComputerVision") ну и текстом тоже)
https://youtu.be/chmFYtq8Bio
Но сегодня у нас древесииинаааа
Выложили запись трансляции по "Оценке объемов древесины на целлюлозно-бумажном комбинате с помощью ComputerVision") ну и текстом тоже)
https://youtu.be/chmFYtq8Bio
This media is not supported in your browser
VIEW IN TELEGRAM
И так мы занимались важным делом всю неделю — дизайнили обложки на ютуб. Какая лучше ну и посмотрите подкаст с Аней)
https://youtu.be/nGT9M_xv_0g?si=8MTCsBrYSAI55N2e
https://youtu.be/nGT9M_xv_0g?si=8MTCsBrYSAI55N2e