У kNN есть один большой недостаток
Этот алгоритм не учитывает окрестность точки. Это значит, что мы полностью игнорируем, насколько близок был к нашей точке каждый из ее соседей. Но есть решение: Distance-weighted kNN. Подробности – в карточках.
😻 #train
Этот алгоритм не учитывает окрестность точки. Это значит, что мы полностью игнорируем, насколько близок был к нашей точке каждый из ее соседей. Но есть решение: Distance-weighted kNN. Подробности – в карточках.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71❤14❤🔥5🤝1
Я календарь переверну, и снова... новая задача
На этот раз по матанализу. Студенты, самое время поразмяться перед учебой! Остальные – а вам как такой челлендж по восстановлению знаний?
😻 #задачи
На этот раз по матанализу. Студенты, самое время поразмяться перед учебой! Остальные – а вам как такой челлендж по восстановлению знаний?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🍓5
Подборка хакатонов на раннюю осень
Осень – учебная пора. А лучший вариант учиться – это попытать свои знания на практике. Итак, подборка хакатонов на сентябрь-октябрь от нашей редакции:
– URBANCODE от Самолет – задачка по Data Science в сфере девелопмента. Фонд: 800 000 ₽.
– AI News – ML соревнование на Codenrock. Фонд: 500 000 ₽.
– Хакатон по вычислительной оптике – ML соревнование от ИТМО. Фонд: 600 000 ₽.
– Binary Super Resolution Challenge - ML соревнование от ВШЭ. Фонд: 600 000 ₽.
– Хакатон School of Analytics – DS соревнование совместно с ЦИАН. Фонд: 500 000 ₽.
– Цифровой прорыв. Сезон: Искусственный интеллект – ML соревнование, которое не нуждается в представлении. Фонд: 10 000 000 ₽.
– Хакатон вузов страны – задача по ИИ от Роснефти. Фонд: 600 000 ₽.
😻 #advice
Осень – учебная пора. А лучший вариант учиться – это попытать свои знания на практике. Итак, подборка хакатонов на сентябрь-октябрь от нашей редакции:
– URBANCODE от Самолет – задачка по Data Science в сфере девелопмента. Фонд: 800 000 ₽.
– AI News – ML соревнование на Codenrock. Фонд: 500 000 ₽.
– Хакатон по вычислительной оптике – ML соревнование от ИТМО. Фонд: 600 000 ₽.
– Binary Super Resolution Challenge - ML соревнование от ВШЭ. Фонд: 600 000 ₽.
– Хакатон School of Analytics – DS соревнование совместно с ЦИАН. Фонд: 500 000 ₽.
– Цифровой прорыв. Сезон: Искусственный интеллект – ML соревнование, которое не нуждается в представлении. Фонд: 10 000 000 ₽.
– Хакатон вузов страны – задача по ИИ от Роснефти. Фонд: 600 000 ₽.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24🤯5❤3👍2👻2
Bump Charts
Когда мы хотим показать изменения сразу нескольких категорий данных с течением времени, то иногда пользуемся гистограммой. Но если речь идет о дискретном значении (например, рейтинг), то лучше использовать удобочитаемый элегантный Bumb Chart с симпатичными точечками, как на картинке.
Чтобы такой построить в питоне, нужно немного схитрить с subplots. Но не заморачивайтесь: мы уже написали для вас готовый код. Вот ссылка на Colab.
😻 #analytics
Когда мы хотим показать изменения сразу нескольких категорий данных с течением времени, то иногда пользуемся гистограммой. Но если речь идет о дискретном значении (например, рейтинг), то лучше использовать удобочитаемый элегантный Bumb Chart с симпатичными точечками, как на картинке.
Чтобы такой построить в питоне, нужно немного схитрить с subplots. Но не заморачивайтесь: мы уже написали для вас готовый код. Вот ссылка на Colab.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥6❤4
ML блудни: путешествия по миру ошибок 🚫
21 сентября в 22:50 Слёрм приглашает на встречу с Иваном Аникиным, тимлидом Yandex.Edadeal, чтобы поговорить о часто встречающихся ошибках в машинном обучении.
Обсудят:
➡ ошибки в построении моделей;
➡ частые заблуждения команд при работе с ML;
➡ работу с бизнес-задачами и непрозрачными процессами.
Встреча пройдёт в рамках ночной неконференции от Слёрма. В программе сплетни, секреты и факапы от наших коллег. Обещают знакомства в расслабленной атмосфере, тематическую болтовню иразыграть подписку на порнхаб. 🆒
Все онлайн, бесплатно, по регистрации. Узнать подробности и зарегистрироваться — по ссылке😎
Реклама. 18+ ООО «Слёрм» г. Лиски, ОГРН 1193668020545
21 сентября в 22:50 Слёрм приглашает на встречу с Иваном Аникиным, тимлидом Yandex.Edadeal, чтобы поговорить о часто встречающихся ошибках в машинном обучении.
Обсудят:
Встреча пройдёт в рамках ночной неконференции от Слёрма. В программе сплетни, секреты и факапы от наших коллег. Обещают знакомства в расслабленной атмосфере, тематическую болтовню и
Все онлайн, бесплатно, по регистрации. Узнать подробности и зарегистрироваться — по ссылке
Реклама. 18+ ООО «Слёрм» г. Лиски, ОГРН 1193668020545
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤯1🤨1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61❤6🤔3👻1
К важным новостям
Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.
Вывод очевиден, друзья: переходим на голубей
😻 #news
Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.
Вывод очевиден, друзья: переходим на голубей
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
A homing pigeon is faster than my fiber Internet
Bird beats Internet. Or does it? It hasn't been tested since 2009!
Thanks to 45Drives for paying for my flight to Canada. You can check them out here: https://www.45drives.com
Support me on Patreon: https://www.patreon.com/geerlingguy
Sponsor me on GitHub:…
Thanks to 45Drives for paying for my flight to Canada. You can check them out here: https://www.45drives.com
Support me on Patreon: https://www.patreon.com/geerlingguy
Sponsor me on GitHub:…
😁37👍33❤5🤝3😐1
Сбер открыл доступ к сервису GigaChat для всех пользователей
Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.
😻 #news
Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🗿11❤6🤯1
Разрушаем мифы pandas: параметр inplace
Распространенное заблуждение: если менять датафрейм "на месте" (
Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.
Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.
😻 #python
Распространенное заблуждение: если менять датафрейм "на месте" (
inplace = True
), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.
Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤯11👌10😁1
Что почитать: Грокаем глубокое обучение
Наверное, каждый из нас хоть раз в жизни слышал об известной книге "Грокаем алгоритмы". А вы знали, что есть еще и "Грокаем глубокое обучение"?
Книга по всем законам хорошего тона в техно-литературе начинается с описания основ нейронных сетей и затем подробно рассматривает дополнительные уровни и архитектуры. Внутри:
– Теоретические основы глубокого обучения
– Приемы создания и обучения нейронных сетей
– Работа с естественным языком
– Федеративное обучение и работа с конфиденциальными данными
Сама книга вот. А еще мы нашли к ней дополнительные материалы и блокноты в этом репозитории. Советуем!
😻 #advice
Наверное, каждый из нас хоть раз в жизни слышал об известной книге "Грокаем алгоритмы". А вы знали, что есть еще и "Грокаем глубокое обучение"?
Книга по всем законам хорошего тона в техно-литературе начинается с описания основ нейронных сетей и затем подробно рассматривает дополнительные уровни и архитектуры. Внутри:
– Теоретические основы глубокого обучения
– Приемы создания и обучения нейронных сетей
– Работа с естественным языком
– Федеративное обучение и работа с конфиденциальными данными
Сама книга вот. А еще мы нашли к ней дополнительные материалы и блокноты в этом репозитории. Советуем!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥12❤5🤯2
Любая LSTM – это своего рода RNN. Но не любая RNN – LSTM ☝️
Так в чем же разница и чем LSTM лучше RNN (про эту архитектуру мы говорили тут)? Разбираемся и рассказываем, как работает LSTM.
😻 #NN
Так в чем же разница и чем LSTM лучше RNN (про эту архитектуру мы говорили тут)? Разбираемся и рассказываем, как работает LSTM.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤5