В новом обновлении Телеграм запустил функцию Сторис для каналов.
Это отличная возможность для нас выпускать для наших подписчиков еще больше контента: короткие гайды, подборки, видео или еще что-нибудь классное!
Но чтобы получить возможность публиковать сторис, нам нужна ваша помощь. По правилам Телеграм, нам нужно получить некоторое количество «Бустов» от Premium-подписчиков.
Это бесплатно, вам просто нужно нажать на одну кнопку, чтобы показать, что вы хотите смотреть истории от нас.
Голосуйте и уже на следующей неделе мы сделаем видео-эфир с крутым гостем:
https://xn--r1a.website/data_secrets?boost
P.S. Если ссылка не работает, то нужно обновить приложение telegram
Это отличная возможность для нас выпускать для наших подписчиков еще больше контента: короткие гайды, подборки, видео или еще что-нибудь классное!
Но чтобы получить возможность публиковать сторис, нам нужна ваша помощь. По правилам Телеграм, нам нужно получить некоторое количество «Бустов» от Premium-подписчиков.
Это бесплатно, вам просто нужно нажать на одну кнопку, чтобы показать, что вы хотите смотреть истории от нас.
Голосуйте и уже на следующей неделе мы сделаем видео-эфир с крутым гостем:
https://xn--r1a.website/data_secrets?boost
P.S. Если ссылка не работает, то нужно обновить приложение telegram
Telegram
Data Secrets
Проголосуйте за канал, чтобы он получил больше возможностей.
👍10🔥5🤪4⚡2
Кит Макналти каждый день начинает с решения математической задачи
Макналти – известный математик, дата сайентист и инженер нашего времени, это автор нескольких отличных книг и LinkedIn Top Voice in Tech. Недавно на своей страничке он поделился тем, что каждое утро 30 минут решает задачи по математике, и это дает ему мощный заряд сил на весь день. Как, зачем и почему – в карточках.
😻 #math
Макналти – известный математик, дата сайентист и инженер нашего времени, это автор нескольких отличных книг и LinkedIn Top Voice in Tech. Недавно на своей страничке он поделился тем, что каждое утро 30 минут решает задачи по математике, и это дает ему мощный заряд сил на весь день. Как, зачем и почему – в карточках.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50❤🔥11
7 способов кодирования категориальных переменных, которые надо знать
Почти все реальные датасеты содержат категориальные фичи. Чтобы использовать их в моделях, нужно их закодировать. На карточке сверху изображены 7 способов это сделать:
1) One Hot Encoding – бинарное кодирования с добавлением новых столбцов.
2) Если убрать одну колонку из OHE, то мы избавимся от мультиколлинеарности и получим dummy encoding.
3) Если строчку со всеми нулями из пункта выше заменить на строку с -1, то получим effect encoding.
4) Или же можно просто присвоить каждому значению категории номер, и это будет label encoding.
5) Если данные как-то ранжированы по-порядку, то можно использовать ordinal encoding.
6) Count encoding – кодируем каждое значение частотой/абсолютами его встречаемости.
7) А если немного оптимизировать One Hot Encoding, то получим Binary Encoding. Например, если у нас 4 категории, то мы можем закодировать их всевозможными сочетаниями из двух битов (0 или 1).
😻 #train
Почти все реальные датасеты содержат категориальные фичи. Чтобы использовать их в моделях, нужно их закодировать. На карточке сверху изображены 7 способов это сделать:
1) One Hot Encoding – бинарное кодирования с добавлением новых столбцов.
2) Если убрать одну колонку из OHE, то мы избавимся от мультиколлинеарности и получим dummy encoding.
3) Если строчку со всеми нулями из пункта выше заменить на строку с -1, то получим effect encoding.
4) Или же можно просто присвоить каждому значению категории номер, и это будет label encoding.
5) Если данные как-то ранжированы по-порядку, то можно использовать ordinal encoding.
6) Count encoding – кодируем каждое значение частотой/абсолютами его встречаемости.
7) А если немного оптимизировать One Hot Encoding, то получим Binary Encoding. Например, если у нас 4 категории, то мы можем закодировать их всевозможными сочетаниями из двух битов (0 или 1).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍7❤4
Ученые из Meta создали новую нейросеть для распознавания научных документов
Называется она Nougat и помогает конвертировать PDF в документы LaTeX. Это позволяет сохранить семантику: математические формулы, символы в тексте и так далее.
В Nougat для анализа изображения страницы и генерации текста используется трансформеры. Моделька обучалась на более чем 8 миллионах научных статей, и уже признана SOTA.
Кажется, для нас открываются новые горизонты научных работ и их переиздания.
Статья
Проект
Демо
😻 #memes
Называется она Nougat и помогает конвертировать PDF в документы LaTeX. Это позволяет сохранить семантику: математические формулы, символы в тексте и так далее.
В Nougat для анализа изображения страницы и генерации текста используется трансформеры. Моделька обучалась на более чем 8 миллионах научных статей, и уже признана SOTA.
Кажется, для нас открываются новые горизонты научных работ и их переиздания.
Статья
Проект
Демо
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥84👍7❤5
Enthought-v1.0.2.pdf
2.4 MB
Без лишних слов, просто посмотрите, на какой милый чит-лист по pandas мы наткнулись сегодня утром!
😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍15❤12
Дайджест ML-соревнований , в которых можно поучаствовать прямо сейчас
6️⃣ Yachay-AI Confident Predictions Selection. Требуется придумать модель, которая решала бы задачу ранжирования геотэггита. Есть бэйзлайн.
2️⃣ YandexCUP – задачи пока не раскрывают, но обещают сложно и интересно (скорее всего, рексисы).
3️⃣ Child Mind Institute - detect sleep states – кэггловский конкурс, треубется по данным акселерометра научиться определять момент начала и конца сна.
4️⃣ Trading at the close – снова kaggle с задачей предсказания цены закрытия акций. Для тех, кто любит финансы и временные ряды.
5️⃣ Predict AI Model Runtime – пожалуй самая необычная задача (от Google, кстати) в списке. Нужно обучиться опознавать конфигурации компилятора, которые приведут к самой бодрой работе моделей AI.
😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍4❤2🎉2🗿2🤨1
Никогда такого не было, и вот опять: воскресная задача
У некоторого производителя хлопьев в каждой коробке лежит один купон. Всего видов купонов n. Для получения приза нужно собрать все n разных купонов. Сколько в среднем потребуется коробок для составления полного набора?
Разбор завтра, а пока вы знаете что делать👇
P.S. А вы знали, что первым известным «плохим» хакером стал американец Джон Дрейпер по прозвищу Cap’n Crunch, в честь кукурузных хлопьев?
😻 #задачи
У некоторого производителя хлопьев в каждой коробке лежит один купон. Всего видов купонов n. Для получения приза нужно собрать все n разных купонов. Сколько в среднем потребуется коробок для составления полного набора?
Разбор завтра, а пока вы знаете что делать
P.S. А вы знали, что первым известным «плохим» хакером стал американец Джон Дрейпер по прозвищу Cap’n Crunch, в честь кукурузных хлопьев?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🤔9
Please open Telegram to view this post
VIEW IN TELEGRAM
😁75❤5🔥3
Как визуализировать дерево решений
Ну во-первых, это красиво. Во-вторых, самое прекрасное свойство деревьей решений – интерпретируемость, и визуализировать модель в этом случае очень полезно. Помимо того, что мы видим, как модель будет принимать решение, можно еще и оценить разделимость данных (например, посмотрев на индекс Джини и количество айтемов каждого класса в вершинах).
В комментариях написали готовый код для визуализации на примере Ирисов Фишера.
😻 #analytics #python #train
Ну во-первых, это красиво. Во-вторых, самое прекрасное свойство деревьей решений – интерпретируемость, и визуализировать модель в этом случае очень полезно. Помимо того, что мы видим, как модель будет принимать решение, можно еще и оценить разделимость данных (например, посмотрев на индекс Джини и количество айтемов каждого класса в вершинах).
В комментариях написали готовый код для визуализации на примере Ирисов Фишера.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24❤7
Многие хотят стать аналитиками данных, но не у многих получается
Мы не понаслышке знаем, как трудно ворваться на рынок труда и хотим поделиться нашими советами на бесплатном вебинаре.
Вы узнаете:
- Какие навыки нужны для старта карьеры, и что изменилось за последние годы
- Как найти первую работу или стажировку?
- Обязательно ли профильное высшее образование для работы аналитиком?
- Можно ли начать карьеру после 30?
Вебинар проведёт Анатолий Карпов — тот самый автор курсов на степике, которые обучили основам анализа данных более 200 тыс. человек. Анатолий руководил командой аналитики в отделе бизнеса и рекламы ВКонтакте, а сейчас является основателем школы karpovꓸcourses.
🕖Вебинар пройдет 28 сентября в 19:00
Регистрируйтесь по ссылке
Реклама. ООО "Карпов Курсы". Erid: LjN8K2jhz
Мы не понаслышке знаем, как трудно ворваться на рынок труда и хотим поделиться нашими советами на бесплатном вебинаре.
Вы узнаете:
- Какие навыки нужны для старта карьеры, и что изменилось за последние годы
- Как найти первую работу или стажировку?
- Обязательно ли профильное высшее образование для работы аналитиком?
- Можно ли начать карьеру после 30?
Вебинар проведёт Анатолий Карпов — тот самый автор курсов на степике, которые обучили основам анализа данных более 200 тыс. человек. Анатолий руководил командой аналитики в отделе бизнеса и рекламы ВКонтакте, а сейчас является основателем школы karpovꓸcourses.
🕖Вебинар пройдет 28 сентября в 19:00
Регистрируйтесь по ссылке
Реклама. ООО "Карпов Курсы". Erid: LjN8K2jhz
❤13
Разбор задачи про хлопья
Давайте посмотрим, как можно одолеть эту задачу при помощи старых друзей: Бернулли и Эйлера.
😻 #задачи
Давайте посмотрим, как можно одолеть эту задачу при помощи старых друзей: Бернулли и Эйлера.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥34👍17🤯2
Забавное исследование отзывов на рестораны и бары
Яндекс Исследования выкатили свежую статью «Как хвалят и ругают рестораны и бары». Они изучили огромный пул отзывов на общепит и выяснили, за что, как часто и даже какими словами люди выражают свое мнение. Интересная аналитика + симпатичная визуализация = рекомендуем.
Наверху одна картинка из исследования – самые частотные слова и словосочетания в отрицательных и положительных отзывах:
😻 #advice
Яндекс Исследования выкатили свежую статью «Как хвалят и ругают рестораны и бары». Они изучили огромный пул отзывов на общепит и выяснили, за что, как часто и даже какими словами люди выражают свое мнение. Интересная аналитика + симпатичная визуализация = рекомендуем.
Наверху одна картинка из исследования – самые частотные слова и словосочетания в отрицательных и положительных отзывах:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🍾3❤2
Как работает BERT?
Модель BERT (Bidirectional Encoder Representations from Transformers) была представлена в статье от исследователей из Google AI Language. Она вызвала нешуточный ажиотаж в сообществе, и эту модель до сих пор все очень любят. Мы подготовили лонгрид о том, как она работает, и как ее использовать для своих задач.
Вот, кстати, ссылка на исходный код
😻 #NN
Модель BERT (Bidirectional Encoder Representations from Transformers) была представлена в статье от исследователей из Google AI Language. Она вызвала нешуточный ажиотаж в сообществе, и эту модель до сих пор все очень любят. Мы подготовили лонгрид о том, как она работает, и как ее использовать для своих задач.
Вот, кстати, ссылка на исходный код
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26👍14