Data Secrets

Очень милое и визуально приятное исследование от Яндекса про упоминание животных в названиях улиц

Получилось, что больше половины названий люди связали с птицами, четверть — с млекопитающими. Ещё почти 10 % пришлись на рыб и 5 % на насекомых. Дикие животные упоминаются в названиях гораздо чаще домашних — на них приходится почти 90 % изученных улиц. Самые распространённые из числа домашних — лошадь, коза, корова, гусь и пчела.

😻

#advice

Please open Telegram to view this post

VIEW IN TELEGRAM

🙈16🔥8💅5😁3

13.5K viewsedited 15:05

Data Secrets

… who knows another guy

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥82😁15❤3

4.19K viewsedited 09:22

Data Secrets

Модели экспоненциального сглаживания, и какие они бывают

Пройдемся во верхам, не углубляясь в математику. Поможет освежить в памяти тем, кто знал, и познакомиться с темой тем, кто только начинает изучение.

😻

#train #analytics

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍29

4.22K views14:46

Data Secrets

Мы тут придумали эскизы тату для трушных ML-пацанов и девчонок 🐺

Набили бы?
P.S. Ваши варианты – в комментарии

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁36🔥13👍2🍌1

4.04K viewsedited 09:03

Data Secrets

tqdm в pandas

Если применить apply к большому датафрейму, на это может уйти много времени, но сложно сказать, сколько именно. В таких ситуациях хочется научиться как-то отслеживать прогресс. Чтобы это сделать, можно использовать tqdm.

Для этого сначала установим/обновим бибилиотеку:

pip install tqdm
pip install tqdm -U

Затем испортируем tqdm и применяем вместо обычного apply функцию progress_apply. Работает она точно так же, только еще показывает прогресс-бар:

df = pd.DataFrame(np.random.randint(0, 100, (1000000, 100)))

tqdm.pandas(desc="power DataFrame 1M x 100 of random int!")

df.progress_apply(lambda x: x**2)
df.groupby(0)[1].count().progress_apply(lambda x: x**2)

Кстати, еще можно менять формат бара через опцию bar_format. Например:

tqdm.pandas(desc="MyBar", bar_format='{desc:<5.5}{percentage:3.0f}%|{bar:50}{r_bar}')

😻

#python

Please open Telegram to view this post

VIEW IN TELEGRAM

👍43🔥1

4.32K viewsedited 12:52

Data Secrets

DBSCAN: интересный алгоритм кластеризации

DBSCAN (Density-based spatial clustering of applications with noise), как следует из названия, оперирует плотностью данных. На вход он просит матрицу близости и два параметра — радиус епсилон-окрестности и количество соседей. Так сразу и не поймёшь, что это за параметры и как из выбрать. И кроме того, причем тут плотность и когда вообще применять DBSCAN? Давайте разберёмся.

😻

#train #math

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤19👍7🆒3

4.21K views11:07

Data Secrets

Драматичное продолжение истории про AI Act и прочее регулирование

Топ-менеджеры крупнейших ИИ-компаний, включая OpenAI, Google DeepMind и Anthropic, подняли тревогу, сравнивая риски своих технологий с ядерной войной и пандемиями.

В открытом письме, состоящем из одного предложения, они заявили, что минимизация угрозы искусственного интеллекта должна быть глобальным приоритетом. Под этим обращением поставили подписи более 350 ключевых участников отрасли ИИ, включая руководителей компаний и ведущих исследователей.

Верим-верим

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

😁13🤔9👍3🤪1

4.36K viewsedited 16:14

Data Secrets

Not stonks 🤕

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

🤓44👏8👨‍💻8❤4🐳2😨1

4.42K viewsedited 07:34

Data Secrets

Как работает BERT?

Модель BERT (Bidirectional Encoder Representations from Transformers) была представлена в статье от исследователей из Google AI Language. Она вызвала нешуточный ажиотаж в сообществе, и эту модель до сих пор все очень любят. Разбираемся, как она работает, и как ее использовать для своих задач.

Вот, кстати, ссылка на исходный код

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤29🔥8👍5

5.25K views11:36

About

Blog

Apps

Platform