Data Secrets

Разбор вчерашней задачи по матанализу

😻

#задачи

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍61❤6🤔3👻1

4.69K views16:13

Data Secrets

К важным новостям

Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.

Вывод очевиден, друзья: переходим на голубей

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

A homing pigeon is faster than my fiber Internet

Bird beats Internet. Or does it? It hasn't been tested since 2009!

Thanks to 45Drives for paying for my flight to Canada. You can check them out here: https://www.45drives.com

Support me on Patreon: https://www.patreon.com/geerlingguy
Sponsor me on GitHub:…

😁37👍33❤5🤝3😐1

14.3K views06:34

Data Secrets

Сбер открыл доступ к сервису GigaChat для всех пользователей

Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.

Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍35🗿11❤6🤯1

5.3K views11:33

Data Secrets

Разрушаем мифы pandas: параметр inplace

Распространенное заблуждение: если менять датафрейм "на месте" (inplace = True), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?

Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.

Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.

😻

#python

Please open Telegram to view this post

VIEW IN TELEGRAM

👍58🤯11👌10😁1

5.41K views15:33

Data Secrets

Люк… я твой бэйзлайн

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

😁80❤9❤‍🔥5👍1🤯1

5.15K views06:38

Data Secrets

Что почитать: Грокаем глубокое обучение

Наверное, каждый из нас хоть раз в жизни слышал об известной книге "Грокаем алгоритмы". А вы знали, что есть еще и "Грокаем глубокое обучение"?

Книга по всем законам хорошего тона в техно-литературе начинается с описания основ нейронных сетей и затем подробно рассматривает дополнительные уровни и архитектуры. Внутри:

– Теоретические основы глубокого обучения
– Приемы создания и обучения нейронных сетей
– Работа с естественным языком
– Федеративное обучение и работа с конфиденциальными данными

Сама книга вот. А еще мы нашли к ней дополнительные материалы и блокноты в этом репозитории. Советуем!

😻

#advice

Please open Telegram to view this post

VIEW IN TELEGRAM

👍36🔥12❤5🤯2

6.57K views11:23

Data Secrets

Любая LSTM – это своего рода RNN. Но не любая RNN – LSTM

☝️

Так в чем же разница и чем LSTM лучше RNN (про эту архитектуру мы говорили тут)? Разбираемся и рассказываем, как работает LSTM.

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25❤5

5.57K views15:03

Data Secrets

Breaking news: институт технологических инноваций ОАЭ запустил огромную языковую модель Falcon

И огромная – это не просто слово. В Falcon 180B 180 млрд (!) параметров и она уже заняла первое место в лидерборде HuggingFace. До этого самой большой моделью была LLama-2 с 70 млрд. Есть базовая и чатовая версии.

Вот уж откуда не ждали…

🤗 Веса и код
🦾 Демо

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍38🔥12❤9

5.72K views05:42

Data Secrets

9 сентября Сбер приглашает IT-специалистов поучаствовать в отборе: пройти все интервью, познакомиться с командой и, возможно, даже получить оффер.

Какими задачами занимаются DS-специалисты крупнейшего банка страны? 👇

✔️ Обучают все модели искусственного интеллекта: от классического ML до глубоких нейронных сетей.
✔️ Создают инновационные сервисы от систем принятия решений до компьютерного зрения и обработки естественного языка
✔️ Развивают блочное хранилище на Teradata и DataLake на Hadoop.
✔️ Работают на Python, Spark, SQL, Hadoop, GreenPlum.

За год команда разрабатывает и внедряет более 200 моделей для отделений банка, приложений, колл-центра, банкоматов и так далее, поэтому работа точно будет интересной и разнообразной.

Переходите по ссылке и регистрируйся на One Day Offer, чтобы получить оффер мечты! 💚

👍10❤4🔥2🤯1

5.76K views08:00

Data Secrets

В стране DS жили-были два зверя: панда и скуль. И говорили они на разных языках....

От этого временами страдали все мирные жители этого прекрасного государства. Но однажды доблестные редакторы из замка Data Secrets сделали словарь, в котором собрали и перевели все самое важное с одного языка на другой. После этого все жили долго и счастливо и ставили на этот пост лайки. Конец!

😻

#python #SQL

Please open Telegram to view this post

VIEW IN TELEGRAM

❤103👍36🔥17😁6❤‍🔥3

6.05K views10:50

Data Secrets

Новый релевантный бельгийский ужастик AKA комедия для DS-ника

Сначала мы думали, что там покажут CUDA out of memory. Но потом оказалось, что не все так страшно: там просто нейросеть порабощает человечество. Тем не менее, фильм не рекомендуется к просмотрю людям со слабой психикой и торчфобией.

300 🔥 и админы на день превратятся в DS comedian: сходят на это в кино и сделают обзор

😻

#хаха

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥257❤6😁4👍2❤‍🔥1

5.12K viewsedited 15:26

Data Secrets

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

Стартовал чемпионат мира по Excel

Да, вы не ослышались. Чемпионат мира по Excel. Он пройдет в Лас-Вегасе. Победитель получит 15 400 долларов (1,5 миллиона рублей). Участникам предстоит решать задачи за отведенное время, а комментаторам — восхищаться.

Главбух уже выдвигается в Вегас

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍66😁30🤯15🤔1🙈1

7.18K views06:44

Data Secrets

TheilSenRegressor – устойчивый к выбросам близнец регрессии

Линейная регрессия – основа основ машинного обучения. Она прекрасна и часто работает гораздо лучше более сложных алгоритмов. Но есть проблема: она не устойчива к выбросам. Даже несколько выбросов могут существенно навредить итоговому скору. Но есть решение – TheilSenRegressor. Рассказываем.

😻

#train

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍63❤6🔥3🤯2

5.66K views10:40

About

Blog

Apps

Platform