Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Разбор вчерашней задачи по матанализу

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍616🤔3👻1
К важным новостям

Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.

Вывод очевиден, друзья: переходим на голубей

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
😁37👍335🤝3😐1
Сбер открыл доступ к сервису GigaChat для всех пользователей

Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.

Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🗿116🤯1
Разрушаем мифы pandas: параметр inplace

Распространенное заблуждение: если менять датафрейм "на месте" (inplace = True), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?

Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.

Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤯11👌10😁1
Люк… я твой бэйзлайн

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁809❤‍🔥5👍1🤯1
Что почитать: Грокаем глубокое обучение

Наверное, каждый из нас хоть раз в жизни слышал об известной книге "Грокаем алгоритмы". А вы знали, что есть еще и "Грокаем глубокое обучение"?

Книга по всем законам хорошего тона в техно-литературе начинается с описания основ нейронных сетей и затем подробно рассматривает дополнительные уровни и архитектуры. Внутри:

– Теоретические основы глубокого обучения
– Приемы создания и обучения нейронных сетей
– Работа с естественным языком
– Федеративное обучение и работа с конфиденциальными данными

Сама книга вот. А еще мы нашли к ней дополнительные материалы и блокноты в этом репозитории. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥125🤯2
Любая LSTM – это своего рода RNN. Но не любая RNN – LSTM ☝️

Так в чем же разница и чем LSTM лучше RNN (про эту архитектуру мы говорили тут)? Разбираемся и рассказываем, как работает LSTM.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍255
Breaking news: институт технологических инноваций ОАЭ запустил огромную языковую модель Falcon

И огромная – это не просто слово. В Falcon 180B 180 млрд (!) параметров и она уже заняла первое место в лидерборде HuggingFace. До этого самой большой моделью была LLama-2 с 70 млрд. Есть базовая и чатовая версии.

Вот уж откуда не ждали…

🤗 Веса и код
🦾 Демо

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38🔥129
9 сентября Сбер приглашает IT-специалистов поучаствовать в отборе: пройти все интервью, познакомиться с командой и, возможно, даже получить оффер.

Какими задачами занимаются DS-специалисты крупнейшего банка страны? 👇

✔️ Обучают все модели искусственного интеллекта: от классического ML до глубоких нейронных сетей.
✔️ Создают инновационные сервисы от систем принятия решений до компьютерного зрения и обработки естественного языка
✔️ Развивают блочное хранилище на Teradata и DataLake на Hadoop.
✔️ Работают на Python, Spark, SQL, Hadoop, GreenPlum.

За год команда разрабатывает и внедряет более 200 моделей для отделений банка, приложений, колл-центра, банкоматов и так далее, поэтому работа точно будет интересной и разнообразной.

Переходите по ссылке и регистрируйся на One Day Offer, чтобы получить оффер мечты! 💚
👍104🔥2🤯1
В стране DS жили-были два зверя: панда и скуль. И говорили они на разных языках....

От этого временами страдали все мирные жители этого прекрасного государства. Но однажды доблестные редакторы из замка Data Secrets сделали словарь, в котором собрали и перевели все самое важное с одного языка на другой. После этого все жили долго и счастливо и ставили на этот пост лайки. Конец!

😻 #python #SQL
Please open Telegram to view this post
VIEW IN TELEGRAM
103👍36🔥17😁6❤‍🔥3
Новый релевантный бельгийский ужастик AKA комедия для DS-ника

Сначала мы думали, что там покажут CUDA out of memory. Но потом оказалось, что не все так страшно: там просто нейросеть порабощает человечество. Тем не менее, фильм не рекомендуется к просмотрю людям со слабой психикой и торчфобией.

300 🔥 и админы на день превратятся в DS comedian: сходят на это в кино и сделают обзор

😻 #хаха
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2576😁4👍2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Стартовал чемпионат мира по Excel

Да, вы не ослышались. Чемпионат мира по Excel. Он пройдет в Лас-Вегасе. Победитель получит 15 400 долларов (1,5 миллиона рублей). Участникам предстоит решать задачи за отведенное время, а комментаторам — восхищаться.

Главбух уже выдвигается в Вегас

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66😁30🤯15🤔1🙈1
TheilSenRegressor – устойчивый к выбросам близнец регрессии

Линейная регрессия – основа основ машинного обучения. Она прекрасна и часто работает гораздо лучше более сложных алгоритмов. Но есть проблема: она не устойчива к выбросам. Даже несколько выбросов могут существенно навредить итоговому скору. Но есть решение – TheilSenRegressor. Рассказываем.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍636🔥3🤯2