Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Что такое data leakage?

Утечку данных (data leakage) называют одной из десяти основных проблем машинного обучения. Давайте разберемся, что это такое прежде, чем зальет ваших соседей снизу это доставит кучу проблем аналитикам и бизнесу.

😻 #train #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍354🔥4
Forwarded from XOR
This media is not supported in your browser
VIEW IN TELEGRAM
SQLFlow - отличный инструмент для визуализации SQL-запросов. Легкий и простой интрумент для визуализация связей и структур БД, поддерживающий более 20 разных БД.

Демо – https://sqlflow.gudusoft.com/
Github – https://github.com/sqlparser/sqlflow_public/blob/master/install_sqlflow.md

@xor_journal
👍39🔥103
Статья о Kandinsky от Сбера попала в топ HuggingFace в разделе DailyPapers

А один из известных специалистов – Ahsen Khaliq – даже выкатил в Twitter пост с кратким разбором статьи. Радостно, что друзья получают заслуженное внимание к своей работе.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥701
Сегодня приготовили для вас особенно интересную задачу

Звучит она просто: какой толщины должна быть монета, чтобы шанс, что она упадет на ребро, был равен 1/3?

Ждем ваши решения!

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🤔2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁90🔥10👍5🤯3😨2❤‍🔥11
Разбор задачи про монетку

Интересный факт: математик Джон фон Нейманн когда услышал эту задачу, решил ее за 20 секунд в уме.

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥84🤯3
Правительство РФ, кажется, всерьез занялось ИИ

Недавно стало известно, что к 2030 году в России предлагают создать единое хранилище данных. В нем 90% обработанной информации будет доступно всем: государству, бизнесу и гражданам.

А сегодня появилась новость о том, что для получения господдержки крупный и средний бизнес в России обязан внедрить ИИ. Это, по мнению властей, позволит экономить до 1 трлн рублей к 2025 году.

... продолжение следует?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👀44🤔12👍9🤪5😁4🔥3🗿3🌚2
История OpenAI

Лаборатория OpenAI была образована в декабре 2015 года как некоммерческая организация, которая должна работать на благо всего человечества. Но со временем ситуация изменилась и сегодня бизнес OpenAI идёт вовсю. Разбираемся, как суровая реальность постепенно разрушила идеалистический посыл.

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍234😁2🔥1🤯1
Крутой инструмент для ускорения LLM

Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.

🖥 Github
🗂 Подробнее о том, как это работает

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
👍173😇2