Data Secrets

Что такое data leakage?

Утечку данных (data leakage) называют одной из десяти основных проблем машинного обучения. Давайте разберемся, что это такое прежде, чем ~~зальет ваших соседей снизу~~ это доставит кучу проблем аналитикам и бизнесу.

😻

#train #analytics

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍35❤4🔥4

5.65K views12:37

Data Secrets

Forwarded from XOR

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

SQLFlow - отличный инструмент для визуализации SQL-запросов. Легкий и простой интрумент для визуализация связей и структур БД, поддерживающий более 20 разных БД.

Демо – https://sqlflow.gudusoft.com/
Github – https://github.com/sqlparser/sqlflow_public/blob/master/install_sqlflow.md

@xor_journal

👍39🔥10❤3

4.83K views17:12

Data Secrets

Статья о Kandinsky от Сбера попала в топ HuggingFace в разделе DailyPapers

А один из известных специалистов – Ahsen Khaliq – даже выкатил в Twitter пост с кратким разбором статьи. Радостно, что друзья получают заслуженное внимание к своей работе.

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥70❤1

6.05K viewsedited 08:51

Data Secrets

Сегодня приготовили для вас особенно интересную задачу

Звучит она просто: какой толщины должна быть монета, чтобы шанс, что она упадет на ребро, был равен 1/3?

Ждем ваши решения!

😻

#задачи

Please open Telegram to view this post

VIEW IN TELEGRAM

👍28🤔2

5.37K views14:37

Data Secrets

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Ох уж эта тонкая грань

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

😁90🔥10👍5🤯3😨2❤‍🔥1❤1

6.33K views09:19

Data Secrets

Разбор задачи про монетку

Интересный факт: математик Джон фон Нейманн когда услышал эту задачу, решил ее за 20 секунд в уме.

😻

#задачи

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍42🔥8❤4🤯3

5.1K views14:47

Data Secrets

Правительство РФ, кажется, всерьез занялось ИИ

Недавно стало известно, что к 2030 году в России предлагают создать единое хранилище данных. В нем 90% обработанной информации будет доступно всем: государству, бизнесу и гражданам.

А сегодня появилась новость о том, что для получения господдержки крупный и средний бизнес в России обязан внедрить ИИ. Это, по мнению властей, позволит экономить до 1 трлн рублей к 2025 году.

... продолжение следует?

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👀44🤔12👍9🤪5😁4🔥3🗿3🌚2

5.57K viewsedited 08:09

Data Secrets

История OpenAI

Лаборатория OpenAI была образована в декабре 2015 года как некоммерческая организация, которая должна работать на благо всего человечества. Но со временем ситуация изменилась и сегодня бизнес OpenAI идёт вовсю. Разбираемся, как суровая реальность постепенно разрушила идеалистический посыл.

😻

#forfun

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍23❤4😁2🔥1🤯1

5.1K views12:34

Data Secrets

Крутой инструмент для ускорения LLM

Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.

🖥

Github

🗂

Подробнее о том, как это работает

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤3😇2

5.33K views17:51

About

Blog

Apps

Platform