Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Крутой инструмент для ускорения LLM

Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.

🖥 Github
🗂 Подробнее о том, как это работает

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
👍173😇2
Тинькофф запустил бесплатный геосервис для поиска лучших мест для бизнеса на основе Big Data

Он опирается на данные аналитического проекта Tinkoff Data, обрабатывающего сведения о потребительском поведении 37 млн клиентов банка. С помощью сервиса можно оценить количество конкурентов и потенциальных покупателей в районе, средний чек, среднее оборот, стоимость аренды и прочее.

Респект ребятам

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯55👍258💘1
Главное в оптимизации SQL-запросов – понимание порядка их выполнения

😻 #SQL
Please open Telegram to view this post
VIEW IN TELEGRAM
50🔥19😍4👍1
Что отличает годный канал по Deep Learning в Телеграм?

Загибайте пальцы: 6 карточек – 6 качеств отличного канала – и 6 причин подписаться на канал DeepSchool, который сочетает в себе их все. Мы и сами постоянно его читаем, вот наш топ-5 постов за последнее время:

– Базовые методы аугментации временных рядов
DETR. End-to-End Object Detection with Transformers
– ​​Нейронные дифференциальные уравнения
Как LLMs могут принимать сразу 100К токенов на вход?
Знакомим с Kafka

В общем, подписывайтесь, точно не пожалеете!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍165🔥4
Детекция образов с R-CNN

Проблему классификации изображений неплохо решают сверточные нейронки (CNN). С ними мы можем отделить фото котят от фото щеночков. Но что делать, если объектов на картинке несколько? Здесь работают уже более сложные модели. Про изящную архитектуру одной из них – R-CNN, мы сегодня и расскажем.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥17👍95
Ребята из Сбера завезли новую библиотеку по spell checking и spell corruption – SAGE

Она содержит открытые SOTA модели для коррекции правописания на русском и на английском языках, бенчмарк с датасетами для оценивания, реализованными методами аугментации текстов и т.д. И все это – в опенсурсе. На GitHub есть несколько демо в colab, так что пора пробовать!

Российские исследователи не перестают радовать

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
37🔥13👍8
HalvingSearch – ускорение поиска по сетке

Подбор гперпараметров – сложная и распросраненная задача. Для ее решения часто используют поиск по сетке, но этот алгоритм очень уж медленный. Поэтому сегодня давайте обратим внимание на halving search. Его относительно недавно добавили в sklearn, и пришло время разобраться, как с ним работать.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47🔥53