Data Secrets

Крутой инструмент для ускорения LLM

Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.

🖥

Github

🗂

Подробнее о том, как это работает

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤3😇2

5.33K views17:51

Data Secrets

Тинькофф запустил бесплатный геосервис для поиска лучших мест для бизнеса на основе Big Data

Он опирается на данные аналитического проекта Tinkoff Data, обрабатывающего сведения о потребительском поведении 37 млн клиентов банка. С помощью сервиса можно оценить количество конкурентов и потенциальных покупателей в районе, средний чек, среднее оборот, стоимость аренды и прочее.

Респект ребятам

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

🤯55👍25❤8💘1

6.68K views08:58

Data Secrets

Главное в оптимизации SQL-запросов – понимание порядка их выполнения

😻

#SQL

Please open Telegram to view this post

VIEW IN TELEGRAM

❤50🔥19😍4👍1

5.85K views11:52

Data Secrets

Что отличает годный канал по Deep Learning в Телеграм?

Загибайте пальцы: 6 карточек – 6 качеств отличного канала – и 6 причин подписаться на канал DeepSchool, который сочетает в себе их все. Мы и сами постоянно его читаем, вот наш топ-5 постов за последнее время:

– Базовые методы аугментации временных рядов
– DETR. End-to-End Object Detection with Transformers
– Нейронные дифференциальные уравнения
– Как LLMs могут принимать сразу 100К токенов на вход?
– Знакомим с Kafka

В общем, подписывайтесь, точно не пожалеете!

😻

#advice

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤5🔥4

4.93K views14:03

Data Secrets

Детекция образов с R-CNN

Проблему классификации изображений неплохо решают сверточные нейронки (CNN). С ними мы можем отделить фото котят от фото щеночков. Но что делать, если объектов на картинке несколько? Здесь работают уже более сложные модели. Про изящную архитектуру одной из них – R-CNN, мы сегодня и расскажем.

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥17👍9❤5

4.97K views17:14

Data Secrets

Ребята из Сбера завезли новую библиотеку по spell checking и spell corruption – SAGE

Она содержит открытые SOTA модели для коррекции правописания на русском и на английском языках, бенчмарк с датасетами для оценивания, реализованными методами аугментации текстов и т.д. И все это – в опенсурсе. На GitHub есть несколько демо в colab, так что пора пробовать!

Российские исследователи не перестают радовать

😻

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

❤37🔥13👍8

5.66K views07:41

Data Secrets

HalvingSearch – ускорение поиска по сетке

Подбор гперпараметров – сложная и распросраненная задача. Для ее решения часто используют поиск по сетке, но этот алгоритм очень уж медленный. Поэтому сегодня давайте обратим внимание на halving search. Его относительно недавно добавили в sklearn, и пришло время разобраться, как с ним работать.

😻

#train

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍47🔥5❤3

5.75K views13:06

About

Blog

Apps

Platform