Крутой инструмент для ускорения LLM
Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.
🖥 Github
🗂 Подробнее о том, как это работает
😻 #NN
Это Medusa, и она упрощает и ускоряет большие языковые модели. Делает она это так: в процессе обучения к LLM добавляется несколько так называемых «heads», которые затем отдельно настраиваются в процессе обучения. В процессе генерации каждый из этих выходов выдает несколько вероятных слов для соответствующей позиции. Затем эти варианты комбинируются и обрабатываются с помощью механизма внимания, а наиболее правдоподобные из них отбираются для дальнейшего декодирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤3😇2
Тинькофф запустил бесплатный геосервис для поиска лучших мест для бизнеса на основе Big Data
Он опирается на данные аналитического проекта Tinkoff Data, обрабатывающего сведения о потребительском поведении 37 млн клиентов банка. С помощью сервиса можно оценить количество конкурентов и потенциальных покупателей в районе, средний чек, среднее оборот, стоимость аренды и прочее.
Респект ребятам
😻 #news
Он опирается на данные аналитического проекта Tinkoff Data, обрабатывающего сведения о потребительском поведении 37 млн клиентов банка. С помощью сервиса можно оценить количество конкурентов и потенциальных покупателей в районе, средний чек, среднее оборот, стоимость аренды и прочее.
Респект ребятам
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯55👍25❤8💘1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤50🔥19😍4👍1
Что отличает годный канал по Deep Learning в Телеграм?
Загибайте пальцы: 6 карточек – 6 качеств отличного канала – и 6 причин подписаться на канал DeepSchool, который сочетает в себе их все. Мы и сами постоянно его читаем, вот наш топ-5 постов за последнее время:
– Базовые методы аугментации временных рядов
– DETR. End-to-End Object Detection with Transformers
– Нейронные дифференциальные уравнения
– Как LLMs могут принимать сразу 100К токенов на вход?
– Знакомим с Kafka
В общем, подписывайтесь, точно не пожалеете!
😻 #advice
Загибайте пальцы: 6 карточек – 6 качеств отличного канала – и 6 причин подписаться на канал DeepSchool, который сочетает в себе их все. Мы и сами постоянно его читаем, вот наш топ-5 постов за последнее время:
– Базовые методы аугментации временных рядов
– DETR. End-to-End Object Detection with Transformers
– Нейронные дифференциальные уравнения
– Как LLMs могут принимать сразу 100К токенов на вход?
– Знакомим с Kafka
В общем, подписывайтесь, точно не пожалеете!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤5🔥4
Детекция образов с R-CNN
Проблему классификации изображений неплохо решают сверточные нейронки (CNN). С ними мы можем отделить фото котят от фото щеночков. Но что делать, если объектов на картинке несколько? Здесь работают уже более сложные модели. Про изящную архитектуру одной из них – R-CNN, мы сегодня и расскажем.
😻 #NN
Проблему классификации изображений неплохо решают сверточные нейронки (CNN). С ними мы можем отделить фото котят от фото щеночков. Но что делать, если объектов на картинке несколько? Здесь работают уже более сложные модели. Про изящную архитектуру одной из них – R-CNN, мы сегодня и расскажем.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥17👍9❤5
Ребята из Сбера завезли новую библиотеку по spell checking и spell corruption – SAGE
Она содержит открытые SOTA модели для коррекции правописания на русском и на английском языках, бенчмарк с датасетами для оценивания, реализованными методами аугментации текстов и т.д. И все это – в опенсурсе. На GitHub есть несколько демо в colab, так что пора пробовать!
Российские исследователи не перестают радовать
😻 #news
Она содержит открытые SOTA модели для коррекции правописания на русском и на английском языках, бенчмарк с датасетами для оценивания, реализованными методами аугментации текстов и т.д. И все это – в опенсурсе. На GitHub есть несколько демо в colab, так что пора пробовать!
Российские исследователи не перестают радовать
Please open Telegram to view this post
VIEW IN TELEGRAM
❤37🔥13👍8
HalvingSearch – ускорение поиска по сетке
Подбор гперпараметров – сложная и распросраненная задача. Для ее решения часто используют поиск по сетке, но этот алгоритм очень уж медленный. Поэтому сегодня давайте обратим внимание на halving search. Его относительно недавно добавили в sklearn, и пришло время разобраться, как с ним работать.
😻 #train
Подбор гперпараметров – сложная и распросраненная задача. Для ее решения часто используют поиск по сетке, но этот алгоритм очень уж медленный. Поэтому сегодня давайте обратим внимание на halving search. Его относительно недавно добавили в sklearn, и пришло время разобраться, как с ним работать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47🔥5❤3