Love. Death. Transformers.

Forwarded from Непрерывное математическое образование

https://mccme.ru/dubna/2024/

приближается ЛШСМ-2024 (доступно расписание, анонсы курсов; планируются прямые трансляции большинства пленарных лекций)

утром в субботу всё начнется с лекции А.А.Разборова про арифметическую комбинаторику и лекции С.К.Смирнова про замощения

🔥19❤3💩2👍1

6.29K views10:22

Love. Death. Transformers.

https://www.reddit.com/r/LocalLLaMA/comments/1ceh5cp/gpt2chatbot_at_lmsys_chatbot_arena/

После ухода Ильи суцкевера в опен АИ разучились рисовать график роста параматров и вышла gpt4o-mini.
Дешевле всего что есть на рынке(15c,60с) на вход и выход за 1м токенов, подозреваю что сопоставима со страшим опенсурсом по качеству.

Blog

👍38❤5😢2👎11

6.99K viewsedited 17:11

Love. Death. Transformers.

😁1372710❤1👍1

7.17K views17:42

Love. Death. Transformers.

Forwarded from NLP Wanderer

GrandMaster-PRO-MAX - Первый крупный высококачественный русскоязычный SFT датасет

Совместно с Vikhrmodels, представляю вам датасет для инструктивного обучения LLM полученный не с помощью переводов ответов моделей с английского языка. Он диверсифицирован по темам и позволяет моделям следовать самым разным инструкциям на разных языках (в основном на русском) и отвечать, так же, в основном на русском языке.

Ответы за ассистента в этом датасете полностью сгенерированы GPT-4-Turbo-1106 с нуля по исходным инструкциям от пользователя. Это позволило получить очень качественный русский язык в ответах без артефактов перевода. Исходные инструкции были взяты из различных источников, в том числе синтетических для подкрепления отдельных способностей вроде математики, программирования, следования формату и тд.

Кроме того, характерной особенностью является то, что модели обученные на этом датасете будут иметь уже "вшитую" способность к Chaint-Of-Thought (CoT), за счет использования более сложного промпта для генерации большинства ответов (подробнее в карточке датасета).

Содержит примерно 142 тысячи уникальных пар инструкция - ответ. Денежный эквивалент генерации такого датасета с нуля - около 4к долларов.

huggingface.co

Vikhrmodels/GrandMaster-PRO-MAX · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥68❤12👍11🤡2🥴2🤔1

6.13K views19:07

Love. Death. Transformers.

NLP Wanderer

Скоро я в коллаборации с Vikhrmodels релизну русскую general арену (на основе кода Arena-Hard-Auto. А еще готовлю несколько других крупных 🤗 релизов и статей (хабровских)... А пока вам текущий стейт со всеми лучшими опенсорс (и не только моделями) Датасет…

Спасибо ребятам из тинька за использование и cite нашего бенчмарка.

прессрелиз

👍42❤9😁6🔥1

6.16K viewsedited 14:34

Love. Death. Transformers.

Спасибо ребятам из тинька за использование и cite нашего бенчмарка. прессрелиз

https://huggingface.co/AnatoliiPotapov/T-lite-0.1

https://huggingface.co/AnatoliiPotapov/T-lite-instruct-0.1

https://t.ly/T-lite

huggingface.co

AnatoliiPotapov/T-lite-0.1 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤24

6.21K viewsedited 16:42

Love. Death. Transformers.

Forwarded from телеграм скиллза