Dealer.AI
14.8K subscribers
688 photos
46 videos
17 files
724 links
Жоский ИИ Дядя
Твой личный поставщик AI 🦾🤖
Канал о мире интересного AI: GenAI, RecSys, поиск, classic ML, бизнес приклад и ai-meme👾

Для связи @dealer_ai (реклама и консультации)

Head of ML, AI.
Kaggle: https://www.kaggle.com/andrilko

РКН: 6348592885
Download Telegram
Forwarded from Гусь
Твитерский попросил нейросеть сгенерировать айтишника.

На каждом этапе он просил ее сделать айтишника ЕЩЕ БОГАЧЕ.
16😁8🔥5😱1
Одним Оленем больше: Poro new Finland vodka LLM.

Говорят, Финно-Угры и Норды завезли LLMку в купе с English.

Самое интересное, что без NVIDIA и СМС. Чисто на AMD GPU 🤙

Прикинь, шкет! Оно работает! 😜

https://xn--r1a.website/gonzo_ML/2084
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍4🤔2
Жиза👇
Rlhf на котах- издать настолько противный звук чтобы хозяин точно пошел смотреть что происходит
🔥11👍1
Forwarded from AI[ex]Time (Александр Голубев)
Вышел мой обзор про LLM агентов на хабре🕺

Скорость появления новых работ и подходов в этом направлении сейчас настолько большая, что тяжело оставаться в курсе, даже работая в сфере DL/NLP. Поэтому постарался описать прогресс относительно небольшой статьей и проиллюстрировать работами, вышедшими за последний год. Также хотелось сделать это не сильно техническим языком, чтобы было понятно максимальному числу людей не из машинного обучения. Так что если вы не связаны напрямую с ML, то не бойтесь, возможно будут непонятны какие-то части, но их можно пропустить (или спросить в комментариях)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍122🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Когда очередная corporation заононсила свою супер-мега-гига-лонг LLM.

В ролях:

- Глава маркетинга в белом, радостный за годовые бюджеты на рекламу.
- Не менее радостные челы , что делали research и pretrain, у которых неожиданно получилось.
- Коммитивший за их успех тех-лид в красном предвкушает грейдап.
- Грустный СЕО, который осознаёт, что их фин.модель из-за потраченного компьюта при его жизни не выйдет в 0.
(в конце крупным планом)
🤩22💯9👍2
Forwarded from Жёлтый AI
This media is not supported in your browser
VIEW IN TELEGRAM
Мы все осуждаем RL, но хочется спросить, кто сделал 1 ТРИЛЛИОН ДЕЙСТВИЙ ЗА ДВА ДНЯ?

Их сделали мы и зарелизили XLand-MiniGrid – наша новая среда для Meta-RL на Jax.

Здесь вы найдете:
🚀 2^13 параллельных сред на одной GPU, миллионы фреймов в секунду
🔞️️️️️️ Поддержка multi-GPU из коробки
🌿️️️️️️ Реализация рекурентного PPO

А самое главное – XLand-MiniGrid создан с прицелом на Meta Learning. В среде можно легко менять динамику и цели между эпизодами. Теперь каждый может вкатиться в мир роскоши и large scale RL даже в Colab.

Подробнее можно почитать в Twitter треде. А в остальном, как всегда, с вас звездочки на гитхабе, а с нас хорошее настроение 🎩
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯15🔥73😁1
Lost in the middle или найди меня через промт, если сможешь.

Крч шкет, помнишь уже было раньше, когда идешь ты такой по sequence в LSTM/GRU и инфа затухает в middle hidden states? Нет? Ну ты ещё молодой, садись расскажу.

Вот я помню. И решалось это так: делали чисто bidirectional проходом и навалом сверху attention. Но в отличии от LSTM, которое училось так e2e, с LLM такое дело позволить себе больно, да и casual masking для next token prediction влезает.

Поэтому дяди придумали снова давать чаевые писать в промт специально акцентуализированные вставки. Мол чел обрати внимание тут над бы не забыть эту инфу.

Вобщем, всё как с тобой шкет, когда препод по матану на лекции говорит: "а вот за это я буду карать на сессии". Правда у тебя кожанного мешка это мимо пролетает и на сессии ты наказан, а LLM это нихило так докидывает, с 27% аж до 98% метрики качества.

Учись, крч.

Мне же интересно:

1. Есть ли механизмы на уровне архитектуры, а не промт тюна? Ну там префикс-токены хитрым натыкать образом и их тюн и тп.

2. Можно ли делать за счёт внешней модели squad выбор отрезка акцентуации в тексте?
👍14🤔2🔥1
Как выглядит Жоский ИИ Дядя в отпуске.

P. S. Кто узнал схему на мониторе, пишем в комментариях.

Украл тут👇
https://xn--r1a.website/nlp_daily
😁201
Зашёл посмотреть, как там мой sbert поживает. Народ, у модели sbert_mt в той же репе sentence вектора ещё круче!

Но динамика кача радует.
🔥35👎3👍21🤩1
Немножко Жоских идей от ИИ Дяди если МоЕ не твоё, но реализовать хочется:

Крч, шкет, тут Mistral, запилил свою MoE 7b. И да это не те, что макароны, и, о боги ИИ, не корабли ВМФ.

Как сделали?

Кажись по классике switch transformer запилили роутинг FFN на 8 экспертов, ток берут топ2. И нет блин, это не 8 по 7b LLM роутятся. Даже для BERT-base FFN занимает порядка 59М весов из 85М на все 12 блоков трансформера и это из 110М всех весов модели. Те почти 60%!?

А тут представьте у вас 8 FFN роутятся в топ2 и на всех К блоков декодера в 7b. Крч, какие-то, люди посчитали и там чет около для 45b модели получается GPU памяти бы иметь.

Поэтому, вот тебе ещё одна идея, пока все играются в песочнице на уровне FFN, не будь как все, ломай систему и делай MoE на small-LM. А как сделаешь, не забывай байтьку жоского Дядю, хотя бы последним автором впиши.

Хотите подробностей по Mixtrail, код тут.
🔥11🤡2👍1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Знаю, что баян... Но...

Literally моя команда.
😁52🔥3💯1
Forwarded from Пресидский залив (Nadia ズエバ)
Я подумывала написать в канал, когда соберу первый раунд или хотя бы пройду в аксель со своим стартапом и буду тут флексить. Но потом решила, что по мере своих сил буду держать вас в курсе. Так ведь интереснее 👀

💃 Итак, с чем же я планирую покорять fashion e-commerce? 💃

🪩 Какую проблему решаем?
"Перед выходом из дома я сомневаюсь, что оделся/оделась достаточно хорошо. Я чувствую неуверенность и дискомфорт."

🪩 Как сейчас решаем проблему?
mvp: Определяем какие цвета идут человеку, какому стилю он хочет следовать, что хочет подчеркнуть/скрыть при помощи одежды, одет ли он по погоде и даем алгоритм, как быстро улучшить свой сегодняшний образ по фотке в полный рост (например: заправь рубашку, подверни штаны, накинь куртку и так далее).

Есть мысли по развитию, но будем отталкиваться от фидбека пользователей 😏

🪩 Что уже успели сделать?
Сделали лендос, залетели в тестфлайт с mvp, а также подались в YC, techstars. Скоро узнаем, зовут ли нас на собесы. Планируем выйти в стор в Q1 2024

P.S. если хотите потестить прилу - напишите "+" в комменты или мне в личку, первым 20ти пошарю ссылку на тестфлайт
👍10👎31🔥1
Ниче, шкет. Пока, они (альфовцы) ходят по чужим хакам и зарабатывают видимо вам и др. на призовые со своего хака. А вообще этот весь флекс от них задолбал, но когда видишь такое - вопросики возникают еще, какое отношение к комьюнити и какое отношение к собственному пиару. Одно дело показать , что они выйграли и за это ещё допом платят своим ребятам, другое, когда сами организовали конкурс и выплатить не могут до сих пор.

https://xn--r1a.website/kaggle_fucker/111
👍10😁4🔥1🤔1
К посту выше, какой флекс. Пиар. Забрали! Не выйграли, забрали:)
Ну ваще, красавцы.

Но чушпан,не поймёт, а пацан воспримет: давать лучше, чем забирать. Сильные дают, слабые морозятся кварталами.

Немного шутеек напоследок:
Получается забрали у Сбера 1.5мульта + призовые Марк и Ко.. :) if you understand what I mean... 😏

https://xn--r1a.website/AlfaBank/1915
Please open Telegram to view this post
VIEW IN TELEGRAM
😁12
👍2🔥1