Love. Death. Transformers.
https://www.pjreddie.com/ cv авторы yolo выглядит так, а ты и дальше верстай свои LaTexи и будь как все
Как правильно распределить соискателей на ресерча с фотками в cv/профиле/гитхабе по категориям:
1. Котик (крайне редко другое животное) - скуф лет 40+, имеет минимум одну вышку, крайне силён в плюсах и сишке, дикий байтоёб, очень сильный в алгосах. В детстве был олимпиадником
2. Аниме - зумер 14+ лет, скорее всего олимпиадник, скорее всего нет (и не будет) друзей, забитый чмошник. Либо дрыщара либо жиробас, с детства ходит только на кружок по информатике, учится в топ-вузе на бесплатке т.к поступил по олимпиадам.
3. Личное фото. Тут делится на два типа. Если человек выглядит ухоженным, то это 100-ый пиздабол не написавший строчки самостоятельно без chatgpt. Если всратан 0/10, то титан которому похуй абсолютно на всё, кроме кодов.
1. Котик (крайне редко другое животное) - скуф лет 40+, имеет минимум одну вышку, крайне силён в плюсах и сишке, дикий байтоёб, очень сильный в алгосах. В детстве был олимпиадником
2. Аниме - зумер 14+ лет, скорее всего олимпиадник, скорее всего нет (и не будет) друзей, забитый чмошник. Либо дрыщара либо жиробас, с детства ходит только на кружок по информатике, учится в топ-вузе на бесплатке т.к поступил по олимпиадам.
3. Личное фото. Тут делится на два типа. Если человек выглядит ухоженным, то это 100-ый пиздабол не написавший строчки самостоятельно без chatgpt. Если всратан 0/10, то титан которому похуй абсолютно на всё, кроме кодов.
👍97😁55🤡10❤5💯4🥴2🔥1🆒1
#чтивонаночь
MobileLLM: Optimizing Sub-billion Parameter Language Models
for On-Device Use Cases
ахуеть, наконец интересный аблэйшн?
Нужно гонять llm на девайсах, гонять 3b+ на vivoz довольно проблемно, поэтому нужны llm без первой буквы, 350-500m параметров, бонусом их можно гонять ondevice С ОЧЕНЬ БОЛЬШИМ tps(100-200 токенов в секунду)
Инсайты которые фейсбук вывел для <500m
- swiglu докидывает
- Глубокие модели значимо(4-5%) лучше чем широкие(!)
- Embeding share докидывает
- LayerShare докидывает (копируют слои)
- Претрен на 1т токенов это осмысленное действие для 350m lm
Бонус: модель вышла сопостовимой по качеству function calling c llama7b2 (x20 параметров)
paper
MobileLLM: Optimizing Sub-billion Parameter Language Models
for On-Device Use Cases
Нужно гонять llm на девайсах, гонять 3b+ на vivoz довольно проблемно, поэтому нужны llm без первой буквы, 350-500m параметров, бонусом их можно гонять ondevice С ОЧЕНЬ БОЛЬШИМ tps(100-200 токенов в секунду)
Инсайты которые фейсбук вывел для <500m
- swiglu докидывает
- Глубокие модели значимо(4-5%) лучше чем широкие(!)
- Embeding share докидывает
- LayerShare докидывает (копируют слои)
- Претрен на 1т токенов это осмысленное действие для 350m lm
Бонус: модель вышла сопостовимой по качеству function calling c llama7b2 (x20 параметров)
paper
👍41🔥5❤3
Love. Death. Transformers.
Трагикомический постхоррор: программист релоцируется и узнаёт что с людьми надо общаться Ссылка
Смешной факт: некоторые русские заведения открыты в домах которые строили белые эммигранты 100 лет назад.
👍62🤡15❤7😢2😁1
Forwarded from вычислить по IP (Anastasia Skovpen)
Я все думала, ну когда какая-нибудь нейронка выстрелит в хоть в каком кринжовом деле.
И дело нашлось - А67-150/2024 - о защите деловой репутации.
С помощью нейронки наклепали статьи, разместили на сайте, истец оскорбился и пошел судиться, а точнее устанавливать факт, имеющий юридическое значение. Почему? Потому что идентифицировать лицо, распространившее информацию (aka владельца сайта) не удалось.
Подобных решений - пруд пруди, ибо не иссякла на Руси еще анонимность (хотя казалось бы). На дело я обратила внимание из-за упоминания GPT.
Тут нужно отметить, что для целей закона не так важно писал ли ответчик свои мысли в тетрадке и выставлял фото записей, опубликовал пост в анонимном блоге или генерил тексты с помощью своего ИИ сервиса - важен факт распространения и качество распространяемой информации (порочащая или не соответствующая действительности).
Надлежащими ответчиками по искам о защите деловой репутации являются авторы не соответствующих действительности и умаляющих репутацию сведений, а также лица, распространившие эти сведения.
Допустим, что в этом кейсе автора могло не быть (ибо ИИ сервис не автор, но и юзера мы таковым назвать не можем), но владелец сайта - это распространитель информации, что позволяет предъявлять требования и к нему.
Такие дела, ребята.
И дело нашлось - А67-150/2024 - о защите деловой репутации.
С помощью нейронки наклепали статьи, разместили на сайте, истец оскорбился и пошел судиться, а точнее устанавливать факт, имеющий юридическое значение. Почему? Потому что идентифицировать лицо, распространившее информацию (aka владельца сайта) не удалось.
Подобных решений - пруд пруди, ибо не иссякла на Руси еще анонимность (хотя казалось бы). На дело я обратила внимание из-за упоминания GPT.
Тут нужно отметить, что для целей закона не так важно писал ли ответчик свои мысли в тетрадке и выставлял фото записей, опубликовал пост в анонимном блоге или генерил тексты с помощью своего ИИ сервиса - важен факт распространения и качество распространяемой информации (порочащая или не соответствующая действительности).
Надлежащими ответчиками по искам о защите деловой репутации являются авторы не соответствующих действительности и умаляющих репутацию сведений, а также лица, распространившие эти сведения.
Допустим, что в этом кейсе автора могло не быть (ибо ИИ сервис не автор, но и юзера мы таковым назвать не можем), но владелец сайта - это распространитель информации, что позволяет предъявлять требования и к нему.
Такие дела, ребята.
👍16❤3
Forwarded from NLP Wanderer
Скоро я в коллаборации с Vikhrmodels релизну русскую general арену (на основе кода Arena-Hard-Auto. А еще готовлю несколько других крупных 🤗 релизов и статей (хабровских)...
А пока вам текущий стейт со всеми лучшими опенсорс (и не только моделями)
Датасет использованных русских промптов (500 штук), уже выложен и доступен по ссылке
P.S. Скоро восстановлю ведение канала, были не очень приятные обстоятельства для его ведения...
А пока вам текущий стейт со всеми лучшими опенсорс (и не только моделями)
Датасет использованных русских промптов (500 штук), уже выложен и доступен по ссылке
❤🔥26👎4😁4👍3❤1
Love. Death. Transformers.
Aligment эм ну спецефичный и не склонный генерить голых людей у SD3.
"да у них мудацкий фильтр на датасет висел который раньше для прода использовали aka safety_checker_pipeline"
инсайты от уволенного сотрудника stability
upd он говорит что уволился сам
инсайты от уволенного сотрудника stability
upd он говорит что уволился сам
😁35👍1
Привет!
Мы влабараторию ебаного ресерча Vikhr models открываем летние стажировки
Что по задачам:
- Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга
- собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком!
- Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO)
- Есть целых! 4v100 и к конце лета приедет а6000
- Собрать самые крутые и самые мемные бенчмарки😎
- развлекатся с vllm, быстрым инференсом и при желании строить опенсуср
- если вам хочется заводить свою шизо идею а на работе не дают - велком, мы сами такие
Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме)
Скидывать cv,нюдсы, вопросы, ответы, предложения в: https://forms.gle/54BLnMMxZuNNboev6
НАБОР ЗАКОНЧЕН!!! https://xn--r1a.website/lovedeathtransformers/8009
Мы в
Что по задачам:
- Мержинг, стакинг, замеринг, эволюционка поверх LLM cтакинга
- собирать крутые инструкт сеты, у нас много gpt4 токенов, если хочется трогать руками RAG, агентность, function calling и прочие хайповые слова - велком!
- Учить Lora на разные задачи и трогать кучу очень интерсных задач (SPPO, DPO, KTO)
- Есть целых! 4v100 и к конце лета приедет а6000
- Собрать самые крутые и самые мемные бенчмарки😎
- развлекатся с vllm, быстрым инференсом и при желании строить опенсуср
- если вам хочется заводить свою шизо идею а на работе не дают - велком,
Оплата: в авторах на хабре, вероятно на arxiv, уникальный опыт(сорян денег реально нет, мы реально работаем на энтузиазме)
Скидывать cv,
НАБОР ЗАКОНЧЕН!!! https://xn--r1a.website/lovedeathtransformers/8009
🥴87👍32🔥14💩11❤7🤔2😁1🤮1
Love. Death. Transformers.
Its world model if it hype enough2 - OpenSora 1.1 - В основе модификация поверх pixart alpha или latte, я хуй знает, в код полезу позже, суть одна - 3d unet с кондишеном на т5 - СASUAL VIDEO VAE - короче это vqvae, только он сжимает не только картинку…
Media is too big
VIEW IN TELEGRAM
Its world model if it hype enough2 - OpenVid-1M: A Large-Scale High-Quality Dataset
for Text-to-video Generation
Новая китайская бюджетная world model, 35к бачей на претрен, 1м пар видео-описание
Архитектурно это OpenSora с небольшими доработками, работает примерно так же(хуево), но учится на датасете в 50раз меньше.
model paper dataset
for Text-to-video Generation
Новая китайская бюджетная world model, 35к бачей на претрен, 1м пар видео-описание
Архитектурно это OpenSora с небольшими доработками, работает примерно так же(хуево), но учится на датасете в 50раз меньше.
model paper dataset
❤7🤮2💩2🤡1
#чтивонаночь
Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis
Отличная китайская модель,
- 2.6b unet, glml как text encoder
- много чистили данные с помощью VLM и дополнительно OCRили их
- обратите внимание что модель лучше с китайским работает
игратся
github
kolors.kuaishou.com
Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis
Отличная китайская модель,
- 2.6b unet, glml как text encoder
- много чистили данные с помощью VLM и дополнительно OCRили их
- обратите внимание что модель лучше с китайским работает
игратся
github
kolors.kuaishou.com
👍14🔥5❤2
Forwarded from Take Friends to Luna Park
К нам пришло много новых подписчиков — мы вас видим, привет! 👋
Для вас и для всех остальных — самый лаконичный дайджест: все актуальные вакансии из канала в одном посте. Только тайтл, локация, деньги. Все вилки — гросс в год, все контакты и подробности — в исходных постах. Поехали!
SWE, SRE:
1️⃣ Founding Engineer with system experience в Axiom. Remote, US hours, $150k-250k + доля 0.5-1%.
2️⃣ Core Rust Engineer with blockchain/system experience в NEAR. Remote, $200k-400k total.
3️⃣ Senior C++ Developer в Order Capital. Релокейт в Дубай, $180k-360k на руки(!) в среднем с бонусами + возможен профитшеринг. В посте было написано меньше, но вы верьте тому, что мы говорим сейчас.
4️⃣ System Architect в Noeon. Релокейт в Токио, $130k-200k + опционы.
5️⃣ Software Engineer with system/distributed experience в Databricks. Релокейт в Сербию, вилка-которую-нельзя-называть + опционы (очень много опционов!)
6️⃣ Search Engine Engineer в Perplexity. Релокейт в Лондон, $150k-250k + опционы.
7️⃣ Senior Rust Engineer в Aurora. Поста нет, а вакансия есть. Про саму Аврору мы писали, например, тут. Нужен опыт с L1-блокчейном и Rust. $140k-180k + токены. Расскажет @AlbinaMakarova.
8️⃣ SRE/SWE(Go) в инфра-команду Aurora. По ссылке — вакансия с уклоном в SRE примерно 80 на 20, но и зеркальная ей тоже существует! $80k-120k (вилка подросла!), ремоут.
9️⃣ EA-aligned Software Engineer (middle) в BlueDot Impact. Релокейт в Лондон. Coming soon! Можете тихонько спросить в лс у @owlkov.
ML (Engineers, Researchers, Ops):
1️⃣ Data Engineer в Recraft. Релокейт в Лондон, $100k-145k + опционы.
2️⃣ Founding MLOps в Atla. Релокейт в Лондон, $200k–380k + норм доля.
3️⃣ ML Research Scientist в METR. Релок в US (Berkeley) без лотереи, $150k-365k, до 550k для супер-лида.
4️⃣ ML Engineer снова в METR. Тоже релок в Беркли без лотереи, тоже $150k-365k.
5️⃣ LLM Engineer в Perplexity. Релокейт в Лондон, $150k-250k + опционы.
6️⃣ Research CV Engineers, Research Tech Lead в HeyGen. Можно ремоут из Европы, можно офис в США. $180k-300k + опционы.
7️⃣ Engineering Manager в FAR, AI safety лабораторию. Тут мы тоже не успели написать пост, но от вас нужно 2+ года лидерства техническими командами и опыт в разработке или ML. Ремоут ок, но лучше релокейт в Беркли, США, причём без лотереи! $125k-$250k+. Всё остальное можно узнать у @natmartem.
Quantitative Research:
1️⃣ Senior Quant в Order Capital. Дубай, $220k-360k в среднем с бонусами + профитшеринг.
2️⃣ Кванты всех уровней в NDA HFT. Кипр, джунам $100k-180k на руки(!) в среднем с бонусами, синьорам — больше. Спросите у @owlkov!
Для вас и для всех остальных — самый лаконичный дайджест: все актуальные вакансии из канала в одном посте. Только тайтл, локация, деньги. Все вилки — гросс в год, все контакты и подробности — в исходных постах. Поехали!
SWE, SRE:
ML (Engineers, Researchers, Ops):
Quantitative Research:
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉18❤10 10 7👍5👏4🌭3💅3😁1
Forwarded from Админ трогает траву
Сегодня вечером пьем Aleksandrovic Chardonnay 2022 и перечитыаем Flan - одна из важнейших работ по инструктивному обучению.
В ней показали генерализацию и перенос знаний на diverse instructions tuning, а ещё ее делал стажёр (!!!)
А если вы в Белграде то заходите к друзьям из SlOJ - у них новое меню.
Статья
А слушаем крайний альбом Little Big Lobster popstar
В ней показали генерализацию и перенос знаний на diverse instructions tuning, а ещё ее делал стажёр (!!!)
А если вы в Белграде то заходите к друзьям из SlOJ - у них новое меню.
Статья
А слушаем крайний альбом Little Big Lobster popstar
🤡39💅27🔥5🍌2❤1❤🔥1👍1
покупка nvidai a6000 это что то типа угадай мелодию поколение карты по охлаждению и турбине
😁31👍2
накидайте реакций если надо стрим про FLAN, на 100 думаю на 200 делаю
🔥276 64👍26 16💅8🗿7 4 3❤🔥2❤1👎1
ЭЙ ПАРЕНЬ? ЧТО СИДИШЬ СЛОЖА РУКИ??? БЕРИ СВОЮ 3060 И БЕГИ ОБУЧАТЬ LLAMA MERGE ASUKA AYANMI RAY HORNY EDITION!!!!
а выяснить можно ли обучить такую модель достаточно воспользоваться
huggingface.co/spaces/Vokturz/can-it-run-llm
пост писался ради картинки
а выяснить можно ли обучить такую модель достаточно воспользоваться
huggingface.co/spaces/Vokturz/can-it-run-llm
👏39😁12🔥5❤3👍3
Forwarded from Пресидский залив (Nadia ズエバ)
Aesty: Pocket AI Stylist теперь в AppStore! 🎉😎
Релизнули аппку Aesty, которая поможет собрать образ с нуля или оценить уже готовый. Никаких абстрактных советов, только конкретные и прозрачные рекомендации🫡
С чем поможем?
1️⃣ Как стилизовать: Оценим ваш лук и дадим советы, как его улучшить, основываясь на ваших предпочтениях.
2️⃣ Персональные рекомендации: Покажем, какие цвета, бренды и вещи из вашего гардероба лучше всего соответствуют вашим запросам.
3️⃣ Цифровой гардероб: Оцифруем вещи по любым фоткам, в том числе на человеке. Определим их стили и сезон.
Го тестить и скорить аутфиты! 🏄
Промик EARLYBIRD на первые 2 недели с премиумом!
Релизнули аппку Aesty, которая поможет собрать образ с нуля или оценить уже готовый. Никаких абстрактных советов, только конкретные и прозрачные рекомендации
С чем поможем?
Го тестить и скорить аутфиты! 🏄
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍7💅6❤5🤡3👎1