Data Secrets
77.4K subscribers
6.06K photos
593 videos
20 files
2.44K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Врачами было выявлено новое серьезное психическое заболевание. Проверьте себя на симптомы:

– Вы легко забываете то, что было сказано в разговоре минуту назад
– Часто вообще не понимаете, о чем идет речь, и вставляете неуместные и неподходящие фразы
– Вы тратите очень много энергии и ресурсов на общение
– Иногда вспоминаете то, чего на самом деле не было

Если вы набрали хотя бы 2 пункта, то у вас LLM. Срочно примите дообучение.
😁145😨227👍4🔥32👨‍💻2🤗2
Breaking: издательство The Information сообщает, что Meta планирует выпустить компактные версии Llama-3 на следующей неделе!

Основная же модель семейства Llama-3 ожидается летом.
👍34🔥105🥰2🐳1
Сегодня снова обновилась LMSYS Chatbot Arena Leaderboard

В прошлый раз мы видели, как на главном поле битвы LLM лидерство переходит от GPT-4 к Claude 3 Opus. Теперь же изменения настигли опенсорс игроков борды.

Модель Command R+ от команды cohere поднялась на 6 место, достигнув уровня GPT-4-0314 и набрав 13K+ голосов. Теперь это лучшая открытая модель.

Command R+ появилась всего 5 дней назад. Эта LLM оптимизирована под RAG, то есть заточена специально под решение задач бизнеса.
🔥40👍96👏1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Инсайд кадры: Цукерберг тренит веса новой Llama-3.

Судя по всему, модель будет мощной.
🗿84😁66🔥14🤯5👍4🤪2
Как Netflix Prize изменил рекомендательные системы навсегда

"НАМ НУЖНО ВЫИГРАТЬ МИЛЛИОН ДОЛЛАРОВ"


Лестер Макки был старшим специалистом по информатике в Принстоне, когда его друг ворвался в его комнату в общежитии с этими словами. На дворе был 2006 год. Хотите знать, что было дальше? Поехали!
👍44🔥145👏1🤯1
В Технопарке Сколково сегодня начался международный форум «Открытые инновации». На пленарной сессии «Технологии — ключ к суверенитету» обсудили как настроить эффективное взаимодействие государства и разработчиков для ускоренного преобразования результатов исследований в работающие бизнесы.

В рамках сессии о будущем технологий искусственного интеллекта и его встраивании в бизнес рассказал первый зампред правления Сбера Александр Ведяхин.
🗿25👍10🔥3🤯32🤨2😁1🎉1🐳1
Тайминг – огонь

Угадайте, что произошло вчера сразу после рефреша Arena, про который мы писали? Правильно, появилось сразу две обновленные модели 🤨

Новая версия GPT-4-Turbo. По метрикам наблюдается сильный прирост в математических задачах, в том числе олимпиадного уровня. Кроме того, модель дообучили до декабря 2023. Для разработчиков открыли API GPT-4V.

Mixtral-8x22B. Конфиги смотрите сверху. Если кратко: 262 GB, 8 экспертов, контекст в 65536 токенов.

Если раньше лидерборды обновлялись раз в пару месяцев, то сейчас счет в гонке идет на дни, а то и на часы. Ждем, что будет дальше.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
35🔥16👍7🥰1👏1
Кстати, с интро к своей новой модели Mistral вообще не парились. Без привет и до свидания просто твитнули ссылку на торрент с весами.

Такое вот доброе утро от французских коллег 🥖
Please open Telegram to view this post
VIEW IN TELEGRAM
😁83👍761🥰1👏1
Вау, первая в России мультимодальная модель! Да еще и в опенсорс!

OmniFusion 1.1., помимо привычного LLM-диалога, может отвечать на вопросы по картинкам. Например, туда можно сгрузить написанные от руки задачи, попросить проанализировать карту, или получить рецепт по фото продуктов.

В основе – Mistral, но можно легко положить в ядро любую другую LLM. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, она хорошо справляется со сложными задачами и понимает русский.

Разработчики открыли модель как для некоммерческой, так и для коммерческой деятельности. Кстати, статья про OmniFusion сегодня на первом месте в списке daily papers на Hugging Face.

Огромный респект коллегам из AIRI 🔥

Статья | GitHub | Пост на Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏66🔥25👍165🤯4👌1
А что это мы все про OpenAI и Mistral? Google вот тоже старается:

⚙️ Вчера вышло крутое обновление Gemini 1.5 Pro — у нейросети появилась новая модальность в виде аудио.

Может в speech2text, суммаризацию, определение сантимента, ну и QA. Можно сгрузить до 11 часов аудио.

⚙️ В опенсорс выпущены веса для модели CodeGemma — сеточки на основе Gemma, но затюненой под всевозможные задачи по программированию. Модели небольшие, можно запускать локально (2Б и 7Б). Вот статья.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥65🤯3🌚1
Центр экосистемы ИИ сегодня – Париж. Может показаться, что это случилось как-то в одночасье после прихода Mistral. Но ничего не происходит просто так. Следите за руками:

Все началось в 2013. Тогда во Франции возникла Ecole 42 – открытая школа компьютерных наук, основанная на концепции p2p обучения. Сам концепт такого дополнительного образования был тогда не очень развит, но из школы выходили сильные спецы, чем она и привлекла внимание.

– В 2015 наш любимый француз Ян Лекун основал FAIR Paris (Facebook AI Research). После этого много талантливых ученых начали съезжаться во Францию со всей Европы.

– Кстати, сам Ян Лекун признан одним из трех "изобретателей" глубокого обучения, каким мы его знаем.

– В 2018 GoogleDeepMind открыли большую лабораторию в Париже. После этого стало очевидно, что если вы собираете большую международную ИИ-команду, то Францию во всех смыслах нельзя обойти стороной.

– В 2016 впервые была проведена VivaTech. Тогда она собрала около 2400 стартапов и 2000 инвесторов. По сей день мероприятие остается одним из крупнейших стартап-ивентов в мире, туда ежегодно съезжаются тысячи талантов.

– Также в 2016 во Франции был основан HuggingFace, а про него вы и так все знаете.

– Кстати, именно HF стал одним из первых стартапов, присоединившихся к французскому стартап-сообществу Station F (сейчас крупнейшему в мире, см.картинку), основанному в 2017, конечно же во Франции.

– Итак, к 2019 году AI в Париже уже был во всей красе. А во время пандемии главный "конкурент" – кремниевая долина – сильно потеряла в своем влиянии, и Париж стал еще более заметен.

– В 2021 году выстрелил HF, в 2023 – Mistral. И кроме того, PhotoRoom, Mithril Security, Giscard, ChainLid, Zama – это все французские стартапы.

В 2023 мы имеем то, что имеем. Как видите, это не результат удачи 2-3 стартапов, а путь длиною в десятилетие.
🔥88👍17🤯146👾6🤨1
Он не боялся восстания ИИ, и где он теперь? Делаем выводы.
😁90👍8🔥73🍓3
Meta показали свой новый чип MTIA (Meta Training and Inference Accelerator)

Говорят, он гораздо производительней первой версии, которая вышла год назад. На этом чипе Meta, как сказано в статье, уже может крутить свои рексисы, а это дорогого стоит.

На сайте можно интерактивно поиграть 3D модельками и схемами и почитать подробности.

Зачем покупать у Nvidia, когда можно сделать самим?
👍227🤯6🔥3