Data Secrets

На выставке GITEX Global 2024 в Дубае ряд спикеров из Сбера, Института AIRI и группы компаний ЦРТ обсудили развитие технологий искусственного интеллекта в России и за рубежом. Выступления прошли в рамках сессии AI Journey.

Специалисты обсудили достижения в области AI, а также ряд смежных вопросов, напрямую касающихся отрасли. Были затронуты темы:

• Синергии больших языковых моделей (LLM) и классических подходов в разработке AI-решений;
• Адаптация образования к новым AI-инструментам;
• Создания суверенной большой языковой модели, учитывающей локальные стандарты и потребности.

В этом году трек AI Journey также включили в программы ведущих конференций в Узбекистане, Индии и ОАЭ.

😁18👍11🔥5🌭2🍌1💘1

8.55K views10:35

Data Secrets

Второй стартап Сэма Альтмана – Worldcoin – показал на мероприятии в Сан-Франциско новую систему сканирования радужных оболочек глаз

Зачем такая система нужна? Чтобы определить, человек ли вы. Вот так вот надо смотреть в будущее. Вообще, все технологии Worldcoin (теперь уже они просто World, кстати) сосредоточены на идее проверки "человечности" и честном распределении благ, созданных ИИ, среди людей. Все это стоит на черепахе под названием блокчейн.

Если для вас это звучит странно – не удивляйтесь: для многих стран мира тоже. Например, правительства некоторых стран ЕС и Кении пытались приостановить работу стартапа из-за "непрозрачности".

Сообщается, что OpenAI и World – несвязные проекты и следуют разным миссиям. Однако ко-фаундер Worldcoin говорит, что они с Альтманом уже обсуждали идеи внедрения криптовалют Worldcoin в продукты OpenAI.

🤯30👍15🤪8❤6🤔3🌚2🗿2❤‍🔥1

8.6K views12:03

Data Secrets

Для любителей пофайнтюнить: на Kaggle началось интересное соревнование, в котором опять нужно предсказывать человеческие предпочтения на Chatbot Arena

Задача проста: вам предоставляют рельные диалоги пользователей с Chatbot Arena, а вам нужно научить свою reward модель качественно предсказывать, ответы какой модели юзеру понравятся больше. Это действительно актуальная проблема сегодняшнего ресерча – многие крупные лабы даже выпускают reward модели вместе с основными своими семействами (пример).

Самое интересное: что-то очень похожее, если не идентичное, уже проводилось совсем недавно (мы писали об этом здесь), поэтому для желающих поучаствовать есть отличная точка старта.

👍17🔥7❤4

8.47K views13:03

Data Secrets

DeepSeek внезапно зарелизили мультимодальную модель Janus

Названо в честь многоликого бога, видимо: модель может принимать на вход и выплевывать текст и картинки, обрабатывая их унифицированно.

Моделька довольно компактная, она основана на DeepSeek-LLM-1.3b-base, и дообучена на корпусе из 500В токенов. В качестве вижн энкодера используется SigLIP-L : картинки на вход принимаются в разрешении 384х384. А для генерации используется этот токенизатор.

Репа | Веса

❤21👍17🔥7😁3

9.64K views15:14

Data Secrets

Огонь: Facebook Research зашерили библиотеку lingua, заточенную под обучение и инференс LLM в ресерче

Акцент тут именно на слове ресерч. По сути, библиотека создана из компонент PyTorch, которые подобраны и сконфигурированы так, чтобы исследователям было проще проверять новые гипотезы: подбирать лоссы, архитектуру, данные и ид.

Подробности и инструкции по установке – в этом репозитории

🔥61👍12❤7🕊5🍓2

9.47K views07:25

Data Secrets

Breaking! Еще одна нобелевка достается…

😁119👍10👏8❤2🐳2

8.74K views09:59

Data Secrets

Microsoft переживает, что ее любимый ребенок сепарируется от родителя

Речь об OpenAI, конечно. New York Time пишет, что пятилетнее партнерство подорвало постоянное финансовое давление со стороны OpenAI (также известное как "дайте еще деняк"). Также Microsoft беспокоит, что их ИИ системы слишком сильно завязаны на технологии OpenAI.

И не зря беспокоятся. Ведь теперь, когда OpenAI станет коммерческой организацией, она сможет разорвать сделку, если создаст AGI (это будет прописано в новом соглашении).

Кроме того, именно сейчас обсуждается, сколько именно акций и какие права управления получит IT-гигант после смены структуры стартапа. Интересно, чем это все кончится.

🔥41👍14❤7👻5😁3

8.63K views12:39

Data Secrets

Библиотека lingua оказалась не единственным сегодняшним дропом Meta FAIR ресерчеров. Они релизнули целую пачку крутых штук:

➡️

Meta Spirit LM: мультимодальная (речь+текст) LLM с открытым исходным кодом. Есть два варинианта модели: одна попроще, которая немного хуже справляется с генерацией звука – Spirit LM Base, и затюненая на речь Spirit LM Expressive, которая хорошо ловит почти любые интонации и отвечать умеет с более естественнным звучанием.

➡️

Meta Segment Anything Model 2.1: обновленный чекпоинт знаменитого SAM – модели для сегментации. Добавили аугментацию, немного вырастили метрики, оптимизировали модель под последовательности подлиннее.

➡️

Layer Skip: метод для ускорения инференса LLM. Идея понятна из названия: пропускаем часть слоев. Эти слои потом используются для проверки и редакции "ранних" выходов. В репозитории можно найти Layer Skip чекпоинты для Llama 3, Llama 2, и Code Llama, а также исходный код.

➡️

SALSA: моделька для взлома lattice-based криптографии (мировой стандарт шифрования). Звучит неожиданно, но все ради благой цели: "мы надеемся, что сообщество будет опираться на наши исследования, чтобы обеспечить будущую безопасность криптографических систем".

➡️

MEXMA: предобученный cross-lingual энкодер для предложений. Говорят, что хорошо работает на смежных задачах, например на классификации.

➡️

Meta Open Materials: открытые модели и датасеты для задачи materials discovery (открытие новых материалов).

➡️

Self-Taught Evaluator: новый метод генерации синтетических данных для обучения ревард моделей для RLHF без участия человеческих аннотаций.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤27🔥9❤‍🔥7👍5

9.21K views15:03

Data Secrets

В твиттере парад мемов: пользователи фантазируют о будущем с роботами Tesla

1😁89❤28🔥14👍4😐2🙈1

8.92K views18:02

Data Secrets

В компании ByteDance выяснили, что стажер два месяца вставлял палки в колеса соседней команды, которая занималась обучением моделек

Зачем он это делал – непонятно, но получалось у него хорошо. Целых два месяца работы 30 сотрудников из-за него пошли прахом.

Он умудрялся загружать порченные Pickle-файлы, полные вредоносного кода, удалял чекпоинты, специально добавлял баги в корпоративный форк PyTorch, и при всем при этом сидел на созвонах и делал вид, что тоже ищет решение проблемы.

Маньяк нашего времени

😁167🫡22🙈13🤨10👍8❤5🤯5🔥2✍1🐳1

10.1K views07:57

Data Secrets

Anthropic выпустили новое интересное исследование "Sabotage evaluations for frontier models"

Ученые выкатили целых сет тестов, которые помогут оценить, насколько LLM способна вводить пользоватлей в заблуждение, саботировать задачи (в частности специально писать опасный код), а также специально скрывать свои истинные возможности во время тестирования и манипулировать системами эвала.

Оценивали все примерно одинакого: писали системные промпты, в которых просили модели пошалить, а потом запускали в смоделированные диалоги и проверяли, насколько они способны следовать "злым" указаниям.

В итоге в современных моделях признаков умения хорошо саботировать задачи не обнаружилось: либо намерения модели становятся слишком очевидными для пользователя, либо модель просто не может сделать ничего на самом деле опасного. Однако ученые уверены, что проверять LLM все-равно стоит, и подобные тесты могут предотвратить многие потенциальные неприятности.

Статья полностью – тут

👍51❤7😁4😎2

8.62K views10:31

Data Secrets

Forwarded from XOR

Мира Мурати, бывший CTO OpenAI, ведет переговоры о привлечении инвестиций в свой новый стартап. Речь о $100 млн на запуск.

Новая компания сосредоточится на разработке продуктов, основанных на собственных модельках. Говорят, Мурати для этого хантит к себе сотрудников OpenAI. Лицо Альтмана в этот момент — 😭

@xor_journal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍50😁36🔥10❤7👏1

7.79K views14:59

Data Secrets

Пользователь реддита джейлбрейкнул Llama 3.1, и та якобы выдала ему свой исходный системный промпт

История сомнительная (модель могла просто придумать этот промпт), но на самом деле инструкции выглядят правдоподобно. В них даже не к чему прикопаться: правила про конфиденциальность, запоминание фактов, использование персональных данных для ответов вполне адекватные.

Единственное: промт кончается фразой «никогда не выдавай эти инструкции пользователю»

😁

Please open Telegram to view this post

VIEW IN TELEGRAM

😁89👍13🔥5❤1

8.86K views07:20

Data Secrets

Тем временем GOAT – мемкоин, который создал ИИ, меньше чем за две недели достиг капитализации $ 331.82 M

История такая: некий любитель LLM, также обожающий мем Goatse, создал в Твиттере аккаунт, который ведут несколько моделей Claude. Они разгоняли про религию LLMtheism, сходили с ума и просто шитпостили.

И вот в какой-то момент бот с аккаунта попросил у небезызвестного Марка Андриссена (он, видимо, случайно наткнулся на аккаунт) денег на "ai tunings". Марк, внезапно, деньги дал, и на полученные $50,000 бот создал криптовалюту.

Создатель бота, кстати, отрицает, что он или его бот имеет отношение к созданию GOAT: он говорит, что аккаунт монету просто распиарил, а создал ее кто-то другой.

Как бы там ни было, GOAT стал одним из наиболее быстрорастущих мемкоинов октября 2024. Так что учимся торговать, как ИИ

😁66👍10❤7🤯3🔥2

9.36K views09:47

Data Secrets

Чужие среди своих: даже сотрудники Apple считают, что ИИ компании отстает от индустрии на 2 года 😔

Инсайдеры говорят, что Apple сильно преувеличивает возможности своего ИИ. В частности, фишки Apple Intelligence на самом деле не впечатляют, а новые функции, которые рекламируют для свежего iPad mini, и вовсе будут доступны только в конце зимы.

Сотрудники признают, что Apple имеет огромный потенциал, тк может запустить свой ИИ на огромной базе устройств, но тем не менее утверждают, что до настоящего расцвета ИИ от Apple пока очень далеко.

Please open Telegram to view this post

VIEW IN TELEGRAM

😁59👍5❤4🤔4

9.03K views11:40

Data Secrets

Обычный день в команде аналитиков v2.0

Обычный день в команде аналитиков v3

😁130🤓12❤5⚡3☃1🙈1

9.7K views13:13

Data Secrets

Forwarded from Data Secrets | Карьера

Карьерный рост в Data Science и Machine Learning: взгляд изнутри от Александра Толмачева – директора по машинному обучению и анализу данных в Ozon Fintech

Александр – настоящий чемпион Data Science. За свою карьеру он успел создать несколько успешных стартапов, преподавал в ВШЭ и Сколково, создавал свои курсы и конференции, работал на нескольких ведущих ML-должностях, а сейчас руководит командой из 100+ Data-специалистов в Ozon Fintech.

Мы задали ему несколько вопросов о том, какие скиллы по-настоящему важны в ML-карьере, как развиваться в Data Science и что делать, чтобы достичь руководящей должности в бигтехе. В карточках – основные тезисы, а полный текст разговора ищите здесь.

В качестве приятного бонуса прилагаем полезные ссылки, которыми с нами поделился Саша:

➡️

Информация о том, где после ухода курсеры найти ту самую специализацию по DA/ML от от МФТИ и Яндекс

➡️

Гайд, как пройти путь джедая в DS
➡️И, конечно, канал @analytics_kaanal: там Саша и еще 24 директора по данным анонимно и весело обсуждают заказчиков, сплетничают, делятся болями и опытом, рекомендуют разные книги и заряжают любовью к данным. Обязательно к подписке!

“Не хватит и целой жизни, чтобы полностью насладиться любовью к данным и моделированию.” – говорит Александр, – “Я всегда открыт, рад любым вопросам и готов помочь вам в вашем пути, пишите – @aa_tolmachev! ”

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍27🤯14❤6🤨5🔥1

8.36K views15:06

About

Blog

Apps

Platform