Data Secrets – Telegram

Data Secrets

77.3K subscribers

6.04K photos

592 videos

20 files

2.42K links

Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN

Download Telegram

About

Blog

Apps

Platform

77.3K subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

Кстати, помимо прочего Google недавно релизнули просто огненный интрумент для понимания архитектуры LLM

Model Explorer берет модель и рисует по ней граф. В его вершины можно проваливаться все глубже и глубже, и таким образом от верхнеуровневых блоков архитектуры опускаться к ее низкоуровневым структурам.

Посмотрите на гиф - красота да и только. И все это в опенсорс! Идеально для презентаций и учебы.

❤71👍22❤‍🔥13🔥2🤯1

10.1K views12:45

Очки с искусственным интеллектом – это не предел. Meta находится на ранних стадиях разработки наушников с ИИ, внутри компании известных как «Camerabuds».

Предположительно, цель проекта – это конкуренция с коллабом OpenAI и Apple, которые планируют за счет Альтмана по максимуму внедрить в свои устройства ИИ.

❤28👍10🔥5🥰2

7.58K viewsedited 17:21

Там заехал новый тех.отчет от Google по Gemini 1.5 Pro на 153 страницы

🫠

Это та самая модель с презентации с контекстом в 1млн токенов. Первая картинка – прирост в метриках относительно февральской версии на основных бенчмарках. Теперь модель даже обогнала Gemini 1.0 Ultra.

Примерно треть отчета почему-то посвящена переводу. Хвастаются, что Gemini даже лучше, чем GPT4 Turbo с ростом примеров в трейне учится переводить на непопулярные языки (картинка 3).

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍32🔥7❤4

8.06K views08:38

Найдена профессиональная клавиатура для всех AI разработчиков

🔥76🗿23😁18❤10🤨6😐5👍2🍌2

7.36K views10:24

Для всех платно, но для любимых акционеров скидка

☺️

Примерно год назад Reddit сделали свое API (то есть пользование их данными) платным. И не просто платным, а чертовки дорогим. На Google, например, Reddit теперь зарабатывает примерно $60 млн в год за то, что предоставляет контент для обучения моделей.

Тогда это породило огромную волну забастовок пользователей.

Сегодня стало известно, что Reddit заключили договор с OpenAI, которые теперь будут бесплатно использовать данные Reddit для обучения. Взамен OpenAI просто даст Reddit доступ к каким-то ИИ-функциям и станет их рекламным партнером.

Почему так? Просто дядюшке Сэму, как оказалось, принадлежит уже целых 10% акций соцсети, которые к тому же на фоне новости выросли в цене более, чем на 16%.

Волк с Уолл Стрит gold edition

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡38🔥15❤8👍2🤔2

7.85K views13:19

Как только OpenAI объявили о сотрудничестве с Reddit, главный их хейтер Илон Маск сразу тут как тут

«Пфф, Grok в партнерстве с 4Chan»

😁86🔥11❤10⚡1

7.66K views18:02

В сообществе продолжаются дебаты по поводу того, что после ухода Суцкевера и Лейке OpenAI лишилась команды SuperAlignment. Команда занималась безопастностью ИИ, или иначе говоря тем, чтобы не наступил SkyNet.

Оказалось, что исследователям из SuperAlignment уже пол года, как не выделяли необходимые ресурсы для ресерча, что и послужило причиной увольнений.

👾 Одни, и в том числе Ян Лейке, говорят, что это ужас: компания с самым сильным ИИ забила на безопасность. Формула «чем больше сила, тем меньше ответственность» в этом случае чревата для человечества катастрофой.

🤔 Другие, например Ян Лекун, соглашаются с тем, что содержать подобную команду – пустая трата денег и времени, и OpenAI поступили правильно, выдавив SuperAlignment из компании. «Выход ИИ из-под контроля - пустая фантазия».

Ваше мнение? 👾🤔

👾75🤔45🔥7👍5🤯2🫡2

7.71K views10:05

Как трушные мультимодальные модели генерируют картинки? Вчера Meta* выпустили новую мультимодальную модель Chameleon. Эта модель способна понимать и генерировать изображения и текст в любой последовательности. Но что это на самом деле означает? Если ИИ…

Забыл про batch norm…

❤66😁36🔥10👍7🤪4

8.25K views12:29

Media is too big

VIEW IN TELEGRAM

Макс Тегмарк:

«Трансформеры — чрезвычайно простая архитектура по сравнению с мозгом. Нельзя ставить знак равно между ними и AI, это ошибочно.

Я думаю, трансформеры запомнят как нечто вроде электронных ламп, которые послужили самой ранней технологией для производства компьютеров.

Скоро мы сможем найти более эффективную альтернативу трансформерам, требующую меньше данных и ресурсов»

👍115🔥20❤8👀2

8.07K views15:26

Похоже, у языка Mojo появился конкурент

Новый опенсорс язык программирования для ИИ называется Bend. Его уникальность в том, что он сразу компилирует сложные конструкции в многопоточный код на Apple Silicon или NVIDIA GPU в HVM2 (реализовано на Rust) + автоматом распараллеливает все, что может (см. пример на картинке).

Поддерживает много прикольного, например неограниченную рекурсию, ветвления, алгебраические типы данных и т.д. То есть язык достаточно высокоуровневый, типа Python.

Правда, ЯП только выкатили, и на одном ядре он пока работает так себе. Но разработчики обещают двигаться дальше и заявляют, что в будущем Bend сможет снять очень многие ограничения, связанные с обучением ИИ.

GitHub

🔥46👍9❤4😁4🤔1

16.3K views08:35

Оказывается, чтобы выбрать голоса для GPT-4o, OpenAI провели более 400 кастингов

В новом ChatGPT сейчас 5 голосов, в том числе уже полюбившийся многим женский голос Sky. Многие даже серьезно решили, что это тот самый голос Скарлетт Йохансон из фильма "Она". К сожалению или к счастью, это не так – голос принадлежит другой актрисе озвучки.

Выяснилось, что "Sky" и других дикторов отбирали долго и тщательно вместе с профессиональными продюссерами. Компания искала голоса, которые "ощущаются вне времени" и "вызывают доверие".

Говорят, что теперь те, кто озвучили ChatGPT, очень неплохо получают. Однако их личности не раскрывают.

👍56🔥15❤6🗿4🍌2

7.95K views10:28

Основано на боли 😢

Please open Telegram to view this post

VIEW IN TELEGRAM

😁140❤15🔥7🙈4

9.78K views12:19

This media is not supported in your browser

VIEW IN TELEGRAM

Поговорим о красоте математики

Слышали о фракталах? Это такие самоподобные множества, то есть их части «рекурсивно» похожи на целое. Выглядит это обычно бесподобно (см. картинки в комментариях).

Так вот. Есть некоторое подобие в том, как математически получаются фракталы и как мы обучаем нейросети. И то, и то, фактически – результат многократного применения функции к ее собственным выводам, а также в обоих случаях эта функция имеет гиперпараметры, управляющие ее поведением.

А теперь… взгляните, как выглядит тепловая карта гридсерча для нейросети. Она фрактальная! Синеватые цвета соответствуют тем гиперпараметрам, для которых обучение сходится, красноватые – тем, для которых нет.

Это невероятно! Причем возможно, это несет в себе нечто большее, чем просто картинку: глубокую связь между ассиметричной геометрической природой фракталов и динамикой в сетях, которая поможет нам улучшить существующие методы оптимизации гиперпараметров.

* красоту заметил и исследовал ученый из Anthropic, на днях вышла статья.

🔥85🤯14❤11👍5😍5🤔1

8.75K viewsedited 15:19

This media is not supported in your browser

VIEW IN TELEGRAM

Вот так утречко. Только вчера мы говорили про голоса в ChatGPT, а сегодня сама Скарлетт Йоханссон сделала неожиданное заявление об этом.

Оказывается, Альтман в сентябре прошлого года связывался с актрисой, чтобы она озвучила Chat GPT. Та отказалась. Но Альтман все равно нашел актрису с похожим голосом (или просто клонировал голос Скарлетт?).

После демо с этим голосом и двусмысленного твита со словом «her», Сэм снова связался с Йоханссон с просьбой передумать. Но та к тому моменту уже наняла адвокатов, которые и вынудили OpenAI удалить тот самый (не)украденный голос Sky.

Захватывающе, да? Вот только есть нюанс. Обновление с голосовым режимом вышло в сентябре 2023, и очевидно, на тот момент все голоса уже были выбраны, записаны и обработаны. Так что же на самом деле произошло?

🔥30😁22🤔8👍5🤯4👻1🤪1

8.36K views06:39

Который час? Самое время выигрывать крутые книги А.В.Савватеева и А.М.Райгородского с автографами авторов!

Недавно стартанула приёмная кампания Онлайн-магистратур МФТИ. В честь этого мы с институтом объединились для того, чтобы совместно розыграть для вас улетные призы!

Пятеро победителей получат 2 книги А.М. Райгородского "Кому нужна математика?" и 3 книги А.В.Савватеева "Математика для гуманитариев. Живые лекции" с личными подписями авторов!

Что делать, чтобы забрать экземлярчик:
1. Быть подписанным на этот канал (@data_secrets)
2. Нажать на кнопку «Участвовать»
3. Ждать 28 мая, когда мы объявим победителей.

Прочитать подробности об онлайн-магистратурах МФТИ можно здесь. А еще они крутой курс подготовки к вступительным экзаменам по математике с нуля запустили – загляните, вдруг вдохновит, как раз до четверга есть возможность записаться с большой скидкой.

Кстати, возможно с 2025 в магистратуру МФТИ больше нельзя будет поступить без профильного технического бакалавриата/специалитета. Так что самое время использовать последний шанс!

Участников: 1063
Призовых мест: 5
Дата розыгрыша: 17:00, 28.05.2024 MSK (завершён)

Победители розыгрыша:
1. Ivan Podluzhnyi - 120stm
2. Zhomart Utemissov - 1216sg
3. M A - 12qkkg
4. Harley - 12t1ms
5. Бондаренко Дмитрий - 12st14

🤯30🔥15❤13👍10⚡1😁1

8.83K viewsedited 08:33

Участвовать

– Вы что, правда клонировали голос Йоханссон?
– Эээ… мы использовали общедоступные данные

😁124🔥12❤8👍1🗿1

8.35K views10:51

Полезное: на просторах Kaggle мы нашли супер-ликбез по NLP

Начиная с Word2Vec и GloVe, заканчивая BERT, Seq2Seq и механизмом внимания – подробно, структурировано и понятно. Полезно будет и тем, кто только начинает нырять в NLP, и тем, кто уже неплохо разбирается.

🔥66👍16❤10⚡2

10.7K views13:27