Valuable AI / Валентин Малых
1.85K subscribers
435 photos
54 videos
2 files
435 links
личный канал про ИИ
Download Telegram
мой коллега нашел уникальные задачи для рассуждений, которые не идут ни в какое сравнение с MATH500 или AIME; комментарий нашедшего:
Редкий язык, нетипичный домен и возможно не утёк в трейн

ждем бенчмарк!
👍18😁16🔥4🤯3🆒1
сегодня будет видео не про меня, а про Ивана Бондаренко (я про него упоминал в своем обзорном посте про NLP группы), в свое время они с коллегами сделали "Писца" - ASR для русского языка, а тут Иван рассказывает о маленьких модельках и их применениях (я недавно писал про работу, где модель размером 1B показывает себя лучше модели на 405B)

к слову, коллеги сделали расшифровку выступления именно с помощью своего Писца, на мой взгляд это отличный пример догфудинга
🔥12👍31
недавно вышла статья, которая для этого нашего AI несет очень много пользы, а именно 5% экономии на вычислениях

я думаю, что все в курсе, что весь ИИ - это по факту перемножение матриц, например, в архитектуре трансформер механизм внимания требует 5 матричных умножений на одну голову, плюс еще одно для полносвязного слоя; другие операции - это суммирование и нормализация, которые асимптотически пренебрежимы

ну так вот, авторы статьи с помощью RL перебрали возможные вариации представления умножения матриц и нашли ускоренный; графически он представлен на первой картинке, а на второй картинке сравнение количества вычислений с оптимальным алгоритмом - рекурсивным алгоритмом Штрассена (аШ); до размера 256 используется т.н. наивное умножение (как и в современных реализациях аШ), т.к. оно эффективнее на малых размерах, а дальше уже новонайденный алгоритм, дающий 5% преимущества перед аШ

P.S. на моей памяти это первая статья, где - судя по имени - наш соотечественник имеет аффилиацию китайского университета
🔥11
я уже высказывался про ARR, а тут пришло письмо с обновлениями политики ARR:
* All authors must complete a form confirming that their OpenReview profile is complete and that they are willing to serve as a reviewer if asked.
* Any qualified author may be assigned to review. “Qualified” means at least two papers in main ACL events or Findings, and at least one additional paper in the ACL Anthology or a major ML/AI venue. (See detailed list in the policy).
* Review duty exemptions are possible on a case-by-case basis. Authors serving in other roles (e.g., ACs) are not required to review.
* Reviewers or chairs deemed highly irresponsible such as missing deadlines without warning, violating guidelines on LLM use and professional tone, extremely terse reviews, may be barred from committing their work to EMNLP 2025 and (re-)submitting to the next ARR cycle
* Great reviewers and chairs will receive increased recognition at conferences and may win free virtual registration to an *ACL event.

We encourage everyone to read the full policy here: https://aclrollingreview.org/incentives2025

обращаю внимание на предпоследний пункт (выделен курсивом), теперь решили переходить к репрессиям, т.к. система выстроена настолько неэффективно, то рецензирование - это совершенно невознаграждаемый труд, от которого все пытаются отвертеться; на этом фоне очень выпукло смотрится последний пункт с виртуальным пряником после реального кнута

на мой взгляд, есть очевидное решение проблемы вознаграждения труда рецензента: нужно просто указывать имена рецензентов в дополнение к именам авторов статей прямо в финальном тексте статьи (отдельно от последних, само собой), тогда возникает а) вознаграждение в виде известности - всем приятно быть рецензентом хорошей статьи, но и б) нежелание ассоциировать свое имя с плохими статьями, так что можно ожидать и более объективных рецензий
👍16💯31
китайский стартап Synyi AI открывает в Саудовской Аравии клинику, в которой ставить диагнозы и выписывать рецепты будет ИИ; в Китае, где все еще остро стоит вопрос нехватки врачей сельской местности, разрешено оказывать консультации с помощью ИИ; но тут уже новый уровень - полноценная клиника

к слову, первый в мире робот, у которого есть полноценное гражданство - это София, она тоже из Саудовской Аравии (точнее сделана она в Китае, но гражданство имеет СА)

P.S. ближневосточные страны в каком-то роде соревнуются во внедрении ИИ, не так давно из ОАЭ была новость, что будут использовать LLM для написания законов
👍5👀53
вышла очень интересная статья от коллег из Циньхуа; основная ее идея изложена на первой картинке - можно взять обученную модель, сделать несколько генераций, выбрать наиболее частый ответ на вопрос и считать его правильным; это такой self-supervised learning от мира RL; на бенчмарках получается очень хороший прирост (вторая картинка); но меня смущает, что это только сжимает петлю самопожирания, не будет ли здесь того явления, которое известно как mode collapse в GAN?
💯6👍3
сегодня в рамках курса буду рассказывать про RL (обучение с подкреплением) в LLM; зарегистрироваться можно здесь
👍12🔥4
DeepMind выпустил AlphaEvolve: на картинке общая схема работы, а на видео - демонстрация работы, а именно итеративное улучшение кода; общая идея в том, что выбирается задача, делается функция потерь и итеративно обновляется, улучшается код, который ее решает; в частности они смогли найти лучшее решение для перемножения матриц размером (2,4,4), как раз недавно было еще одно улучшение для алгоритма Штрассена; решение от DeepMind чем-то напоминает AI Scientist от Sakana, но статей само (пока?) не пишет; да и в целом идея с улучшение моделей самих себя стала весьма популярной
👍7
сегодня внезапно приглашаю всех, кто не сможет приехать лично в ВК, посмотреть трансляцию оттуда; расписание здесь; в зале Б1 будет сначала NLP (плюс один доклад из AI4SE), потом Reliable ML и Advanced LLM (почти все доклады несмотря на название секции будут про LLM); начало в 12 часов МСК
🔥13
угадайте, сколько из этих книг, рекомендованных бумажной газетой Chicago Sun-Times своим читателям, реально существуют? ответ тут
😁12👍4
вышла интересная работа от коллег из Allen AI с провокационным названием "могут ли рассуждающие модели не думать и оставаться эффективными?" (пример показан на первой картинке)

авторы показывают на экспериментах, что да, могут (вторая и третья картинки); это означает, что а) можно сэкономить на рассуждениях время и вычисления и б) старый-добрый chain-of-thought все еще хорош
🔥12
в среду у нас внезапно образовалась вторая сессия NLP в Москве, но к сожалению это все в районе обеда, регистрация тут
👍2
сразу две новости последнего времени из Китая: первая - компания Huawei (недавно выпускали свою большую языковую модель PanGu-Ultra, но что даже более важно - они делают ИИ-ускорители) объединяет усилия c UBTech для создания гуманоидных роботов; и вторая новость, что DeepSeek-R1 уже помогает человекоподобным роботам на заводе Zeekr выполнять сложные задачи
🔥18
Джон Кармак (создатель оригинального Doom и хардкорный программист) высказался на тему того, что если бы люди уделяли время оптимизации, нам бы не понадобились новые мощные компьютеры, хватило бы и текущих; я думаю, в его словах есть своя правда, но сейчас все идет к более быстрому созданию кода, следуя максиме Марка Цукерберга "Move Fast and Break Things"; в эту сторону смотрит и нашумевший вайб-кодинг, и даже автоматическое создание ПО через обучение нейросети решать конкретные задачи (недавно выкладывал видео); а оптимизацию пытаются тоже свалить на машинное обучение
👍19
1 июня в 12:00 у нас будет онлайн сразу две секции AI4SE и NLP, регистрироваться тут
🔥5👍1
передают слова Хинтона, что школы и университеты будут не нужны; тут всегда надо делать скидку на то, что ученый изнасиловал журналиста (как это недавно случилось со мной), но аргумент такой, что ИИ будет учить лучше, чем преподаватели-люди; на мой взгляд даже если это и так (у меня по этому поводу большие сомнения), то вторую, более важную миссию школы и университета ИИ заменить не сможет - эта миссия по социализации человека, обучение его существованию в коллективе; нравится это кому-то или нет, но мы животные социальные, именно коллективная работа позволила построить нашу цивилизацию, где во многих странах нет голода, как массового явления, например; так что может быть стоит переосмыслить роль школы и университета, но отказываться от этих социальных институтов на мой взгляд преждевременно, т.к. нет замены для второй важнейшей функции

@valuableai
👍19💯4💊31