Valuable AI / Валентин Малых
1.89K subscribers
449 photos
55 videos
2 files
440 links
личный канал про ИИ
Download Telegram
вышла довольно интересная статья про self-supervised RL, тут суть сводится к тому, чтобы генерировать инструкцию, которая улучшает ответ на определенный ответ и обучении на этой инструкции (первая картинка)

на второй картинке показано, как проходит процесс дообучения; а вот на третьей - результат этой петли обратной связи, качество на более ранних задачах постепенно ухудшается; я ранее высказывал сомнение по этому поводу (для другой работы на схожую тему), теперь оно подтвердилось

@valuableai
🔥3👍2
вышел небольшой отчет от маленького коллектива разработчиков (шутку придумал не я, не претендую на чужие лавры)

@valuableai
😁7
всем привет, сегодня четвертый выпуск подкаста "Капитанский мостик", он как всегда посвящен важным новостям прошедшей недели; веду, как и всегда я и Дмитрий Колодезев; видео тут:


VK Video

YouTube


присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai)

@valuableai
7
известный математик Теренс Тао (смотрит на тебя с осуждением) отбомбился в мастодоне (это такой опенсорсный аналог твиттера) на тему того, что LLM-ки на самом деле не побеждают в математических олимпиадах; если сжать его пламенную речь, то LLM поставлены в тепличные условия, в которые людей никогда не ставят; на мой взгляд, это утверждение показывает, что товарищ Тао не понимает, как работает процесс улучшения качества в ИИ: начинаем с простых задачек, потом переходим к более сложным, но в упрощенных условиях, а потом уже, глядишь, и Ли Седоля победили

в этой связи стоит упомянуть про забавный issue в репе Gemini, там человек жалуется, что у него Gemini случайно протерял важные файлы (судя по названию папки - по работе с Claude; совпадение? не думаю!); этот случай, на мой взгляд, - проявление того же процесса, мы уже доверяем агентам важные действия, а они еще не выросли из своего sandbox'a

в качестве вывода возьму русскую народную пословицу "доверяй, но проверяй", в том числе LLM; такие дела

@valuableai
10💯4👍2👎1
очередные новости из разряда "два мира - два Шапиро": Discord в Британии и Австралии запускает по лицу верификацию возраста, а компания VisionLabs запустила проход в метро Ташкента; кстати, они же делали сервис оплаты по лицу в метро Алматы и Москвы

@valuableai
🔥5😢1
молодцы китайские товарищи: у них у самих еще роботакси еще не вышли в промышленную эксплуатацию, а они уже экспортировали технологию в Саудовскую Аравию (на первой картинке министр транспорта Саудовской Аравии приобщается к светлому будущему)

по первой ссылке кстати много интересного, в частности можно узнать, что сейчас в Китае порядка нескольких тысяч роботакси уже ездят в тестовом режиме (вторая картинка)

что еще хочется отметить, Саудовская Аравия не первый раз воспринимает передовые технологии из Китая: робогражданка София сделана именно здесь

@valuableai
👍8🤔1
мимо меня прошел очередной базворд Physical AI; его продвигает CEO nVIDIA Дженсен Хуанг; суть его сводится к тому, что текущий хайп c GenAI подходит к концу, надо хайповать на чем-то новом, теперь это будут самоуправляемые роботы (как на картинке); отец обучения с подкреплением Саттон и сооснователь DeepMind Сильвер на эту тему недавно выпускали работу

робот с картинки, кстати - это часть усилий Южной Кореи по применению ИИ в обороне (недавно такая же история была в США)

@valuableai
2
вышло интересное исследование от Microsoft, в котором они проанализировали запросы к Bing Copilot на тему частоты и качества ответов; точнее они сделали даже больше, они посмотрели, как эти запросы покрывают круг вопросов для разных областей; первая картинка - это верхние 40 профессий с наибольшим покрытием (весь этот наш дата саенс ожидаемо как раз здесь), вторая картинка - нижние 40; в нижние 40 ожидаемо попали несколько медицинских специальностей, но почему-то также водители грузовиков, хотя даже у нас уже идет обкатка грузовиков-беспилотников

в верхние 40 попали внезапно историки, хотя мне совершенно неясно, как ИИ может выполнять такую работу, а также - стюардессы, здесь тоже для меня загадочно - кто вам в полете выдаст чай с бутербродом?

интерпретировать результаты надо на мой взгляд в том смысле, что услуги специалистов из верхней части списка станут доступнее в ближайшие годы, т.к. ИИ сможет автоматизировать большую часть работы, для остальных придется подождать

@valuableai
😁7💯3😢1
утащил из рабочего чатика

@valuableai
😁27🥰2🤡1
всем привет, сегодня пятый выпуск подкаста "Капитанский мостик", он как всегда посвящен важным новостям прошедшей недели; в этот раз мы были втроем, я, Дмитрий Колодезев и Алексей Натекин; видео тут:


VK Video

YouTube

в качестве пасхалочки, слушайте у Натекина на фоне петухов и прочую сельскую живность; присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai)

@valuableai
👍12🔥2
вышла интересная статья в Nature от Google, посвященная предсказанию землетрясений; в нашей стране землетрясения штука довольно редкая за пределами Камчатки и в небольшой степени горных регионов - Саян, Кавказа, но например в Киргизии и Таджикистане землетрясения вполне себе частое явление; на первой картинке показаны серым места, где землетрясения были зафиксированы, а желтым и красным, где о них предупредили заранее; на второй картинке как раз распределение времени уведомлений

о чем вообще статья? о довольно простой идейно вещи - можно собирать данные акселерометров с 2,5 миллиардов Android-смартфонов по всему миру и предсказывать землетрясения засчет хорошего пространственного покрытия; но как это реализовать технически, это интересно, и про это как раз в статье не написано, я ставлю на то, что там есть ML-алгоритмы, хотя бы кластеризация

@valuableai
👍11
тут вышла работа CUDA-L1, посвященная тому, как обучить модель писать более эффективный код на CUDA (ускорение и пример на первой картинке); на мой вкус сама по себе данная работа не настолько интересна: авторы придумали, как более эффективно выбирать варианты для GRPO, а в остальном все стандартно, сгенерировали варианты, отобрали рабочие и быстрые, научились на них (вторая картинка); более интересно другое, что авторы нашли, что модели учатся хитрить с учетом времени, чтобы получать награду за ускорение, например, можно учитывать только завершение главного треда и не ждать дочерних

а что еще важнее, из той я узнал о существовании KernelBench (третья картинка) - собственно на нем и производятся все замеры; мне кажется, его можно считать эталонным бенчом для программирования именно по методологии

@valuableai
🔥2