Valuable AI / Валентин Малых
1.89K subscribers
449 photos
55 videos
2 files
440 links
личный канал про ИИ
Download Telegram
Андрей Карпаты выдал базу про промт-инженеров, которые теперь не промт, а вовсе даже контекст-инженеры (первая картинка); мое мнение, что перепридумывать название совершенно не обязательно: в конце концов бухгалтера нынче спокойно используют компьютеры вместо счетов, и ничего; но по сути замечание правильное, промт-инженеры, как профессия, эволюционировали, расширили свою область ответственности

в связи с вышеизложенным, хочу привести пример из статьи на Хабре, в которой архитектор-проектировщик говорит, что ИИ не может сейчас помочь в его профессии, т.к. для моделей очень мало данных, на которых учиться из конкретной задаче, и очень большое количество нормативных ограничений (вторая картинка); я же думаю, что можно положиться на перенос знаний из других областей, нужно только научиться правильно подавать данные в VLM - сами схемы, СНиПы, требования заказчика и т.д.; кстати, первый бенчмарк на понимание схем уже появился

@valuable
👍95🔥4
Google выпустил свой помощник программиста (пример работы на заглавном видео); само по себе это не удивительно, кто только не выпускал за последнее время: Amazon выпустил свой аналог ГигаКода - IDE Kiro; и даже литовский стартап Sintra получил финансирование

интересно на мой взгляд то, что показано второй картинке, а именно уровень адаптации людей к ИИ, я сознательно формулирую это так, потому что мы наблюдали похожую картину - уровень принятия подсказок людьми растет (кстати, до сравнимых цифр) с течением времени без смены модели; т.е. люди адаптируются под модель, а так как Google (как и мы) использует логи для дообучения, то получается петля положительной обратной связи

@valuableai
🤔5🔥4
недавно вышел отчет от Inception Labs про их модель Mercury (я про нее писал в феврале), но отчет реально очень скучный, по факту там написано: мы все взяли из другой работы, а наша супер-скорость получается из-за проприетарного движка для сэмплирования; фу такими быть, лучше уж не выпускали бы отчет тогда

зато порадовала Apple, они выпустили работу и модель DiffuCoder, которая в отличие от Mercury содержит "мясо"; основные результаты из нее на первой картинке; основная их фишка - это адаптация GRPO для диффузионок (вторая картинка); на третьей картинке их результаты - лучше, чем другие открытые модели, правда, похуже, чем Mercury и Gemini Diffusion

@valuableai
👍4
вышла довольно интересная статья про self-supervised RL, тут суть сводится к тому, чтобы генерировать инструкцию, которая улучшает ответ на определенный ответ и обучении на этой инструкции (первая картинка)

на второй картинке показано, как проходит процесс дообучения; а вот на третьей - результат этой петли обратной связи, качество на более ранних задачах постепенно ухудшается; я ранее высказывал сомнение по этому поводу (для другой работы на схожую тему), теперь оно подтвердилось

@valuableai
🔥3👍2
вышел небольшой отчет от маленького коллектива разработчиков (шутку придумал не я, не претендую на чужие лавры)

@valuableai
😁7
всем привет, сегодня четвертый выпуск подкаста "Капитанский мостик", он как всегда посвящен важным новостям прошедшей недели; веду, как и всегда я и Дмитрий Колодезев; видео тут:


VK Video

YouTube


присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai)

@valuableai
7
известный математик Теренс Тао (смотрит на тебя с осуждением) отбомбился в мастодоне (это такой опенсорсный аналог твиттера) на тему того, что LLM-ки на самом деле не побеждают в математических олимпиадах; если сжать его пламенную речь, то LLM поставлены в тепличные условия, в которые людей никогда не ставят; на мой взгляд, это утверждение показывает, что товарищ Тао не понимает, как работает процесс улучшения качества в ИИ: начинаем с простых задачек, потом переходим к более сложным, но в упрощенных условиях, а потом уже, глядишь, и Ли Седоля победили

в этой связи стоит упомянуть про забавный issue в репе Gemini, там человек жалуется, что у него Gemini случайно протерял важные файлы (судя по названию папки - по работе с Claude; совпадение? не думаю!); этот случай, на мой взгляд, - проявление того же процесса, мы уже доверяем агентам важные действия, а они еще не выросли из своего sandbox'a

в качестве вывода возьму русскую народную пословицу "доверяй, но проверяй", в том числе LLM; такие дела

@valuableai
10💯4👍2👎1
очередные новости из разряда "два мира - два Шапиро": Discord в Британии и Австралии запускает по лицу верификацию возраста, а компания VisionLabs запустила проход в метро Ташкента; кстати, они же делали сервис оплаты по лицу в метро Алматы и Москвы

@valuableai
🔥5😢1
молодцы китайские товарищи: у них у самих еще роботакси еще не вышли в промышленную эксплуатацию, а они уже экспортировали технологию в Саудовскую Аравию (на первой картинке министр транспорта Саудовской Аравии приобщается к светлому будущему)

по первой ссылке кстати много интересного, в частности можно узнать, что сейчас в Китае порядка нескольких тысяч роботакси уже ездят в тестовом режиме (вторая картинка)

что еще хочется отметить, Саудовская Аравия не первый раз воспринимает передовые технологии из Китая: робогражданка София сделана именно здесь

@valuableai
👍8🤔1
мимо меня прошел очередной базворд Physical AI; его продвигает CEO nVIDIA Дженсен Хуанг; суть его сводится к тому, что текущий хайп c GenAI подходит к концу, надо хайповать на чем-то новом, теперь это будут самоуправляемые роботы (как на картинке); отец обучения с подкреплением Саттон и сооснователь DeepMind Сильвер на эту тему недавно выпускали работу

робот с картинки, кстати - это часть усилий Южной Кореи по применению ИИ в обороне (недавно такая же история была в США)

@valuableai
2
вышло интересное исследование от Microsoft, в котором они проанализировали запросы к Bing Copilot на тему частоты и качества ответов; точнее они сделали даже больше, они посмотрели, как эти запросы покрывают круг вопросов для разных областей; первая картинка - это верхние 40 профессий с наибольшим покрытием (весь этот наш дата саенс ожидаемо как раз здесь), вторая картинка - нижние 40; в нижние 40 ожидаемо попали несколько медицинских специальностей, но почему-то также водители грузовиков, хотя даже у нас уже идет обкатка грузовиков-беспилотников

в верхние 40 попали внезапно историки, хотя мне совершенно неясно, как ИИ может выполнять такую работу, а также - стюардессы, здесь тоже для меня загадочно - кто вам в полете выдаст чай с бутербродом?

интерпретировать результаты надо на мой взгляд в том смысле, что услуги специалистов из верхней части списка станут доступнее в ближайшие годы, т.к. ИИ сможет автоматизировать большую часть работы, для остальных придется подождать

@valuableai
😁7💯3😢1