Santry's Singularity blog

Видеоролик с новым поколением робота Atlas моментально разлетелся по техноканалам — в отсутствии информации их авторы в основном писали про жутковатый дизайн этой машины, но появление Atlas заслуживает серьезного внимания.

Журналисты ieee spectrum взяли интервью у генерального директора Boston Dynamics - Роберта Плейтера (Robert Playter). Вот отдельные тезисы:

"Мы разработали для электрического Atlas новый набор действительно компактных приводов… Этот робот будет сильнее, чем человек в большинстве суставов, даже сильнее, чем профессиональный спортсмен, и будет иметь диапазон движений, который превосходит все, что доступно человеку. Мы также сравнили мощность нашего нового электрического Atlas с гидравлическим Atlas, и электрический Atlas сильнее".

"…относительно формы головы… мы приняли осознанное решение… не делать ее похожей на человеческую. Мы пытаемся спроектировать некое приятное место, на которое можно посмотреть, чтобы получить представление о намерениях робота. Дизайн заимствован из некоторых приятных форм, которые мы видели раньше. Например, есть старая лампа Pixar, в которую все полюбили несколько десятилетий назад, она легла в основу нашего дизайна".

"Мы сосредоточились на балансе, мобильности, возможности поднять что-то и сохранить при этом подвижность - это были темы исследований прошлого, с которыми мы справились... Нам предстоит проделать большую работу над универсальностью, чтобы роботы-гуманоиды могли брать в руки любую из тысячи различных деталей и разумно обращаться с ними. Такой уровень универсальности еще не реализован, но мы считаем, что это перспективное направление, и что ИИ станет одним из инструментов, который поможет решить эту проблему".

Я еще 12 лет назад писал о том, что для создания полноценного "машинного сознания" потребуется тело, наконец-то это происходит. У LLM есть то, чего не хватает роботам: доступ к знаниям практически обо всем, что когда-либо писали люди, от квантовой физики до K-pop и разморозки филе лосося. В свою очередь, у роботов есть то, чего не хватает LLM: физические тела, которые могут взаимодействовать с окружающей средой, исследовать мир. Мы можем их соединить.

Прямо сейчас разные компании разрабатывают несколько десятков разных гуманоидных роботов. Boston Dynamics показала четвероногого робота Spot, соединенного с ChatGPT, а инженеры Microsoft доказали, что языковая модель может генерировать корректные программы для роботов. Не в реальном времени, но это делала нейронка, которую, вообще-то, учили только предсказывать следующее слово в предложении. Что смогут специализированные модели?

Скоро у нас будет ответ.

#роботы #LLM #chat_gpt #новости #технологии #ии

1.4K viewsedited 18:30

Камень-навигатор, кулон-диктофон и другие AI-гаджеты

Хотелось бы завести робота-помощника на базе языковой модели как можно скорее, но инженеры пока что скептичны. По их словам, "люди просто не понимают, насколько сложно развертывать роботов этого типа". Даже робототехники-оптимисты считают, что это потребует много денег и времени. Да что там роботы… Похожая на тамагочи говорилка Rabbit R1 с искусственным интеллектом оказалась Android-приложением в красивом корпусе. AI Pin критикуют все кому не лень.

Можно подумать, что первое поколение гаджетов с LLM провалилось, но это не так. В заголовки новостей в основном попадают громкие MVP. Это проекты стартапов, которые в первую очередь хотят продать себя подороже. В то же время в DIY-сегменте тысячи энтузиастов также работают над применением языковых моделей, только эти усилия пока незаметны.

Вот, скажем, OpenGlass — дешевые самодельные умные очки, к которым подключаются Groq, Chat GPT или Ollama. Другой пример - Friend - миниатюрный носимый диктофон-суммаризатор, который анализирует все записанное. Или TERRA - похожий на камень AI-компас с занятной философией. Он самостоятельно составляет закольцованный маршрут для прогулки и подсказывает, куда идти. В результате пользователь не залипает в навигатор, а смотрит по сторонам и исследует окружающий мир.

Итак, новые перспективные форм-факторы AI-гаджетов могут родиться на GitHub. И хотя у таких проектов нет серьезного финансирования, на их стороне подход Open Source. Например, я трижды подумаю, прежде чем покупать носимый диктофон с подключением к серверам техногиганта, но с интересом испытаю гаджет, работающий на базе локальной языковой модели. Проекты, которые вызывают опасения по части конфиденциальности в Open Source-исполнении выглядят уже не так страшно.

А вы как думаете?

#AI #LLM #ИИ #гаджеты #DIY #OpenSource #будущее #технологии

1.9K viewsedited 18:34

Santry's Singularity blog

ИИволюция в биотехе случилась шесть лет назад

В 2018 году DeepMind показала AlphaFold — алгоритм машинного обучения, берущий последовательность аминокислот и реконструирующий белок, который из них получится. К 2022 году эта компания смоделировала 200 миллионов всевозможных белков для открытой базы. Некоторые из них я даже использовал в опытах с молекулярной визуализацией.

Несмотря на громкие заголовки, in silico и in vivo не одно и то же. Предсказания AlphaFold приходится тщательно проверять, но тогда машинное обучение начало серьезно менять биологию. Теперь оно, вероятно, спасет человечество как минимум от одного экзистенциального риска — бактерий, устойчивых к антибиотикам.

От таких бактерий умирает больше миллиона человек в год, к 2050 году эта цифра может достигнуть 10 миллионов. В то время как на открытие одного нового антибиотика уходит около десяти лет. Точнее, уходило.

В начале месяца биофизики рассказали, как при помощи машинного обучения проанализировали десятки тысяч микробных геномов из еще одной открытой базы данных. В результате алгоритм нашел более 800 тысяч фрагментов ДНК, которые кодируют потенциальные антимикробные соединения. Более 90% из них не были описаны прежде. Три из 100 соединений, синтезированных исследователями, действительно вылечили лабораторных мышей. Осталось проверить еще 799 900 — работы хватит на всю жизнь.

Машинное обучение позволило буквально перетряхнуть все известное микробное разнообразие в поисках нужных соединений, но самое удивительное, что мы не ограничены живущими сейчас организмами. Похожим образом антибиотики ищут, например, в иммунной системе неандертальцев.

Синтезом найденных соединений пока что занимаются люди, но Science уже пишет о создании шести автоматизированных лабораторий. Такие системы будут оперативно проверять результаты работы нейросетей. Этот подход уже используют для создания светоизлучающих материалов. Биотех и фармацевтика на очереди.

К тому же, согласно первым исследованиям, препараты, открытые ИИ, показывают 80-90% успешности на первой фазе испытаний, по сравнению с обычными 40-60%. Вероятно, по крайней мере в среднесрочной перспективе, будет открыто больше успешных терапевтических препаратов, чем во всей истории биотехнологий.

На фото: метициллинрезистентный золотистый стафилококк, от которого точно стоит избавиться.

#футурология #биотех #машинное_обучение #будущее #ИИ #технологии #антибиотики

4.9K views11:31

Santry's Singularity blog

Google создает самовоспроизводящуюся "жизнь" из цифрового первичного бульона

Экспериментам с цифровой эволюцией и самовоспроизводящимся кодом больше 50 лет. В 2015 я насчитал с десяток симуляторов, которые запускаются на ПК, однако со времен конвеевской Game of Life не было серьезных прорывов.

Такие опыты проводили по жестко заданным правилам и получали плюс-минус одни и те же результаты. И вот недавно Бен Лори и его коллеги из Google представили новое исследование. У них фрагменты кода, ведущие себя, как живые существа, возникли из случайных данных, несмотря на отсутствие четких правил или целей, поощряющих такое поведение. Взяли и появились.

"Все вокруг кружится, а потом вдруг: бум, они все одинаковые", - говорит Лори. Экземпляр симуляции, запущенный на ноутбуке, обрабатывал около 3 миллиардов инструкций в секунду, и для возникновения сложного поведения потребовалось полчаса.

Это были самовоспроизводящиеся агенты, которые быстро размножались, достигая предела численности. Затем появлялись новые типы репликаторов, которые конкурировали за пространство и стремились подавить предыдущую популяцию, подобно тому как делают микроорганизмы.

По словам Лори, так нельзя узнать, как именно зародилась биологическая жизнь, но эксперимент показывает, что сложность может появляться из ничего. Следовательно, биологическая жизнь - тоже результат длительного периода случайных итераций.

Что касается программ, кажется, эту научную работу стоит иметь в виду, выпуская ботов в интернет. Будет досадно, если современную цивилизацию разрушит не сверхсильный ИИ, а цифровой аналог слизневика.

#ИскусственнаяЖизнь #GoogleAI #ИИ

YouTube

Google creates self-replicating artificial life from digital soup with no rules

A digital "primordial soup" with no rules or direction can lead to the emergence of self-replicating artificial life forms, in an experiment that may hint at how biological life began on Earth
–
Learn more ➤https://www.newscientist.com/article/2438117-google…

4.5K viewsedited 08:41

Santry's Singularity blog

Цифровой двойник для социологов: GPT-4 предсказывает поведение людей

Проведение экспериментов - извечная проблема социологов, психологов, экономистов и всех причастных к этим наукам. Чтобы понять реакцию людей на различные ситуации, требуется сложный дизайн исследований и испытуемые, готовые тратить время на странные, на первый взгляд, задания.

Ученые из Нью-Йоркского и Стэнфордского университетов решили проверить, способны ли большие языковые модели, такие как GPT-4, предсказывать результаты подобных экспериментов без привлечения людей.

Исследователи использовали данные 70 уже проведенных экспериментов с различными опросниками. Они попросили GPT "угадать" результаты, точнее, представить, как на эти вопросы могло ответить множество людей разного пола, возраста и бэкграунда.

Языковая модель справилась с задачей неожиданно хорошо. Прогнозы оказались близки к реальным результатам, а иногда даже точнее, чем предсказания экспертов-людей. Эффект сохранялся и для исследований, информация о которых не могла попасть в обучающую выборку, так как их провели уже после обучения языковой модели.

Пока опубликована только рабочая версия статьи, даже не препринт, поэтому делать окончательные выводы рано. Однако, если результаты подтвердятся, это может дополнить методы проведения исследований в социальных науках.

Ученые получат инструмент для быстрого тестирования гипотез. Да и каждое A/B-тестирование в маркетинге можно будет сначала провести с участием LLM. Хотя интереснее было бы "повторить" знаменитый Стэнфордский тюремный эксперимент, который по этическим причинам не перепроверили, хотя к его дизайну много вопросов.

Данные из этой статьи также позволяют предположить, что гипотетический ИИ общего назначения будет хорошо предсказывать поведение людей. Правда, мы по-прежнему не знаем, как он использует эту способность.

#Социология #ChatGPT #LLM #ИИ

2.5K views15:32

Santry's Singularity blog

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Дело Бартоша Цехановского живет. Время интерактивных учебников уже близко: студенты Университета Калгари разработали «Дополненную физику» — инструмент, который преобразует статические физические диаграммы из учебников в интерактивные симуляции. Под капотом модель Segment Anything, выделяющая разные детали изображений и LLM, например, Gemini. Языковая модель, видимо, отвечает за интерпретацию и "логику" происходящего.

Интерактивные иллюстрации, боты-репетиторы и наставники - эти разработки напоминают интерактивный букварь из Алмазного века Нила Стивенсона, и ставят серьезные вопросы о том, как будет выглядеть образование в ближайшем будущем.
#нейросеть #ИИ #технологии

2.3K views09:14

Santry's Singularity blog

Сердце термоядерного реактора

Пара кремниевых рычагов, удерживающих hohlraum - мишень, внутри которой подвешена капсула с алмазным покрытием и замороженными изотопами водорода дейтерия и трития. Во время эксперимента 192 ультрафиолетовых луча сожгли ее дотла, инициировав реакцию ядерного синтеза.

Фото из национального комплекса лазерных термоядерных реакций США (NIF) - единственной лаборатории, где в результате подобного эксперимента удалось произвести больше энергии, чем он потребовал.

Как побить рекорд по термоядерному синтезу - эта насыщенная графикой статья Nature рассказывает, как ученые и инженеры изобретают рукотворное солнце.

В то же время FT рассказывает, придут ли наконец-то роботы?

Новое поколение нейросетей учится взаимодействовать с физическим миром способами, которые ещё недавно казались научной фантастикой.

#технологии #физика #будущее #ИИ #наука

1.8K views08:15

Santry's Singularity blog

This media is not supported in your browser

VIEW IN TELEGRAM

The Next Big Thing

Инженеры Disney Research не скрывают восторга, создавая дроидов из вселенной «Звёздных войн». А теперь, благодаря Антуану Пирроне, каждый может собрать мини-дроида примерно за 400 долларов. И хотя он выглядит как забавная игрушка, подобные роботы имеют все шансы перешагнуть границы тематических парков и войти в повседневную жизнь.

Похоже, в робототехнике произошел тот самый скачок из количества в качество, о котором талдычили на философии. Машины теперь без особых усилий осваивают навыки, которые раньше приходилось жестко прописывать в коде.

Исследователи из Columbia Engineering недавно продемонстрировали это наглядно: их роботы самостоятельно изучают структуру собственного тела и принципы движения, просто наблюдая за собой через камеру. Буквально смотрят в зеркало и познают себя!

Компания Figure показала Helix — универсальную модель машинного обучения типа Vision-Language-Action (VLA) для гуманоидных роботов. Эта система одновременно обрабатывает изображения и команды на обычном человеческом языке, а затем управляет роботами в реальном времени. Благодаря Helix роботы могут узнавать и работать с тысячами обычных домашних предметов. Кроме того, Figure объявила о создании BotQ — завода по производству роботов. Для начала он будет выпускать до 12 000 гуманоидов ежегодно.

А на прошлой неделе Google DeepMind анонсировала сразу две новые модели: Gemini Robotics с технологией Vision-Language-Action (VLA) и Gemini Robotics-ER с технологией Embodied Reasoning. Обе они работают на базе Google Gemini — многомодальной базовой модели, которая понимает текст, голос и изображения, отвечает на вопросы и дает рекомендации.

Gemini Robotics, в DeepMind назвали "продвинутой системой зрения-языка-действия". Она воспринимает ту же информацию, что и базовая Gemini, но может преобразовывать ее в команды для физических действий робота. Причем она совместима с любым железом. На сайте проекта есть впечатляющие демонстрации работы системы. Интересно узнать больше? Загляните в статью "Внедрение ИИ в физический мир".

К слову, не только Google развивает робототехнику. Apple тоже проявляет интерес — компания показала милую и услужливую роботизированную лампу, и, по слухам, работает над созданием андроидов.

Если нейронные VLA-сети пойдут по тому же пути развития, что и языковые модели (LLM), то скоро в интернете появятся открытые нейросети для управления роботами. И да, эта технология может быть гораздо доступнее, чем многие думают сейчас. По крайней мере частично.

Конечно, собрать в гараже человекоподобного робота пока нереально, но вот с роботизированными манипуляторами дела обстоят иначе. Открытых проектов уже хватает: PAROL6, toolboxrobotics, arctosrobotics, Thor — и это лишь верхушка айсберга. С учетом развития программного обеспечения, идея собрать такую роборуку становится все заманчивее. Лично я планирую научить свою готовить не хуже робошефа Зиппи.

#ИИ #робототехника #DIY #будущее

1.5K viewsedited 07:32

Santry's Singularity blog

1:33

Media is too big

VIEW IN TELEGRAM

Вышло даже быстрее, чем я ожидал. Сегодня NVIDIA представила базовую модель для управления роботами и сразу же опубликовала ее на GitHub и Hugging Face. Особенно интересно, что демонстрацию провели на том самом дроиде от Disney Research.

#ИИ #робототехника #opensorce #будущее

1.8K viewsedited 07:44

About

Blog

Apps

Platform