Истовый инженер
10.7K subscribers
291 photos
20 videos
364 links
Профессионалы о технологиях и индустриях, в которых они применяются.

Больше статей, интервью и лекций — на портале engineer.yadro.com

№ заявления в РКН: 6549749553
Download Telegram
3D-формат в кино стал особенно популярным в начале 2000-х и с тех пор покорил сердца многих. Он позволяет окунуться в происходящее на экране и почувствовать себя частью фильма. Но зачастую в погоне за экономией бюджета продюсеры намеренно закрывают глаза на качество монтажа. В результате зрители могут испытывать дискомфорт и головную боль при просмотре «объёмных» фильмов — поясняет Дмитрий Ватолин, эксперт по обработке видео, руководитель двух лабораторий МГУ: компьютерной графики и интеллектуального анализа видео.

Команда Дмитрия специализируется на исследованиях в области алгоритмов сжатия видео, а также современных методах измерения качества и обработки цифрового видео. За плечами у них более 40 проектов с Apple, Dolby, Intel, NVIDIA, Google, Intel, Cisco, Samsung, Broadcom, Huawei, Tencent и др.

Какие параметры влияют на качество видео? Как развивается глобальная видеоиндустрия и почему крупнейшие мировые компании для улучшения своих кодеков обращаются за помощью к нашим специалистам — читайте в интервью с Дмитрием.

Из интервью вы также узнаете:
- Кому особенно выгоден взлом метрик качества видео,
- Какие новые медиапродукты вскоре должны взорвать рынок персональных устройств,
- На что стоит обратить внимание сегодняшним выпускникам, чтобы завтра не проиграть развивающемуся ChatGPT.

#интервью #персоны #AI #ML #данныеианалитика #алгоритмы
4🤩1
​​📍Пахнет жареным: как нейронные сети помогают связать мир запахов и технологий

Из пяти базовых чувств человека, в числе которых зрение, осязание, слух, вкус и обоняние, технологии искусственного интеллекта неплохо освоили три. Голосовые помощники легко считывают вербальные команды: по вашей просьбе подскажут прогноз погоды и напомнят записаться к врачу. В некоторых магазинах уже можно оплатить покупку буквально «взглядом» — по биометрическим данным, если вы подключили сервис распознавания по лицу в банковском приложении.

В отличие от них «осязательные» способности технологий пока не так далеко ушли из лабораторий. Исследователи Массачусетского технологического института ещё в 2019 году научили нейросеть по внешнему виду объекта предсказывать тактильные ощущения, которые могут возникнуть от прикосновения к нему. Это позволит роботам безопаснее и точнее взаимодействовать с объектами — например, аккуратнее сжимать хрустальный бокал или мягкий томат, не превращая его в гаспачо. Однако массового применения технология пока не получила.

Так что современные разработки уже могут «видеть», «слышать» и «слушать», а также уверенно прогрессируют в умении «осязать», основанном на компьютерном зрении. Этот успех во многом обусловлен тем, что мы научились «оцифровывать» изображения и звуки, переводить в понятный машинам вид. Сделать подобное со всеми существующими запахами в разы сложнее, поэтому пока «обоняние» — очень ограниченно доступное электронным устройствам свойство. Но с развитием технологий, которые дают возможность проводить статистический анализ закономерностей в больших наборах данных, появляются смелые исследования по «картированию» запахов.

Какая работа проводится в этой сфере и смогут ли когда-нибудь технологии различать сложные композиции запахов, — в нашем новом посте.

Читать пост

#AI #историятехнологий
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥64👍3
​​«Мышиный» искусственный интеллект: как создают микросхемы с живыми нервными клетками

Для тренировки GPT-4 потребовалось двадцать пять тысяч видеокарт Nvidia A100 и около ста дней, а один день её работы стоит миллионы долларов. «Прожорливость» современных нейросетей постоянно растёт. Им требуется всё больше ресурсов: данных для обучения и людей-репетиторов, вычислительной мощности и электричества. А с ростом применимости практически во всех сферах нашей жизни высокая во всех смыслах стоимость AI-решений заставляет искать альтернативные платформы — и новые, в том числе биоматериалы — для реализации таких вычислений.

Некоторые исследователи полагают, что решение проблемы стоит искать в области биологии. По их мнению, интеграция живых нейронов в аппаратные решения поможет драматически снизить энергопотребление при сложных вычислениях и обеспечить недостижимую для существующих архитектур производительность.

Пока это скорее концепция, чем реальность, но отдельные компании добились первых успехов. О том, как электроды подсказывали нейронам, где мяч, кому удалось создать работающую «гибридную» систему и стоит ли в ближайшее время ждать «мышиный» искусственный интеллект, читайте в новом посте.

Читать

#приборы #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥1🤔1🤓1
​​📄Не Python единым: нейросеть на С++ для распознавания лиц на фото

Машинное обучение традиционно ассоциируется с Python. Этот язык программирования буквально захватил направление, его используют повсюду — от обучающих курсов до серьёзных ML-проектов. Однако Python — не единственный язык, применимый для реализации задач машинного обучения. Альтернативой может стать С++.

Ведущий инженер-программист в YADRO Кирилл Колодяжный, помимо рабочих задач по исследованию проблем производительности СХД, увлекается машинным обучением. Он участвовал в коммерческих проектах, связанных с техническим зрением, 3D-сканерами и обработкой фотографий, и часто использовал в задачах С++. В статье Кирилл делится опытом, как написать простую нейронную сеть на C++ и применить её для поиска лица конкретного человека на фотографии — например, актёра Арнольда Шварценеггера. Вы узнаете:

как организовать работу с данными и загрузку обучающего датасета,
как описать структуру нейронной сети,
как использовать уже готовые алгоритмы машинного обучения из доступных библиотек и фреймворков,
как организовать конвейер обучения сети,
как использовать предобученные глубокие сети для решения задач.

Читать статью

#программы #AI #ML #языкипрограммирования
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥52🥰1🤩1
От синего трактора к харвестеру из «Дюны»: как развивается беспилотная сельхозтехника

Беспилотные авто помогают Google создавать Street View, возят пассажиров по Иннополису и доставляют их на посадку в аэропорту Хитроу. Крупные автоконцерны встраивают автопилоты в свои машины, и, кажется, этим уже никого не удивишь. Автономным транспортом дело давно не ограничивается: тяжёлая беспилотная техника вовсю работает на добыче полезных ископаемых и помогает фермерам.

Современные автономные тракторы с высокой точностью следуют заданному маршруту, невзирая на погодные условия и рельеф местности, а комбайны убирают урожай и автоматически собирают информацию о состоянии поля. Привычные глазу сельскохозяйственные машины понемногу становятся похожи на футуристичные харвестеры из «Дюны». Пока они работают под присмотром людей, но, возможно, в будущем техника будет настраиваться удаленно и показываться людям только для ремонта.

Из нашей новой заметки вы узнаете:

В чём ценность использования современных технологий в земледелии;
Какие сельхозработы уже подвластны беспилотным системам;
Как работают беспилотные системы для тракторов;
Какие компании предлагают подобные решения в России и за рубежом;
Что за агроробот на фото к этому посту.

Читать

#приборы #AI #ML #индустрия4_0
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥3👎1🤓1
​​📺Не про Меладзе и Тейлор Свифт, а про точные науки в музыке

Обсудили вопросы искусственного интеллекта и математики в музыке вместе с Анной Виленской, популярным музыковедом и композитором.

Из лекции для «Истового инженера» вы узнаете:

Готов ли искусственный интеллект к полноценному композиторству;
Можно ли создать гармоничное, музыкальное произведение, разложив мелодию по принципам математики;
Как музыка заставляет нас танцевать или плакать;
Зачем в оркестре так много скрипок.

Слушать | Смотреть

А в интервью с Анной вы прочтёте о развитии современной музыкальной культуры и о том, как правильно обучать искусственный интеллект созданию музыки.

#музыкальныетехнологии #AI #ML #персоны
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥5👏2
​​Чудеса на миражах: действительно ли галлюцинируют большие языковые модели

Бывает, нейросеть выдает информацию, никак не связанную с запросом. Ты ей про Фому, а она тебе про Ерёму. Такой эффект называют галлюцинациями, и они считаются основной проблемой больших языковых моделей с архитектурой типа трансформер (GPT-4, LLAMA и подобные).

Но действительно ли галлюцинации — главный бич LLM? Инженер по разработке ПО искусственного интеллекта в YADRO Полина Пластова и эксперт Андрей Соколов задались этим вопросом и проверили актуальность проблемы для современных предобученных LLM в вопросно-ответном сценарии. Эксперимент на собранном ими датасете они описали в новой статье.

Из текста вы узнаете:

Какова архитектура трансформенных моделей;
Что за явление называется галлюцинированием LLM в строгом определении;
К каким результатам приведет анализ выбранного датасета на наличие галлюцинаций;
Как построить простейший пороговый алгоритм для определения галлюцинаций.

Читать

#AI #ML #нейротехнологии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍51
​​📄Утешительный прогноз: как создать модель для предсказания отказов жёстких дисков

Если вам когда-нибудь приходилось срочно заменять отказавший жёсткий диск в сервере, вы понимаете, насколько ценной была бы большая предсказуемость сбоев. Системы мониторинга помогают быстро обнаружить поломку, но не в состоянии заглянуть в будущее и сообщить о потенциальной проблеме за неделю-две до события.

Однако здесь применима «магия» машинного обучения. Инженеры по разработке ПО искусственного интеллекта в YADRO — Владислав Маркин и Андрей Соколов — решили создать модель для прогнозирования сбоев в работе HDD. Задача непростая: модели нужны данные для обучения и тренировки, а где их найти — отдельный вопрос.

Что из этого вышло, читайте в новой статье. Вы узнаете:

На каких данных можно натренировать прогнозную модель для HDD;
Что стало основой для модели инженеров YADRO;
Чем модель отличается от подобных моделей с открытым исходным кодом;
Каковы результаты тестов полученной модели на четырех моделях дисков от Seagate.

Читать статью

#AI #ML #программы
Please open Telegram to view this post
VIEW IN TELEGRAM
👏95👍3
​​📄Что объединяет «Сбер», Tesla, OpenAI и General Motors? Для робототехника ответ очевиден: все эти компании активно работают над созданием роботов-гуманоидов с искусственным интеллектом.

Революция в этой сфере произойдет в ближайшие пять лет, считает руководитель отдела робототехники в YADRO Олег Зобов. С того момента, как в 2016 году он получил в американском Фениксе «малую Нобелевку» за прототип робота-манипулятора, технологии шагнули далеко вперед.

На наших глазах происходит слияние двух направлений инженерной мысли — робототехники и достижений в области ИИ. Прежде развивавшиеся независимо друг от друга, эти линии научного прогресса пересеклись.

Выход на массовый рынок гуманоидных роботов-ассистентов позволит нейросетям беспрерывным потоком получать универсальную информацию для самообучения.
«Мы сможем оперировать теми данными, которые максимально релевантны человеческому опыту. Сегодня поставщик таких данных один — сам человек. Но завтра все изменится — робототехника находится в шаге от того, чтобы наделить искусственный интеллект новой модальностью», — поясняет эксперт.


В интервью «Истовому инженеру» Олег Зобов рассказал про свой путь в профессию, перспективы развития робототехнической отрасли и о том, почему четыре руки у андроида не всегда лучше двух.

Читать интервью

#роботы #AI #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2076👍4💯1
​​Физика нейросетей: почему исследования лауреатов Нобелевской премии «признали» только спустя 40 лет

Современные нейросети — от систем распознавания до генеративного ИИ — невозможны без работ учёных, которые были удостоены Нобелевской премии по физике в этом году. Джон Хопфилд предложил архитектуру нейросетей, которая имитировала ассоциативную память человека. Его «сеть Хопфилда» способна запоминать и восстанавливать информацию, даже если данные искажены или неполны.

Джеффри Хинтон, вдохновлённый исследованиями Хопфилда, пошёл дальше и создал машину Больцмана — модель, в которой нейросеть самостоятельно выявляет скрытые закономерности в данных. В отличие от сети Хопфилда, машина Больцмана позволила находить сложные взаимосвязи и обучаться без прямых инструкций. Такой подход приблизил исследователей к созданию мощных генеративных моделей и глубоких нейросетей, которые легли в основу технологий современного ИИ.

В новом материале — о том, как работы Хопфилда и Хинтона в 80-х годах заложили фундамент для нейросетей, которые сегодня решают задачи, ранее доступные только человеку. Михаил Захаров, кандидат физико-математических наук, ведущий менеджер продукта в YADRO, объяснит, почему эти революционные открытия удостоились награды лишь спустя десятки лет.

Читать статью

#историятехнологий #персоны #AI #ML

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥195👍5👏31
📺Роботентакли, маска-орган и машина-поводырь: как выглядят современные технологические перформансы и зачем они нужны

Технологическое искусство рождается на стыке творчества и достижений науки и техники. Появившись в конце XIX века, оно продолжает исследовать наш эмоциональный и чувственный опыт взаимодействия с технологиями и то, как меняется наше представление о мире благодаря их прогрессу.

Как переплетаются эти две сферы — искусство и технологии, ранее нам рассказала Ольга Ремнёва, арт-консультант и специалист по Art&Science. В новой статье она продолжила эту тему, приведя в пример и разобрав пять знаковых российских перформансов. Подборка получилась колоритной: здесь и 80-часовое «заточение»-соседство с промышленным роботом-манипулятором, и футуристические биометаморфозы, и размытие границ между машиной и человеком.

Вы узнаете:

▪️Что такое перформанс и какие вопросы поднимают художники этого жанра;
▪️Как технически реализуются подобные проекты и какова здесь роль инженеров;
▪️Как выглядят технологическое одиночество и технологическое расширение;
▪️Куда движется жанр техноперформанса.

Читать статью ➡️

#artscience #роботы #AI #ML

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥157👍7👏3👎2
Тензорные компиляторы: что это за «звери» и где они «обитают»

В распоряжении разработчиков множество программных инструментов, включая компиляторы. Но их тензорная разновидность знакома в основном ML-специалистам и дата-инженерам. Разберёмся в этих диковинных тензорных «зверушках» вместе.

Компиляторы общего назначения нужны для разработки программ, которые могут выполняться на любом компьютере. Тензорные компиляторы решают специализированные задачи в области машинного обучения. Они ориентированы на ускорение работы нейросетей.

В свежем наборе карточек сравним два вида компиляторов: с какими исходными данными и аппаратными платформами они работают, где применяются и что оптимизируют.

Если вы хотите больше узнать про построение и использование тензорных компиляторов для ускорения вывода глубоких нейронных сетей, то рекомендуем для самостоятельного изучения бесплатный курс от сотрудников института ИТММ ННГУ им. Н. И. Лобачевского.

Читать статью

#junior #инструменты #AI #ML

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👍144
​​Что можно сделать с 505 петабайтами данных о климате, которые метеорологи накопили с 1940-го года

Оказавшись в распоряжении нейросети, эти огромные архивы информации о климатических изменениях становятся основой для точных прогнозов погоды. В метеорологии большие данные и машинное обучение открывают новые горизонты, меняя правила игры.

Яркий пример такого подхода — GenCast от Google DeepMind, использующий новаторский для синоптиков метод диффузного моделирования. В отличие от традиционных моделей, эта система определяет движение воздушных масс не с помощью ресурсоёмких математических вычислений, а благодаря нейросетевой обработке данных — тех самых петабайт из уникальной копилки синоптиков.

Процесс любопытный — начинается с того, что эти данные намеренно «загрязняют» информационным шумом, а затем постепенно вычищают и уточняют. Так через 20 итераций и рождаются реалистичные погодные паттерны. Причём, такой подход позволяет создавать не один, а сразу 50 вероятных сценариев развития погоды, что важно для предсказания стихийных бедствий.

Конкретный пример: тайфун Хагибис, траектории которого GenCast просчитала за 15 дней до его появления, оставив традиционные модели прогнозирования далеко позади.

В новом тексте разбираем детали: как работает диффузное моделирование в метеорологии и в чём его уникальность, а также рассказываем про перспективные альтернативы GenCast и интересные российские ИИ-разработки в сфере прогнозирования погоды.

Читать

#научпоп #AI #ML #алгоритмы

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🤓4👎1
​​📄Верите в инженерную интуицию? А она есть. В 2015 году бельгийский искусствовед провел лазерное сканирование Нотр-Дама, создав трёхмерную карту из миллиарда точек. Тогда ничто не предвещало… А четыре года спустя, когда пожар едва не уничтожил собор, эта модель стала бесценным путеводителем для реставраторов.

Без нее восстановление одного из символов Франции могло затянуться на десятилетия. Шутка ли — разобраться с геометрией восьмисотлетнего здания, когда весомая часть конструкции лежит в руинах, а чертежи давно утеряны.

Но технологии помогли собору не только в этом. Пока пожарный робот Colossus боролся с огнем в нефе собора, над его крышей кружили дроны, передавая данные спасателям. А потом армия роботов-строителей месяцами разбирала завалы там, куда люди не могли войти из-за угрозы обрушения и расплавленного свинца кровли.

Искусственный интеллект анализировал тысячи фотографий, чтобы определить первоначальное положение каждого упавшего камня, а реставраторы использовали технологии дополненной реальности, чтобы видеть, как именно нужно восстанавливать витражи и своды.

Но и это не всё. Современные новации не просто помогли восстановить собор — они раскрыли тайны средневековых технологий. Например, благодаря спектральному анализу ученые узнали точный состав средневековых витражей. А по изучению сгоревших балок определили, каким был климат Франции восемь веков назад.

И теперь у собора появился виртуальный хранитель — его цифровая копия, которая поможет предотвратить новые трагедии. Как сработал этот симбиоз средневековой архитектуры и современных технологий? Рассказываем в нашем новом материале.

Читать

#роботы #AI #индустрия4_0

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍105👏1😁1
​​📍Учёные проверили ChatGPT на деменцию… и нашли то, что искали

Израильские исследователи протестировали популярные большие языковые модели с помощью Монреальской шкалы когнитивных функций (MoCA) — одного из методов в неврологии для определения ранних признаков умственных недугов. По 30-балльной шкале этот тест оценивает такие свойства человеческого разума, как внимание, память, речь и логическое мышление. Обычно его проходят пациенты-люди, но на этот раз инструкции давали ИИ в виде промтов.

В основе эксперимента — классика нейродиагностики. Для проверки визуального восприятия неврологи попросили модели использовать ASCII-арт — способ рисовать объекты с помощью символов. Способность различать детали и видеть общую картину тестировалась на фигуре Навона — большой букве H, составленной из маленьких S. «Кража печенья» из Бостонского теста выявляла умение анализировать комплексные сцены, а проба Поппельрейтера — способность разделять наложенные изображения. В финале использовали тест Струпа: например, слово «красный», написанное синим цветом, оценивало скорость реакции на конфликтующие стимулы.

Результаты оказались любопытными. ChatGPT 4o с трудом преодолел порог нормы, набрав 26 баллов. ChatGPT 4 и Claude 3.5 получили по 25, а вот Gemini 1.0 — всего 16, что для человека означало бы серьёзные когнитивные нарушения. Как отмечают исследователи, ChatGPT не сумел корректно повторить рисунок кубика, а Gemini зачем-то изобразил циферблат в виде авокадо.

Авторы исследования констатировали: новые версии моделей показали себя лучше старых, а в целом ИИ демонстрирует поведенческие особенности, похожие на старческое слабоумие. Можно ли объяснить это тем, что LLM-технологии интенсивно развиваются, и каждый свежий релиз просто сообразительней предыдущего? Исследователи выдвинули другую гипотезу: возможно, даже нейросети «стареют» и склонны к деменции.

Всё это можно было бы списать на специфический юмор неврологов, если бы не публикация в British Medical Journal — одном из старейших и авторитетных медицинских изданий, далёких по формату от сатирических «Анналов» Марка Абрахамса, создателя «Шнобелевки».

Так в чём же ценность данной работы? Возможно, главное в ней — не выводы, а сама постановка вопроса: насколько существенно искусственный интеллект отличается от естественного.

Эксперимент израильских неврологов — шаг в сторону осмысления возможностей и границ взаимодействия общества и ИИ. Он показывает, что большим языковым моделям ещё есть куда расти и чему учиться у человека. Но и человеку предстоит глубже изучать «натуру» ИИ. Ведь чем дальше, тем больше ментальное здоровье одного будет зависеть от состояния другого.

Как думаете, корректно ли такое сравнение интеллектов?

Таблицу скоринга для тестируемых моделей, а также статьи по теме, которые могли бы быть вам интересны, оставим в комментариях.

#AI

@ultimate_engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15😁10🔥83👎1