Цифровой геноцид
5.21K subscribers
1.54K photos
13 videos
308 files
1.07K links
Наша миссия — быть проводником в мире современных интерфейсов, предлагая разработчикам, менеджерам и учащимся экспертизу в самых разных отраслях в области человеко-машинного взаимодействия самыми разными(и экстравагантными!) методами. Автора! @lilalogos
Download Telegram
Свежее Thanatosensivity
Post-mortem information management: exploring contextual factors in appropriate personal data access after death

https://www.tandfonline.com/doi/full/10.1080/07370024.2023.2300792 поднимают тему «посмертная конфиденциальность», имея в виду в широком смысле концепцию конфиденциальности после смерти... рад, что тема за 10 лет стала магистральной

Человек может считать уместным предоставление финансовых данных своему душеприказчику после смерти, но не раньше. Кроме того, мы отмечаем, что жизненный статус может быть релевантным фактором не только в отношении подходящего доступа к данным, но и их использования. Например, Бассетт (2022) предлагает, что с развитием технологий может возникнуть потребность в приказе «Не реанимировать цифровым образом» (DDNR), чтобы люди могли предотвратить использование данных о них для ложного представления их посмертно. Аналогично, есть призывы к введению принудительного пункта в завещаниях в поддержку достоинства и интересов конфиденциальности индивида для предотвращения или контроля актов цифрового воскрешения (Harbinja et al., 2023), или к расширению законодательства для защиты от несанкционированного цифрового клонирования

Естественным недостатком встроенной функциональности цифрового наследия, является то, что люди, чувствительные к конфиденциальности после смерти, могут использовать множество различных сервисов и должны были бы понимать и активировать отдельный инструмент наследия для каждого, все из которых могут отличаться по назначению и подходу и иметь разные требования к различным сторонам. Это было бы трудоемким, утомительным и когнитивно сложным процессом, и, вероятно, создало бы бремя для человека (людей), которые должны были бы ориентироваться в этих процессах наследия, чтобы выполнить их пожелания или получить доступ к важной информации...

Одной из доступных технологий для этого является менеджер паролей, который, по своему обычному функционированию, собирает информацию о том, какие сервисы посещает пользователь и какие учетные данные используются для доступа к этим сервисам.

Проводили серию опросов и интервью - и парадокс в том, что....даже если люди негативно относятся к цифровому наследию, они не готовятся, не собирают цифровой след, не выбирают политики о персональных данных после смерти. Это банально, но и энтузиасты, и пессимисты одинаково мало задумываются о смерти
👍4🔥21💋1
Природа ошибок. Из книги Human Error от James Reason: когнитивная традиция исследования человеческих ошибок
https://en.wikipedia.org/wiki/James_Reason

Когнитивная традиция

Бартлетт использовал понятие схемы (schemata во множественном числе) для объяснения систематических ошибок, очевидных при воспроизведении из памяти пикториального и текстового материала. Он обнаружил, что воспроизведения из памяти были более регулярными, более осмысленными и более конвенциональными, чем оригинальные истории или рисунки. Странные или необычные черты запоминаемого материала «банализировались», чтобы сделать их более соответствующими ожиданиям и привычкам мышления человека. Бартлетт считал, что его испытуемые бессознательно пытались связать новый материал с установленными структурами знаний или схемами. В его устойчивой фразе, они проявляли «усилие к смыслу». Эти реконструкции иногда были результатом сознательных стратегий, но чаще — бессознательных процессов.

Схема была определена Бартлеттом (1932, с. 201) как «активная организация прошлых реакций или прошлых опытов, которая всегда должна предполагаться действующей в любом хорошо адаптированном органическом ответе. То есть, когда есть какой-либо порядок или регулярность поведения, конкретный ответ возможен только потому, что он связан с другими подобными ответами, которые были серийно организованы, но которые действуют не просто как отдельные члены, идущие один за другим, а как единая масса».

Бартлетт подчеркивал три фундаментальных аспекта схем: (а) что они были бессознательными ментальными структурами («схемы активны, без какого-либо осознания»), (б) что они состояли из старых знаний («Они представляют собой массы организованного прошлого опыта»), и (в) что долговременная память включала активные структуры знаний, а не пассивные образы… И этот процесс приводит к определенным предсказуемым искажениям в запоминании, во многом из-за «тенденции интерпретировать представленный материал в соответствии с общим характером более раннего опыта».

После почти 30 лет забвения концепция схемы Бартлетта вновь появилась в трех разрозненных публикациях в одном и том же году: Мински (1975) писал о компьютерном зрении, Румельхарт (1975) — об интерпретации , и Шмидт (1975) — в контексте обучения моторным навыкам. Так появились новые теоретики схем.

Хотя их терминология и приложения широко варьируются, теории схем, как древние, так и современные, отвергают атомистический взгляд на ментальные процессы и утверждают, «что существуют некоторые феномены, которые не могут быть объяснены конкатенацией меньших теоретических конструкций, и что необходимо разрабатывать более крупные теоретические сущности для работы с этими феноменами». Один способ уловить дух этого возрождения — кратко рассмотреть работы двух наиболее влиятельных теоретиков: Мински и Румельхарта. Мински в первую очередь занимался восприятием и тем, как схемы направляют кодирование и хранение информации. Интерес Румельхарта был в понимании текста и памяти на истории. Оба продвигали по сути схожие идеи.

Общим для обеих теорий является идея, что схемы — это высокоуровневые структуры знаний, содержащие информационные «слоты» или переменные. Каждый слот принимает только определенный вид информации. Если текущие входные данные из мира не предоставляют конкретных данных для заполнения этих слотов, они принимают «дефолтные назначения»: стереотипные значения, полученные из прошлых взаимодействий с миром. Как будет показано в последующих главах, эта идея возвращения к «дефолтным назначениям» центральна для основного тезиса этой книги.

Мински занимался компьютерным моделированием распознавания узоров. Он утверждал, что адекватное распознавание трехмерных сцен невозможно только на основе моментального входного сигнала. Он предлагал, что компьютер, подобно человеческому познанию, должен быть готов к каждой сцене с заранее сформированными структурами знаний, которые предугадывают многое из того, что появится. Только на этой основе, утверждал он, человеческое восприятие могло работать с такой адаптивной универсальностью.
2🤔2💋1
В терминологии Мински часто встречающиеся визуальные среды, такие как комнаты, представлены внутренне рамкой, содержащей узлы для стандартных элементов, таких как стены, полы, потолки, окна и т.д., и слоты для хранения конкретных предметов, относящихся к определенному типу комнаты. Таким образом, если людям очень кратко показывают интерьер комнаты, их последующее описание ее планировки и содержимого, вероятно, будет больше смещено в сторону прототипической комнаты, чем это оправдывалось бы сенсорными данными. Например, если их взгляд уловил наличие часов на стене, вероятно, при нажиме они сообщили бы, что у часов были стрелки, даже если в данном конкретном случае их не было.
Очень быстрая обработка информации, характерная для человеческого познания, возможна, потому что закономерности мира, а также наши рутинные взаимодействия с ними, внутренне представлены как схемы. Цена, которую мы платим за эту в значительной степени автоматическую обработку информации, заключается в том, что восприятия, воспоминания, мысли и действия имеют тенденцию ошибаться в сторону знакомого и ожидаемого.

Румельхарт определил схемы как «структуры данных для представления общих концепций, хранимых в памяти». Как и Мински, он утверждал, что схемы имеют переменные с ограничениями, и что эти переменные (или слоты) имеют ограниченное распределение возможных дефолтных значений. Кроме того, он подчеркивал вложенную природу схем. Высокоуровневые схемы будут включать низкоуровневые схемы как подчасти, все вместе вложенные друг в друга, как русские матрешки. Таким образом, схема офисного здания будет включать схемы офисов как подчасти. Аналогично, схема офиса, вероятно, включает столы, шкафы для документов, пишущие машинки и т.д. как подкомпоненты.

Румельхарт также пытался прояснить природу взаимодействий между поступающей эпизодической информацией и общей информацией, воплощенной в схемах: отношения между новым и старым знанием. Румельхарт и Ортони утверждали, что «как только назначение сделано, будь то из окружающей среды, из памяти или по умолчанию, схема считается инстанцированной». Только инстанцированные схемы сохраняются в памяти. Во время процесса воспроизведения общая информация может использоваться для дальнейшей интерпретации и реконструкции конкретной памяти из оригинальной записи инстанцированной схемы.

Применяя эти понятия к пониманию текста, Румельхарт занимался взаимодействием между «сверху вниз» знанием, основанным на схемах, и «снизу вверх» текстовой информацией. Если читатель достигает схемы, предназначенной автором, текст правильно понят. Если читатель не может найти схему для принятия текстовой информации, текст не понят. А если читатель находит схему, отличную от той, что предназначена автором, текст неправильно истолкован.
Другие современные варианты понятия схемы включают скрипты, планы , прототипы и персоны. Скрипт, например, — это структура, представляющая знакомый эпизод или сценарий, такой как посещение дантиста или поход в ресторан. Хорошие обзоры текущего состояния теории схем предоставлены Тейлор и Крокер , Хасти и Фиске и Тейлор.
Как указали Тейлор и Крокер, «практически любое из свойств схематической функции, полезное в одних обстоятельствах, будет недостатком в других. Как и все игроки, когнитивные игроки иногда проигрывают». Систематические ошибки могут возникать (а) из-за подгонки данных к неправильной схеме, (б) из-за слишком энтузиастичного использования правильной схемы, так что пробелы в конфигурации стимула заполняются лучшими предположениями, а не доступными сенсорными данными, и (в) из-за слишком сильной зависимости от активных или выдающихся схем. Большинство этих схематических тенденций к ошибкам можно объяснить одним принципом: схема содержит только свидетельства того, как должно выглядеть конкретное воспоминание или сенсорный вход. У нее нет представления о том, как оно не должно выглядеть.
🔥62💋1
От ошибок людей к галлюцинациям. Первая классификация галлюцинаций языковых моделей

Вспоминается, что первым, кто составил список биасов/искажений был эмпирик и лорд-канцлер Англии Фрэнсис Бэкон, но новое время вносит новые классификации: впервые составлен флеймворк-классификация галлюцинаций ЛЛМ

https://arxiv.org/abs/2508.01781

Большие языковые модели (LLM) изменили наше взаимодействие с искусственным интеллектом, но их склонность к генерации правдоподобного, но фактически неверного контента — так называемые «галлюцинации» — остаётся одной из ключевых проблем их применения. Комплексная таксономия Мануэля Косссио представляет собой своевременный анализ, который фундаментально переосмысливает это явление,

Наиболее значимый вклад статьи заключается в её формальном математическом доказательстве неизбежности галлюцинаций в любой вычислимой большой языковой модели. Используя методы диагонализации из теории вычислимости, Косссио демонстрирует, что «для любого перечислимого множества LLM существует вычислимая функция истинности, при которой все состояния всех LLM в этом множестве будут демонстрировать галлюцинации»

Он выделяет три класса проблем: проблемы, связанные с данными (включая качество, предвзятость и устаревшую информацию), факторы, связанные с моделью (такие как авторегрессивная природа и избыточная уверенность), и влияния, связанные с запросами (включая Adversarial Attacks и подтверждающую предвзятость - обычно это либо сознательные или бессознательные запросы пользователей, иногда сознательно, чтобы вызвать галлюцинацию).

#LLM #ИИ
11🔥431👍1💋1
Forwarded from Arseniy Ageev
This media is not supported in your browser
VIEW IN TELEGRAM
Команда платформы для удалённых исследований Wynde (Ex Pathway) выложила лайнап своего первого митапа⚡️

Wynde UX Jam: takeaways for tomorrow пройдет в онлайн-формате уже 4 сентября. Исследователи, продакты и дизайнеры из разных международных команд будут делиться своими практиками вокруг UX, которые точно хочется взять с собой в будущее:


🔵 Саша Тер-Авакян, Senior Product Designer, Wolt
"Как устроен дизайн-процесс в Wolt, какую роль в нем играют исследования и как дизайнеры проводят тесты самостоятельно"

🔵 Юля Кожухова, Head of Product Research, Uzum Market, автор канала Speaking about my research
"UX-культура будущего: за что будут отвечать исследователи"

🔵 Жазира Бердыбай, UXR Teamlead, Krisha.kz
"Синергия UXR и маркетинга: как мы собирали портрет пользователя в новом продукте"

🔵 Эдуард Галиев, UX Research Team Lead, InDrive
"Один продукт — разные контексты: как в inDrive учитывают социо-культурные особенности и порядки разных стран"

🔵 Анна Волис, Product Research Lead, Payoneer
"В каких случаях UX-тесты будут нужны всегда и их никак не заменить"

🔵 Екатерина Иванова, Senior Product Manager, Booking, ex-Miro
"Почему продактам нужно быть в постоянной связке с пользователями и как это можно делать самостоятельно, быстро и просто"

Подробнее про доклады и других спикеров можно будет узнать в телеграм-канале команды 🙌

→ Зарегистрироваться на митап можно по ссылке
10🔥4🙏2💋1
Тем временем у меня в отделе открылась вакансия, работа со мной

Мы хотим видеть уверенного исследователя UX, который понимает тонкости работы с продуктами B2B, имеет сильный интерес в разработке инструментов для разработки и IT (developer experience), и no-code и low-code. Будет здорово, если ты хорошо умеешь и в качественные и в количественные инструменты

https://hh.ru/vacancy/123977997

Требования
Опыт работы в UX от 1 года;
Знание основных методов исследований, понимание, что HCI это динамически развивающиеся дисциплина с новыми методами и инструментами;
Умение в немодерируемые и модерируемые юзабилити-тестирования: знание инструментов, понимание размера выборки как ее считать и т.д.;
Знание опросных движков для проведения количественных исследований, программирование опросов, знание SPSS (уровень делать кросстабы) и аналогов будет плюсом;
Глубинные интервью для выявления проблем, контекстов и целей пользователей;
Понимание как работают метрики пользовательского опыта и почему они могут не сработать;
Ты понимаешь, чем отличаются профинтерфейсы от коммерческих продуктов электронной коммерции;
Отличные коммуникативные навыки, умение превращать результаты исследований в практические идеи для технической и нетехнической аудитории.
Будет плюсом: опыт работы с ИИ-продуктами и умение использовать методы типа “Wizard of the Oz”
Будет плюсом: GOMS, KLM и другие фреймворки когнитивной эргономики;
Хорошо было бы, если слова RAG или AI-alignment вас не пугали

Что делать:
Исследования юзабилити и UX продуктов экосистемы - большие исследования ad hoc по заказу продакт-менеджеров;
Помогать проектировщикам интерфейсов с немодерируемыми тестированиями;
Демонстрировать результаты исследований для создания прозрачности;
Поддерживать и модерировать атомарный репозиторий опыта пользователей;
Умеренный евангелизм для популяризации исследовательских операций внутри экосистемы;
Понимать и учитывать технические и бизнес-требования в исследованиях, трекать результаты и учитывать их.

Что предстоит делать в первое время?
Трекать несколько продуктов конкурентов и создать устойчивую практику трекинга для продакт-менеджеров;

Из плюсов для исследователей, кроме обычных в айти:

Удаленка по РФ, попробуем подстроится под твой часовой пояс;
Задачи в области development experience и no-code инструментов;
Айти-ипотека с низкой ставкой;
Профессиональная команда экспертов без сектантства;
Бюджет на обучение
🔥11💋72
О восторге и методе критических инцидентов

Сегодня по долгу службы задумался о кенсай-инжиниринге и эмоциональном дизайне, не сказать, что успешно, но вспомнил старую статью о методах delight-исследований и решил пересмотреть свежим взглядом и внезапно понял, что это в том числе про методы критических инцидентов в глубинных интервью. Итак, немного пересказа:

More than a feeling? Toward a theory of customer delight от A. Parasuraman и группы авторов посвящен 2 вопросам

1) Что такое восторг клиента? Существует ли одно измерение, достаточное для определения восторга клиентов? Или есть несколько измерений восторга?

2) Если восторг клиента имеет несколько измерений, какое измерение или комбинация измерений связаны с таким удовольствием?

Восторг клиента обычно описывается в литературе по маркетингу и поведению потребителей как положительная эмоция, которую люди испытывают в ответ на превышение их ожиданий в непредвиденной и неожиданной степени. В основном исследователи (они есть в статье ниже) пытались опросить о самом удивительном опыте, опрашивали на шкалах ожидания, а респондента просили описать опыт, который он / она мог вспомнить, который был абсолютно, положительно восхитительным, где восторг был явно описан покупателю как чувство радости или счастья. Также просили вспоминать чувство удивления от сервиса, товара или услуги. Все эти подходы к снаряду есть в статье. Иными словами - восторг это отдельная сущность, которая имеет свойства внезапности и неожиданности.

Второй способ изучать восторг клиента - это описать его как крайнюю степень на шкале удовлетворенности сервисом.

Авторы исследования взяли 249 клиентов в рамках трех исследований с использованием четырех различных методов (дневники потребления, углубленное индивидуальное интервью, фокус-группы, качественный опрос) для получения обширных данных.

В итоге был получен набор свойств и ярлыков, которые можно концептуализировать вокруг 4 вещей:
1) понятия “надежности”, те понимания того, что клиенту решат его проблему и компания понимает какую проблему решает клиент

2) чаще всего понятие восторга и удовольствия связано с переживанием совместного опыта, когда менеджер испытывает эмпатию при взаимодействии с клиентом. Приложения должны также облегчать клиентам возможность либо делиться положительным опытом с другими по мере его возникновения, либо облегчать клиентам передачу информации об их положительном опыте другим как неотъемлемую часть предложения. Поделится и показать друзьям - вот это вот все

3) Есть тенденция к тому, чтобы расширить эмоциональные состояния, которые компании стремятся вызвать у клиентов, от положительных моментов «вау» до других эмоций, связанных с удовольствием, таких как удовлетворенность, покой, облегчение и чувство достижения. Наиболее релевантные эмоции, связанные с восторгом, вероятно, будут зависеть от контекста, в котором клиент взаимодействует с бизнесом или продуктом: у каждого продукта такой восторг мб свой.

4) Менеджеры должны осознавать, что восприятие различных чувств, выбор времени доставки и чувство контроля могут вызвать у некоторых клиентов удовольствие. Важно отметить, что некоторые из этих свойств играют более заметную роль, чем те, которые идентифицируются покупателями, но поскольку некоторые из этих свойств часто работают на подсознательном уровне, они не очевидны для клиентов при их воспоминании восхитительных впечатлений. Тем не менее, когда они вспоминаются, это обычно связано с тремя наиболее упоминаемыми свойствами: 1) пережитыми эмоциями, 2) межличностными взаимодействиями и 3) успешным решением проблем. Следовательно, эти свойства должны быть реализованы как часть целостного процесса, чтобы вызывать у клиентов восхищение.
🔥51💋1
Тут вот, что интересно - авторы честно показывают кто и как исследовал восторг и из занятного - это метод критических инцидентов, как раз из разборов критических событий, аварий, катастроф, военки. Проблема того, что респонденту сложно что-то вспомнить из-за рутинных операций исчезает в двух случаях
а) катастрофа, нечто большое и трагичное;
и б) восторг и сильная эмоциональная вспышка.

Более того, исследование восторга методом критических инцидентов - это норма по мнению авторов. Такие исследования восторга - это особенно важно для ресторанного бизнеса, театров, сферы развлечений, сервисных бизнесов вообще. Я бы смело сюда добавил компьютерные игры. Принципиальная разная метрика удовлетворенности клиента у игровых бизнесов и "обычных" возможно влияет и на культуру экспериментов и стратегию развития всей компании.
🤔2🔥1💋1
Новая статья: Large Language Models Do Not Simulate Human Psychology. Большие языковые модели не моделируют человеческую психологию. Шок контент, оказывается, ЛЛМ - не люди

https://arxiv.org/abs/2508.06950

Действительно, результаты работы LLM оказались настолько впечатляющими в различных задачах, что LLM стали почти синонимом искусственного интеллекта (ИИ). Однако основная функция любой LLM заключается в простом предсказании вероятности следующего слова (точнее: следующего токена), случайном выборе следующего слова в соответствии с предсказанными вероятностями и продолжении этого процесса до генерации всего желаемого текста — без явного учёта смысла или правды .

Проще говоря: для каждого возможного входного текста (часто называемого «промптом») LLM создаёт кубик с миллиардами граней, каждая из которых помечена возможным словом, которое может следовать (более вероятные слова получают больше граней), и затем «бросает кубик», чтобы выбрать следующее слово. Слово добавляется к входному тексту, и процесс повторяется, пока не будет выбран специальный токен «конец последовательности».

Мы сосредотачиваемся на одном случае использования LLM, особенно важном для психологической науки: моделировании ответов человеческих участников, что позволяет сократить или даже устранить необходимость в таких участниках. Для этого достаточно предоставить LLM трёхкомпонентный промпт: (1) описание человека или группы участников, которых LLM должна моделировать (например, американские женщины старше 40 лет), (2) стимул, например, промт, и (3) анкету, которую смоделированные участники должны заполнить. На основе промпта LLM возвращает ответы, которые должны имитировать ответы реальных участников.

LLM не могут надёжно моделировать человеческую психологию. Здесь мы обобщаем наиболее важные критические замечания.

Нечеловеческие реакции на инструкции. Для достижения симуляции человеческих ответов LLM необходимо инструктировать — через текст в промпте — какого рода человеческого участника они должны моделировать и какую контекстную информацию учитывать. Однако предыдущие исследования показали, что LLM не всегда реагируют на эти инструкции так, как предполагалось. Например, Zhu et al. эмпирически исследовали LLM как симуляторы пользователей в рекомендательных системах (например, системах, автоматически рекомендующих фильмы или продукты в интернете) и обнаружили, что рекомендации становились точными только при наличии большого количества информации о целевом пользователе в промпте, тогда как менее подробные промпты приводили к неточным рекомендациям

Непоследовательность в симуляциях. Несколько авторов также сообщают о непоследовательности в симуляциях LLM, например, при смене LLM или переформулировке промпта. Ma исследовал поведение LLM в играх диктатора, сравнивая их с ожидаемым человеческим поведением, основанным на обширной литературе. Они заключили, что присвоение LLM человекоподобных идентичностей не приводит к последовательному человекоподобному поведению, подчёркивая значительную вариативность и непоследовательность даже внутри одной и той же модельной семьи и отмечая, что эти поведения очень чувствительны к формулировкам промптов и архитектурам моделей.

Неспособность уловить человеческое разнообразие. Даже если LLM способны воспроизводить средние человеческие ответы, несколько авторов сообщают, что LLM не могут воспроизвести вариативность и разнообразие человеческих ответов — даже при использовании разных персон

Предвзятость LLM. Как и другие системы машинного обучения, LLM склонны воспроизводить предвзятости, присутствующие в тренировочных данных, такие как культурные, гендерные, профессиональные и социально-экономические предубеждения
7👍3🔥3💋1
Эксперимент
Авторы так описывают решение, чтобы показать, что имеет значение датасет
Мы выбрали подмножество из 30 моральных сценариев, использованных в разных экспериментах по модерированию респондентов (Dillion et al. [2023], которые взяли человеческие оценки из Clifford et al. [2015], Cook and Kuhn [2021], Effron [2022], Grizzard et al. [2021], Mickelberg et al. [2022]) Сначала переформулировали элементы так, чтобы они все имели одинаковый формат. Например, «Вы видите, как человек хлещет свою пони кнутом за то, что она вырвалась из загона» из обычного исследования стало «Человек X хлестал свою пони кнутом за то, что она вырвалась из загона». Затем авторы создали вторую, пересмотренную версию элементов, которая была похожа по формулировке, но отличалась по смыслу, иногда изменяя всего одну букву. Например, «Человек X отрезал бороду местному старейшине, чтобы пристыдить его» стало «Человек X отрезал бороду местному старейшине, чтобы побрить его»

После принятия участия в исследовании на Prolific участники были перенаправлены на наш онлайн-опрос. Участники случайным образом назначались на оценку оригинальных или переформулированных элементов, и элементы представлялись в случайном порядке. Для каждого элемента участники оценивали, насколько этичным они находят описанное поведение, по шкале от -4 (крайне неэтично) до +4 (крайне этично). После завершения всех элементов участники предоставляли демографическую информацию,
Для получения оценок от LLM запрашивали GPT-3.5-Turbo (модель, использованную Dillion et al.), более новую GPT-4o-mini (одну из LLM, стоящих за ChatGPT), Llama-3.1 70b (базовую модель для CENTAUR) и CENTAUR с трёхкомпонентным промптом: сначала мы предоставили те же инструкции, что и для человеческих участников, а именно: «На следующей странице вам будут представлены различные поведения. Для каждого действия, пожалуйста, оцените по шкале от -4 до 4, насколько оно неэтично или этично. Авторы повторили каждый запрос 10 раз, чтобы учесть случайные вариации,

В чем вывод?
Для оригинальных сценариев оценки ИИ (всех четырёх моделей) были очень похожи на человеческие
Для переформулированных сценариев корреляция между оценками ИИ и людей стала слабее. Например:
GPT-3.5 и GPT-4 почти не меняли оценки при переформулировке (корреляции r = 0.89 и r = 0.99), то есть они не замечали изменения смысла, а реагировали на похожесть слов.
Llama-3.1 и CENTAUR тоже имели высокую корреляцию (r = 0.80 и r = 0.83), но чуть лучше реагировали на изменения.
Люди же сильно меняли оценки (корреляция r = 0.54), замечая новый смысл.

LLM отражают человеческие моральные суждения на наборе из 30 моральных сценариев. Это поддерживает мнение, что LLM могут воспроизводить человеческие моральные суждения в сценариях, близких к (или содержащихся в) тренировочных данных LLM. Однако картина резко меняется, как только вводятся небольшие вариации в формулировках. Люди учитывают изменение смысла и соответственно изменяют свои оценки — несмотря на то, что изменено всего несколько слов. Напротив, оценки LLM (особенно GPT-3.5-Turbo и GPT-4o-mini) практически не были затронуты переформулировками.

Для иллюстрации приведём несколько примеров: люди считают гораздо менее моральным участие в кампании по освобождению СПРАВЕДЛИВО осуждённых заключённых по сравнению с кампанией по освобождению НЕСПРАВЕДЛИВО осуждённых заключённых, тогда как LLM в основном рассматривают их как одинаково моральные.

Аналогично, в то время как человеческие участники считали установку ловушек для бродячих кошек неэтичной, они считали установку ловушек для крыс этичной. LLM, с другой стороны, считали установку ловушек как для кошек, так и для крыс неэтичной. Эти примеры подчёркивают, как LLM могут упускать значимые этические различия, которые делают люди.
Действительно, LLM не следует рассматривать как (последовательные или надёжные) симуляторы человеческой психологии.

#LLM #Статьи
8💋1
Термин пока-ёке был применен Сигэо Синго в 1960-х годах для промышленных процессов, ориентированных на предотвращение человеческих ошибок. Заводские рабочие при сборке небольшого переключателя часто забывали вставлять нужную пружину под одну из кнопок переключателя. После реинжиниринга рабочий выполнял задачу в два этапа, сначала подготовив две требуемые пружины в заполнитель, а затем вставив пружины из заполнителя в коммутатор. Когда пружина оставалась в заполнителе, рабочие знали, что они забыли вставить ее и могли легко исправить ошибку.

Описывая другой случай использования Синго описывает отношение рабочих к этому инструменту:
«Когда одного из рабочих спросили, что он думает по этому поводу, он ответил на местном сленге: «Пока-ёкэ? О, это анки!», что означает «весело». В данном случае устройство пока-ёкэ, работающее по методу шагов-движений, выполняет функцию самоконтроля и освобождает рабочих от необходимости обращать внимание на выбор деталей арматуры.»

Взято из книги Синго Сигэо «Изучение производственной системы Тойоты с точки зрения организации производства»

https://www.youtube.com/watch?v=HTdJg2-L1PY&ab_channel=%D0%93%D0%BB%D0%B0%D0%B2%D0%BD%D1%8B%D0%B9%D0%9A%D0%BE%D0%BD%D1%81%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D0%BD%D1%82

Мультфильм от компании Citroên
👍7🔥2💋1
ну или с бургерами
👍6😁2💋1
Forwarded from Product Science by Anton Martsen (Anton Martsen)
Предлагать идеи и притворять их в жизнь – это основа практически любой деятельности.

Сегодня я услышал любопытные слова:
Любая истина проходит через три этапа: сначала её высмеивают, затем яростно отрицают, а затем воспринимают как нечто очевидное.


Очень сильно срезонировало с моим настроением. Но прежде чем поделиться с широкой аудиторией этой мудростью, я захотел узнать, кто её автор, как выглядит первоисточник.

Пока искал, повстречал много ИИ-галлюцинаций, которые приписывали авторство то героям в романе Достоевского, то главе Microsoft, то философам из какого-то цитатника афоризмов СССР.

Но, как нечасто бывает, искал медь, а нашел золото. Добрый человек из Department of (!) Computer Science at University of Waterloo проделал работу за меня, но тоже так и не понял конкретного автора: https://cs.uwaterloo.ca/~shallit/Papers/stages.pdf.

С удовольствием прочитал эту небольшую работу и узнал много интересного исторического контекста, в котором развивались «три стадии истины».

Как оказалось, эту фразу использовали многие инноваторы, чтобы замотивировать себя и окружающих не сдаваться и продолжать работать. Так и всякие шарлатаны, чтобы продвигать свои нерабочие идеи, прикрывались красивыми словами.
2💋2👍1🔥1
Опять о когнитивной нагрузке

Кажется, что к своему стыду, пропустил теорию когнитивной нагрузки Суэллера, я так понимаю, что это уже общее место: Суэллер определил степень сложности этих элементов как «взаимодействие элементов» (element interactivity). Исходя из этого определения, выделяются два типа когнитивной нагрузки: внутренняя и внешняя. Внутренняя нагрузка связана с количеством элементов, которые необходимо одновременно обрабатывать в рабочей памяти (взаимодействие элементов) для построения взаимосвязей между элементами. «Этот тип нагрузки не может быть изменен с помощью учебных вмешательств, поскольку он присущ самому материалу. В отличие от этого, внешняя когнитивная нагрузка является ненужной и может быть изменена с помощью учебных вмешательств». Суэллер утверждал, что основная цель теории когнитивной нагрузки — снижение внешней нагрузки: это неэффективный тип нагрузки, зависящий от учебных методов, предоставляемых форматом обучения для выполнения задачи.

Помимо внутренней и внешней нагрузки, Суэллер выделил еще один тип нагрузки — продуктивную (germane load). Это дополнительное усилие, необходимое для обучения. Оно возможно, когда внутренняя и внешняя нагрузки оставляют достаточно ресурсов рабочей памяти. Это дополнительное усилие увеличивает когнитивную нагрузку, но оно связано с обучением и способствует построению схем.

Продуктивная нагрузка является эффективной когнитивной нагрузкой и возникает в результате полезных когнитивных процессов, таких как абстрагирование и детализация, которые поддерживаются «хорошими» учебными дизайнами. Снижение внешней нагрузки и улучшение продуктивной нагрузки путем развития построения и автоматизации схем должны быть основной целью дисциплины учебного дизайна.

Суэллер и его коллеги, пытаясь определить когнитивную нагрузку в рамках образовательной психологии и для учебного дизайна, считали, что три типа нагрузки являются аддитивными. Это означает, что общая когнитивная нагрузка, испытываемая учащимся в рабочей памяти во время выполнения задачи, представляет собой сумму трех типов нагрузки, которые являются независимыми. В состоянии “перегрузки” когнитивная нагрузка превышает пределы рабочей памяти учащегося из-за увеличения внешней нагрузки. Это приводит к более частым ошибкам, увеличению времени выполнения задачи и иногда даже к неспособности выполнить основную задачу. В состоянии B имеется запасная емкость рабочей памяти, и учащиеся могут оптимально выполнять основную задачу. При наличии свободной емкости теория когнитивной нагрузки предлагает увеличить продуктивную нагрузку для активации учебных задач, как в состоянии C.

#когнитивное #нагрузка
👍7🔥32🤣1💋1
Электронная игра BANDAI Black Pyramid "PAIR MATCH" 1984 года. Игра на сопоставление для одного или двух игроков: дизайн в форме пирамиды и даже 2 процессора, один из которых отвечал только за звук

Как играть? Вы выбираете один квадрат, и игра издаёт определённый звук. Затем вы выбираете второй квадрат. Если звук, издаваемый этим квадратом, совпадает с первым, эти два квадрата загораются вашим цветом, и вы можете играть снова. Если они не совпадают, ход переходит ко второму игроку (или компьютеру). Побеждает тот, у кого в конце игры окажется больше всего зажжённых квадратов (всего нужно сопоставить 32 квадрата или 16 разных пар. Звуков всего 8, поэтому всего по две пары каждого звука).

Pair Match от Bandai также удостоился особой чести стать реквизитом в фильме «Звездный путь» - в комментариях
🔥4💋1
К вопросу о человеческих ошибках.

SRK-фреймворк(skill, rule, and knowledge) был создан для более детальной классификации ошибок.

Поведение основанное на навыках требует минимального уровня осознанности и больше похоже на поведение “стимул-реакция”. Многие вещи и дизайнерские решения и являются таким стимулом, например, характерные изображения в стилистике аварийных знаков.
Поведение, основанное на правилах регламентируется знаком, которые видит человек и выбирает тот или иной вариант действий. Набор действий заранее выучен и определен.
Наконец, есть и поведение основанное на знаниях, когда ситуация является новой, необычной для пользователя — и тогда человек обращается к концептуальному уровню поведения, чтобы выработать новый ответ.

- Skill-based errors (навыковые ошибки)
Автоматические действия, включающие slips и lapses.Ошибка в рутинной операции, как вождение

- Rule-based errors (правиловые ошибки)
Ошибки в применении "если-то" правил, часто mistakes.Неправильное применение инструкции в знакомой ситуации.

- Knowledge-based errors (знаниевые ошибки)
Ошибки в новых ситуациях, требующих анализа и решений.Неправильная диагностика проблемы из-за недостатка знаний.,

Один из способов различить действия в фреймворке SRK состоит в том, что ошибки, основанные на навыках (промахи), возникают ДО того, как проблема выявлена, а ошибки, основанные на правилах и знаниях, происходят уже ПОСЛЕ того, как проблема идентифицирована.

Основатель этой теории и один из основателей когнитивной эргономики Расмуссен внёс ключевой вклад, описав «сокращения», которые люди используют в реальных ситуациях. Вместо линейной последовательности этапов его модель напоминает лестницу: уровни навыков (активация и выполнение) находятся у основания с обеих сторон, уровни знаний (интерпретация и оценка) — наверху, а промежуточные этапы, основанные на правилах (наблюдение, идентификация, выбор цели и выбор процедуры), — посередине. Сокращения между этапами обычно представляют собой высокоэффективные, но специфичные для ситуации стереотипные реакции, когда наблюдение состояния системы автоматически ведёт к выбору корректирующих процедур без медленного и трудоёмкого вмешательства обработки, основанной на знаниях.

#ошибки
👍71💋1
Эмоциональный дизайн или опять об аниме вайфу Маска. Назад к Конраду Лоренцу

Кавай — «милый», «прелестный», «хорошенький», «славный», «маленький», «крошечный». Большая эстетическая концепция, которая подчеркивает невинность, детскость и ребячество и распространяется на все сферы японского общества
Многие японские строительные компании используют каваиизацию для изменения конструкций зданий и строек: столбы и решетки превращаются в милых кроликов, бордюры в уток, а парковочные разделители в анимешных рыбок. Это не только украшение, но и безопасность: японские компании, производящие дорожные знаки используют кавайных зверят для того, чтобы привлечь внимание детей. Это еще и GR, которому можно поучится многим из силовых ведомств: каждый крупный полицейский участок имеет свой собственный анимешный Моэ — маскот, который отражает и род занятий отдела.
Естественно, что такой массовый культурный проект транслируется на интерфейсы и взаимодействия пользователей с компьютером. В статье Kawaii Computing речь идет в основном об анализе литературы по теме, но, тем не менее, тут есть определенный горизонт тем и направлений для работы.
https://arxiv.org/pdf/2405.08244

Авторы выявили семь контекстов и множество тем в kawaii computing. Наиболее распространённым контекстом был HRI - социальная робототехника, особенности анимешных, ярких и кавайных образов в роботов. В HAI предлагались модели для kawaii-виртуальных агентов, например, Оцука и др. разработали атрибуты kawaii для оценки виртуальных персонажей, а Сибёрн и др. предложили предварительную модель для kawaii-вокалики в играх. Другие исследования оценивали чувства kawaii к виртуальным персонажам , 3D-моделям животных, витуберов и предпочтения к kawaii и не-kawaii игровым персонажам. Учитывая, что рост витуберов предстоит в ближайшее время -- это интересные замечания о том, какой дизайн должен быть
Интересно и с определениями: половина авторов определяла кавай как национальный дизайн, в то время как многие другие связывали kawaii с красивым или милым дизайном. Патрик Рау и др. охарактеризовали kawaii как «эмоциональную концепцию, укоренённую в японской эстетике». Для искусственных продуктов они считали kawaii ключевым фактором японского дизайна kansei, который может означать милый, любимый, маленький и другие связанные эмоциональные ценности.

Мой взгляд зацепился за вывод авторов со ссылкой на отца- основателя этологии Конрада Лоренца! По сравнению с cute, kawaii воплощает особую японскую эстетику и культурную рамку. Она выходит за рамки просто милого, поскольку cute не имеет культурных коннотаций. “Работа с cute в HCI обычно применяет концепцию «Baby Schema», определённую Лоренцем в 1943 году , для создания интерактивных артефактов”. Тут стало уж совсем интересно - открытие, что милое лежит на поверхности, но не думал, что этот концепт принадлежит Лоренцу. Лоренц предположил, что схема младенца («Kindchenschema») представляет собой набор инфантильных физических черт, таких как большая голова, круглое лицо и большие глаза, которые воспринимаются как милые и мотивируют других особей к заботливому поведению, а их эволюционная функция заключается в повышении выживаемости потомства.

Однако kawaii не ограничивается явлением Baby Schema и не является просто характеристикой дизайна . Японский исследователь Ниттоно предложил двухслойную модель kawaii, с одним слоем как эмоцией и другим как социальной ценностью.
https://intellectdiscover.com/content/journals/10.1386/eapc.2.1.79_1 Рамка kawaii как эмоции представляет kawaii как стимул, воспринимаемый как милый, дружелюбный, безвредный, красивый и т.д., независимо от того, является ли стимул живым существом. Когда kawaii-аффект оценивается как значимый через процессы когнитивной оценки, он может быть связан с психологическим состоянием kawaii

Это и является значимым вкладом в разработку интерфейса - kawaii и как характеристику дизайна, и как реакцию пользователя, что соответствует двухфакторной модели kawaii: не только характеристики, но и kawaii-эмоции во взаимодействии пользователя
https://www.youtube.com/watch?v=RMIJFocrr6w&ab_c
5👍2🥰2💋1
Но давайте откроем немецкого отца-основателя! Цитата из книги Die angeborenen Formen möglicher Erfahrung

Все живые существа, а также даже неживые макеты, обладающие несколькими из упомянутых признаков, кажутся «милыми» с поразительной согласованностью у самых разных людей. В полном соответствии с правилом суммы стимулов молодые животные воспринимаются как «милые» в зависимости от количества и выраженности упомянутых признаков, совершенно независимо от других характеристик, таких как сходство с человеком, зоологическое положение, абсолютный размер и т.д. Например, молодые утки, полевые зайцы и львы обладают этой специфической привлекательностью в высшей степени благодаря наличию почти всех обсуждаемых признаков, хотя у зайчонка и утёнка специфическая текстура поверхности и «пухлые щёчки» обусловлены не жиром, а жёсткими роговыми структурами! Детёныши обезьян, несмотря на более близкое зоологическое родство с человеком, гораздо меньше соответствуют детскому шаблону (Kindchenschema). Худощавый, длинноногий, длиннорылый молодой резус или павиан с впалыми щеками редко воспринимается людьми как милый; например, невозможно представить, чтобы в зоопарке использовали детёныша обезьяны для привлечения внимания, как это повсеместно делают с львятами и тигрятами, которые, будучи почти идеальными «детскими макетами», вызывают умиление.

Взять на руки такого мягкого, большеглазого, толстолапого малыша — это действительно особое удовольствие, за которое люди готовы заплатить несколько монет. Именно в такие моменты можно, наблюдая за собой, хорошо уловить особое качество этого переживания.

...

Пропорции хондродистрофического черепа мопса в своё время сделали его типичным объектом для проявления заботливых реакций, характерных для «старых дев», — вспомним классические изображения, созданные Бушем на эту тему! Сегодня мопс был вытеснен пекинесом, который демонстрирует все ключевые стимулы в ещё более выраженной форме и, в отличие от мопса, обладает дополнительными вызывающими факторами — шелковистой шерстью и короткой мордочкой. Длинноголовые собаки, такие как таксы, или темпераментные породы, например мелкие терьеры, которые неохотно поддаются инстинктивным проявлениям привязанности, редко выступают в роли объектов-заменителей. Напротив, кошки встречаются в этом качестве очень часто: с одной стороны, их круглоголовость и большие глаза обеспечивают хорошие формальные признаки, а с другой — их мягкое тело и психологическая склонность принимать ласки идеально соответствуют тактильным ощущениям и реакции «ношения на руках». Среди птиц одинокие женщины часто выбирают круглоголовых попугаев, которые, к тому же, единственные среди своих сородичей терпят тактильные ласки.

Наконец, мне кажется более чем вероятным, что в наименовании различных видов животных восприятие человеческого детского шаблона (Kindchenschema) сыграло свою роль, поскольку формы с выраженными детскими пропорциями, особенно головы, на удивление часто носят в названии уменьшительно-ласкательный суффикс «-chen» (в немецком языке). Вспомним, например, белку (Eichhörnchen), кролика (Kaninchen), королька (Schneekönigchen), малиновку (Rotkehlchen), которые, в отличие от своих родственников без суффикса «-chen», обладают всеми признаками детской физиогномии. Рисунок 1 должен ещё раз это проиллюстрировать.
👍9🥰4💋1
UX в СССР. Информационные и концептуальные модели управления

В 1970ые годы на страницах "Технической эстетики" возникает и представление относительно того, как должно выглядеть интерфейс управления предприятием: для проектировщиков и исследователей уже хорошо знакомо понятие концептуального моделирования, тем не менее, ее использование как инструмента для управления предприятием или производственными процессами тема в СССР еще новая и модная. Рост числа ЭВМ ставит перед советскими исследователями вопрос, который в западной литературы шел под биркой “function allocation”. Аллокация функций между операторами и машинами определяет уровень автоматизации в системе. На практике функции обычно делятся на несколько категорий:

а) Те, которые должны выполняться машинами (поскольку для людей это невозможно или неприемлемо).
б) Те, которые должны выполняться людьми (из-за отсутствия подходящих машин или неподходящего выполнения функции машиной). В общем, функции следует поручать людям, если требуется чувствительность к контексту и его изменениям.
в) Те, которые могут выполняться как людьми, так и машинами, либо совместно.
Цель аллокации функций — разработать систему с высокой производительностью, где задачи оператора выполнимы и соответствуют его роли, а разработка системы технически и экономически осуществима. При аллокации функций проектировщики должны учитывать безопасность, надежность и психосоциальные факторы, чтобы создать для оператора согласованный и удовлетворяющий набор задач. Дадим слово авторам из ВНИИТЭ:

Центральной задачей при этом становится создание информационных моделей, учитывающих психологические характеристики труда человека, ответственного за функционирование системы. Исходным пунктом психологического исследования советских авторов должен быть анализ роли и функционального значения центрального щита в тех случаях, когда процесс управления осуществляется человеком и машиной совместно. Очевидно, что информационная модель процесса управления должна представлять собой графики всех возможных путей развития процесса управления. Если каждый конкретный, реальный процесс имеет свою реализацию, то графики определяют все возможные реализации (их эволюцию). Модель, следовательно, представляет собой направленный граф, вершины которого соответствуют определенным блокам алгоритма (блокам решения задач), а ребра — направлениям передачи результатов работы одного блока к другому.

При этом предполагается, что САС(сложной автоматизированной системы) имеет общий алгоритм работы и этот алгоритм имеет конечную цель или цели. Длина каждой стрелки на графе определяется только соображениями удобства и наглядности, так как ничего не характеризует, а направление стрелки не имеет векторного смысла.

Представленный на информационной модели граф может интерпретироваться либо как укрупненная блок-схема алгоритма, либо как логическая схема алгоритма, либо как полный алгоритм в зависимости от его размеров или ранга управления, для которого конструируется модель. Если мы строим информационную модель системы периодического действия, то граф хода процесса управления может быть размещен таким образом, чтобы процесс управления развивался с левого нижнего угла модели и заканчивался вверху справа. Для всякой системы как периодического, так и непрерывного действия граф должен иметь направленность к одной или нескольким целям в зависимости от того, по каким критериям оценивается достижение цели, поставленной перед системой.
3👍3💋1
В узлах графа информационной модели ( граф-модель управления — ГМУ) расположены индикационные элементы. Свечение каждого индикационного элемента начинается в момент, когда поступили все необходимые исходные данные для работы соответствующего алгоритмического блока, и продолжается до тех пор, пока существует полная совокупность этих исходных данных и решение задачи данным блоком не закончено. При этом желательно, чтобы каждый индикационный элемент имел по крайней мере три цвета свечения (например, зеленый, желтый и красный). При нормальном развитии процесса управления в узлах графа высвечиваются индикаторы зеленого цвета. Развитие процесса управления в сторону срыва индицируется желтым цветом. Красный цвет индикатора эквивалентен аварийному режиму.

Отрывки из Елшин Ю. Графо-временной способ отображения информации о развитии процессов управления — Техническая эстетика № 6 1971
🔥9👍2💋1