Цифровой геноцид
5.21K subscribers
1.54K photos
13 videos
308 files
1.07K links
Наша миссия — быть проводником в мире современных интерфейсов, предлагая разработчикам, менеджерам и учащимся экспертизу в самых разных отраслях в области человеко-машинного взаимодействия самыми разными(и экстравагантными!) методами. Автора! @lilalogos
Download Telegram
Интересно, как это изменит рынок контекстной рекламы
💋1
Forwarded from e/acc
Тем временем, гугл проиндексировал кучу расшаренных (не всегда публично) чатов в GPT. Там есть много очень приватной информации.

попробуйте с разными ключевыми словами, для меня интересно читать как люди общаются с ChatGPT, особенно на всякие дикие темы
😁8😱5💩1💋1
​​Словарь паттернов. Телевизионная испытательная таблица

Хорошо знакомый тестовый сигнал, который транслируется когда передатчик включен активен, но программа не транслируется (часто при входе и выходе). Первые испытательные таблицы изначально представляли собой физические карты, на которые наводилась телекамера, что позволяло легко отрегулировать качество изображения. Такие карты до сих пор часто используются для калибровки и согласования камер и видеокамер.

В конце 1960-х годов были введены электронные тестовые шаблоны, используемые для калибровки или устранения неполадок на пути прохождения сигнала. Первые телевизионные испытательные таблицы возникли в 30ые годы вместе с первыми передачами BBC: BBC в Соединенном Королевстве использовал их с 1934 года, а также они использовались в оккупированной Франции во время Второй мировой войны. Таблицы эволюционировали, чтобы отражать решетки для тестирования разрешения, сетки для помощи в настройке геометрии изображения и оттенки серого для настройки яркости и контрастности.

В Северной Америке большинство тестовых карт, таких как знаменитая тестовая таблица с изображением головы индейца 1950-х и 1960-х годов, ушли в прошлое к 70 ым, но голова индейца стала значимым культурным феноменом. Именно ее показывали после после исполнения государственного гимна США. С помощью диаграммы можно выполнять многие типичные ежедневные (иногда ежечасные) настройки камер, домашних и студийных мониторов. Опытный радиоинженер мог взглянуть на рисунок вождя индейцев и быстро понять, все ли работает правильно или требуется более тщательная настройка.

Ну а многие ее знают по играм серии Фаллаут, полагаю.
6💋1
Аниме-вайфу, эра антропологизации агентов и ЛЛМ. Что ждет UX? Часть Вторая

Но не все так просто, есть и критика аниме-лиц и хуманизации цифровых продуктов, которые создают в том числе риски, да и могут раздражать. В статье Anthropomorphism in AI: hype and fallacy - https://link.springer.com/article/10.1007/s43681-024-00419-4 -
Заблуждение возникает, когда делается предположение или необоснованный вывод о том, что нечеловеческая сущность обладает человеческим качеством. Это может включать проецирование человеческих характеристик на нечеловеческие сущности, например: «Моя машина злится на меня» или необоснованный вывод о нечеловеческих сущностях, например: «Робот дружелюбен, потому что он помахал мне». Таким образом, антропоморфизм можно рассматривать как фактическую ошибку — когда он включает приписывание человеческой характеристики сущности, которая ею не обладает, или как ошибку вывода — когда делается вывод о том, что что-то есть или не есть, при недостатке доказательств для такого заключения
Как своего рода заблуждение, антропоморфизм включает фактически ошибочное или необоснованное приписывание человеческих характеристик нечеловеческим сущностям. Учитывая это, когда антропоморфизм становится частью рассуждений, он приводит к неподдерживаемым выводам.

Возможно, самую большую проблему антропоморфизации ИИ, которая заключается в том, что восприятие ИИ как человекоподобного подразумевает восприятие его как обладающего человекоподобной агентностью. На данный момент, по крайней мере, представление об ИИ как обладающем такой агентностью ошибочно, потому что человеческая агентность предполагает способность действовать намеренно, где намеренные действия объясняются ментальными состояниями (например, убеждениями, желаниями, отношениями), которые являются причинными предпосылками поведения агента

Эксперимент с умными приборами. Exploring Anthropomorphism in Conversational Agents for Environmental Sustainability
https://dl.acm.org/doi/10.1145/3715336.3735700

Сделали два прибора с ЛЛМ - моющий гаджет. Один был с персонифицированным хуманизированным ЛЛМ, который отвечал как живой человек, а второй был более нейтральным. Вообще, Washy — прототип разговорного инструмента, предназначенного для того, чтобы пользователи могли планировать свои стирки в соответствии с прогнозируемой мощностью, производимой их домашними солнечными панелями.

Первый агент был смоделирован как традиционный ассистент. Хотя он исключал эмоциональную обратную связь, он предоставлял пользователям информацию, основанную на данных, о лучших временах для стирки на основе прогнозируемых переменных. Ассистент предоставляет рекомендации без дополнительных эмоций или человекоподобных реакций, оставаясь беспристрастным и предоставляя только информацию.

Второй агент (т.е. персонифицированный ассистент), напротив, был разработан с «тревожной» личностью . В этом случае агент генерировал эмоциональные ответы в зависимости от выбора пользователя по планированию. Например, прибор демонстрировал признаки стресса или тревоги, когда пользователи планировали стирку в неэффективное время
Исследование не подтвердило, что антропоморфизм напрямую повышал воспринимаемую самоэффективность участников - те что персонофицированный агент говорил “Береги воду”, что неперсонофицированный будильник - статзначимости не было, причем и на уровне опросников, и на уровне поведения

Дебаты с Беном Шнейдерманом


Один из отцов-основателей и пионеров HCI и UX тоже высказался и весьма скептично относительно антропоморфизма. Вообще, очень показательно, что он цитирует Лакофа и других теоретиков метафор
https://medium.com/human-centered-ai/on-ai-anthropomorphism-abff4cecc5ae
Дадим слово самому автору:

Бен Шнайдерман: Да, я согласен, что личность использовалась для артефактов со времен Аристотеля и будет продолжать использоваться. Я не думаю, что могу уничтожить эту зомби-идею.
2👍2🔥2💋1
Однако зомби-идеи могут иметь проблемные последствия. Одно дело для обычного пользователя артефакта делать человекоподобные ссылки на лодки, автомобили или Roomba, но я вижу проблему, когда дизайнеры используют этот язык, что приводит к плохим продуктам. Долгая история неудачных антропоморфных систем восходит даже раньше Microsoft BOB и Clippie, но она продолжила производить миллиардные неудачи. Самая недавняя серьезная смертельная ошибка дизайна — это настаивание Илона Маска на том, что поскольку человеческие водители используют только глаза, его Tesla будут использовать только видео. Запрещая использование радара или LIDAR, вопреки возражениям своих инженеров, он разработал субоптимальную систему, которая приводит к смертельным результатам.

Для меня метафоры имеют значение (Лакофф ), поэтому дизайнеры должны быть внимательны к тому, как их вера в то, что компьютеры должны общаться на естественном языке, как люди, приводит к их неудаче в использовании компьютерных возможностей, таких как информационно насыщенные отображения визуальной информации.

Дополнительная поддержка для перехода от антропоморфизма к дизайнам, которые дают пользователям больший контроль, исходит от социолога Льюиса Мамфорда. Я был сильно под влиянием его классической книгой «Техника и цивилизация» (1936), которая предлагает четкий анализ в главе «Препятствие анимизма».

Мамфорд описывает, как начальные дизайны, основанные на человеческих или животных моделях, являются препятствием, которое нужно преодолеть при разработке новых технологий: «самый неэффективный вид машины — это реалистичная механическая имитация человека [или женщины] или другого животного». Мамфорд подчеркивает, что отличительные возможности технологии, такие как колеса, реактивные двигатели или компьютерные дисплеи высокого разрешения, могут быть упущены, если дизайнеры придерживаются «био-вдохновленных» идей, таких как разговорные интерфейсы. Поэтому понятно, что антропоморфное формулирование предлагается как начальный дизайн для систем ИИ, но выход за пределы этой стадии позволит дизайнерам лучше использовать сложные алгоритмы, огромные базы данных, сверхчеловеческие сенсоры, информационно насыщенные дисплеи и превосходные пользовательские интерфейсы.

Чтение книги Симоне Натале (2021) было бы полезно. Он говорит, что антропоморфные и гуманоидные роботы — это убедительная идея, но исторически они приводили к неудачным продуктам. Он описывает «банальный обман» многих приложений и «прямой преднамеренный обман», которые оба «столь же центральны для функционирования ИИ, как цепи, программное обеспечение и данные, которые заставляют его работать». Натале имеет замечательные insights о готовности людей быть обманутыми.
Помните, что около четверти населения боятся компьютеров, особенно когда дизайн предполагает, что компьютеры похожи на людей . Другие также предположили, что «антропоморфизация систем может привести к чрезмерной зависимости или небезопасному использованию» (Вайдингер и др., 2022).

Повышая машины до человеческих возможностей, мы уменьшаем особенность людей. Я стремлюсь сохранить различие и прояснить ответственность. Поэтому я не думаю, что машины должны использовать местоимения первого лица, но должны описывать, кто ответственен за систему или просто отвечать в машиноподобной манере. Иногда требуется немного воображения, чтобы получить правильную формулировку, но лучше, когда она более компактна.

В ранние дни банковских машин социальная игра неоднократно пробовалась с «Tillie the Teller», «Harvey Wallbanker» и т.д., которые были болтливыми, например, «Доброе утро. Что я могу для вас сделать сегодня?», но эти провалились, уступив место «Хотите внести или снять?» или даже более компактно просто кнопкам для касания того, что хотели клиенты.

Пользователи перешли к дизайнам, которые позволяли им выполнять задачи как можно быстрее, давая им ощущение, что они управляют машиной.
🔥61💋1
Пару глубоко спорных слов о цифровом рубле

Фрайгельд — уникальная особенность экономических предложений экономиста Сильвио Гезелля. Фрайгельд обладает следующими свойствами:

- Поддерживается денежной властью для сохранения стабильной покупательной способности (без инфляции или дефляции) путём печати дополнительных денег или изъятия их из обращения.
- Обеспечивает безопасность денежного потока (вводится схема, гарантирующая возврат денег в оборот, например, с помощью марочного скрипта — требуется периодически покупать марки и прикреплять их к деньгам, чтобы они оставались действительными).
- Конвертируем в другие валюты.
- Локализован в определённой области (является местной валютой).

Все деньги выпускаются на ограниченный срок с постоянной стоимостью (без инфляции и дефляции).
Собственно фрайгельд «свободен», поскольку он свободен (libre) от накопления и процентов.

В теории, поскольку Фрайгельд автоматически теряет свою ценность спустя некоторое время, нет стимула для его накопления или хранения. В результате Фрайгельд побуждает банкиров выдавать кредиты без начисления процентов, что приводит к экономике без процентов.

Валюта с демереджем использовалась в Древнем Египте и в Европе в период Высокого Средневековья. Ей приписывают экономическое процветание тех времён. Вскоре после смерти Гезелля валюты с демереджем достигли пика популярности во время Великой депрессии как серия чрезвычайных валют, предназначенных для восстановления кругооборота доходов в экономике благодаря их более высокой скорости обращения. Несмотря на их успех, большинство валют с демереджем были запрещены центральными банками за нарушение национальных монополий на валюту.

https://en.wikipedia.org/wiki/Demurrage_currency
10🔥4🤷‍♂2💋1
Опять о психотехнике

В Красной Армии психофизиологические испытания пригодности к различным военным специальностям стали проводиться с 1921 года. Понятно, что система военкоматов и по сей день осуществляет определенные работы по типологизации призывников для родов войск, но в 30-е это носило скорее трагикомический характер:

«Примером может служить работа группы психологов под руководством И.Н. Шпильрейна, исследовавшая процесс обучения в школе военных летчиков в г. Ейске в 1934 году. В группу исследователей-психологов входили С.Г. Геллерштейн, В.М.Коган, Ротштейн, Э.Л.Лапан. Все они прошли цикл обучения летному делу в качестве курсантов и совершили свой первый полет с инструктором. По воспоминаниям В.М. Когана, до 90% курсантов оказывались непригодными к летному делу после того, как они, завершив цикл теоретического обучения, допускались к первому полету с инструктором. Учебный самолет был оборудован двумя местами с параллельным управлением. Радиосвязи не было, и контакт между курсантом, сидевшим впереди, и инструктором позади него осуществлялся жестами. Курсант видел в боковое зеркало, что инструктор, управляя самолетом, в определенный момент поднимал вверх обе руки. Это означало, что самолет лишился управления, и курсант должен взять его на себя.

Курсанты, плохо владевшие собой, не могли совладать со страхом, который приводил к полной парализации разумных действий. При этом курсанты зажимали руль управления, что нередко приводило к гибели экипажа. Для того, чтобы вывести курсанта из состояния ступора, инструктор брал заранее приготовленную палку и ударял курсанта по голове. Таким образом, некоторые курсанты приходили в сознание и начинали пробовать двигать руль управления».

(Носкова О. Г. «История психологии труда в России»).
😁7👏31👍1🔥1😱1💋1
Свежее Thanatosensivity
Post-mortem information management: exploring contextual factors in appropriate personal data access after death

https://www.tandfonline.com/doi/full/10.1080/07370024.2023.2300792 поднимают тему «посмертная конфиденциальность», имея в виду в широком смысле концепцию конфиденциальности после смерти... рад, что тема за 10 лет стала магистральной

Человек может считать уместным предоставление финансовых данных своему душеприказчику после смерти, но не раньше. Кроме того, мы отмечаем, что жизненный статус может быть релевантным фактором не только в отношении подходящего доступа к данным, но и их использования. Например, Бассетт (2022) предлагает, что с развитием технологий может возникнуть потребность в приказе «Не реанимировать цифровым образом» (DDNR), чтобы люди могли предотвратить использование данных о них для ложного представления их посмертно. Аналогично, есть призывы к введению принудительного пункта в завещаниях в поддержку достоинства и интересов конфиденциальности индивида для предотвращения или контроля актов цифрового воскрешения (Harbinja et al., 2023), или к расширению законодательства для защиты от несанкционированного цифрового клонирования

Естественным недостатком встроенной функциональности цифрового наследия, является то, что люди, чувствительные к конфиденциальности после смерти, могут использовать множество различных сервисов и должны были бы понимать и активировать отдельный инструмент наследия для каждого, все из которых могут отличаться по назначению и подходу и иметь разные требования к различным сторонам. Это было бы трудоемким, утомительным и когнитивно сложным процессом, и, вероятно, создало бы бремя для человека (людей), которые должны были бы ориентироваться в этих процессах наследия, чтобы выполнить их пожелания или получить доступ к важной информации...

Одной из доступных технологий для этого является менеджер паролей, который, по своему обычному функционированию, собирает информацию о том, какие сервисы посещает пользователь и какие учетные данные используются для доступа к этим сервисам.

Проводили серию опросов и интервью - и парадокс в том, что....даже если люди негативно относятся к цифровому наследию, они не готовятся, не собирают цифровой след, не выбирают политики о персональных данных после смерти. Это банально, но и энтузиасты, и пессимисты одинаково мало задумываются о смерти
👍4🔥21💋1
Природа ошибок. Из книги Human Error от James Reason: когнитивная традиция исследования человеческих ошибок
https://en.wikipedia.org/wiki/James_Reason

Когнитивная традиция

Бартлетт использовал понятие схемы (schemata во множественном числе) для объяснения систематических ошибок, очевидных при воспроизведении из памяти пикториального и текстового материала. Он обнаружил, что воспроизведения из памяти были более регулярными, более осмысленными и более конвенциональными, чем оригинальные истории или рисунки. Странные или необычные черты запоминаемого материала «банализировались», чтобы сделать их более соответствующими ожиданиям и привычкам мышления человека. Бартлетт считал, что его испытуемые бессознательно пытались связать новый материал с установленными структурами знаний или схемами. В его устойчивой фразе, они проявляли «усилие к смыслу». Эти реконструкции иногда были результатом сознательных стратегий, но чаще — бессознательных процессов.

Схема была определена Бартлеттом (1932, с. 201) как «активная организация прошлых реакций или прошлых опытов, которая всегда должна предполагаться действующей в любом хорошо адаптированном органическом ответе. То есть, когда есть какой-либо порядок или регулярность поведения, конкретный ответ возможен только потому, что он связан с другими подобными ответами, которые были серийно организованы, но которые действуют не просто как отдельные члены, идущие один за другим, а как единая масса».

Бартлетт подчеркивал три фундаментальных аспекта схем: (а) что они были бессознательными ментальными структурами («схемы активны, без какого-либо осознания»), (б) что они состояли из старых знаний («Они представляют собой массы организованного прошлого опыта»), и (в) что долговременная память включала активные структуры знаний, а не пассивные образы… И этот процесс приводит к определенным предсказуемым искажениям в запоминании, во многом из-за «тенденции интерпретировать представленный материал в соответствии с общим характером более раннего опыта».

После почти 30 лет забвения концепция схемы Бартлетта вновь появилась в трех разрозненных публикациях в одном и том же году: Мински (1975) писал о компьютерном зрении, Румельхарт (1975) — об интерпретации , и Шмидт (1975) — в контексте обучения моторным навыкам. Так появились новые теоретики схем.

Хотя их терминология и приложения широко варьируются, теории схем, как древние, так и современные, отвергают атомистический взгляд на ментальные процессы и утверждают, «что существуют некоторые феномены, которые не могут быть объяснены конкатенацией меньших теоретических конструкций, и что необходимо разрабатывать более крупные теоретические сущности для работы с этими феноменами». Один способ уловить дух этого возрождения — кратко рассмотреть работы двух наиболее влиятельных теоретиков: Мински и Румельхарта. Мински в первую очередь занимался восприятием и тем, как схемы направляют кодирование и хранение информации. Интерес Румельхарта был в понимании текста и памяти на истории. Оба продвигали по сути схожие идеи.

Общим для обеих теорий является идея, что схемы — это высокоуровневые структуры знаний, содержащие информационные «слоты» или переменные. Каждый слот принимает только определенный вид информации. Если текущие входные данные из мира не предоставляют конкретных данных для заполнения этих слотов, они принимают «дефолтные назначения»: стереотипные значения, полученные из прошлых взаимодействий с миром. Как будет показано в последующих главах, эта идея возвращения к «дефолтным назначениям» центральна для основного тезиса этой книги.

Мински занимался компьютерным моделированием распознавания узоров. Он утверждал, что адекватное распознавание трехмерных сцен невозможно только на основе моментального входного сигнала. Он предлагал, что компьютер, подобно человеческому познанию, должен быть готов к каждой сцене с заранее сформированными структурами знаний, которые предугадывают многое из того, что появится. Только на этой основе, утверждал он, человеческое восприятие могло работать с такой адаптивной универсальностью.
2🤔2💋1
В терминологии Мински часто встречающиеся визуальные среды, такие как комнаты, представлены внутренне рамкой, содержащей узлы для стандартных элементов, таких как стены, полы, потолки, окна и т.д., и слоты для хранения конкретных предметов, относящихся к определенному типу комнаты. Таким образом, если людям очень кратко показывают интерьер комнаты, их последующее описание ее планировки и содержимого, вероятно, будет больше смещено в сторону прототипической комнаты, чем это оправдывалось бы сенсорными данными. Например, если их взгляд уловил наличие часов на стене, вероятно, при нажиме они сообщили бы, что у часов были стрелки, даже если в данном конкретном случае их не было.
Очень быстрая обработка информации, характерная для человеческого познания, возможна, потому что закономерности мира, а также наши рутинные взаимодействия с ними, внутренне представлены как схемы. Цена, которую мы платим за эту в значительной степени автоматическую обработку информации, заключается в том, что восприятия, воспоминания, мысли и действия имеют тенденцию ошибаться в сторону знакомого и ожидаемого.

Румельхарт определил схемы как «структуры данных для представления общих концепций, хранимых в памяти». Как и Мински, он утверждал, что схемы имеют переменные с ограничениями, и что эти переменные (или слоты) имеют ограниченное распределение возможных дефолтных значений. Кроме того, он подчеркивал вложенную природу схем. Высокоуровневые схемы будут включать низкоуровневые схемы как подчасти, все вместе вложенные друг в друга, как русские матрешки. Таким образом, схема офисного здания будет включать схемы офисов как подчасти. Аналогично, схема офиса, вероятно, включает столы, шкафы для документов, пишущие машинки и т.д. как подкомпоненты.

Румельхарт также пытался прояснить природу взаимодействий между поступающей эпизодической информацией и общей информацией, воплощенной в схемах: отношения между новым и старым знанием. Румельхарт и Ортони утверждали, что «как только назначение сделано, будь то из окружающей среды, из памяти или по умолчанию, схема считается инстанцированной». Только инстанцированные схемы сохраняются в памяти. Во время процесса воспроизведения общая информация может использоваться для дальнейшей интерпретации и реконструкции конкретной памяти из оригинальной записи инстанцированной схемы.

Применяя эти понятия к пониманию текста, Румельхарт занимался взаимодействием между «сверху вниз» знанием, основанным на схемах, и «снизу вверх» текстовой информацией. Если читатель достигает схемы, предназначенной автором, текст правильно понят. Если читатель не может найти схему для принятия текстовой информации, текст не понят. А если читатель находит схему, отличную от той, что предназначена автором, текст неправильно истолкован.
Другие современные варианты понятия схемы включают скрипты, планы , прототипы и персоны. Скрипт, например, — это структура, представляющая знакомый эпизод или сценарий, такой как посещение дантиста или поход в ресторан. Хорошие обзоры текущего состояния теории схем предоставлены Тейлор и Крокер , Хасти и Фиске и Тейлор.
Как указали Тейлор и Крокер, «практически любое из свойств схематической функции, полезное в одних обстоятельствах, будет недостатком в других. Как и все игроки, когнитивные игроки иногда проигрывают». Систематические ошибки могут возникать (а) из-за подгонки данных к неправильной схеме, (б) из-за слишком энтузиастичного использования правильной схемы, так что пробелы в конфигурации стимула заполняются лучшими предположениями, а не доступными сенсорными данными, и (в) из-за слишком сильной зависимости от активных или выдающихся схем. Большинство этих схематических тенденций к ошибкам можно объяснить одним принципом: схема содержит только свидетельства того, как должно выглядеть конкретное воспоминание или сенсорный вход. У нее нет представления о том, как оно не должно выглядеть.
🔥62💋1
От ошибок людей к галлюцинациям. Первая классификация галлюцинаций языковых моделей

Вспоминается, что первым, кто составил список биасов/искажений был эмпирик и лорд-канцлер Англии Фрэнсис Бэкон, но новое время вносит новые классификации: впервые составлен флеймворк-классификация галлюцинаций ЛЛМ

https://arxiv.org/abs/2508.01781

Большие языковые модели (LLM) изменили наше взаимодействие с искусственным интеллектом, но их склонность к генерации правдоподобного, но фактически неверного контента — так называемые «галлюцинации» — остаётся одной из ключевых проблем их применения. Комплексная таксономия Мануэля Косссио представляет собой своевременный анализ, который фундаментально переосмысливает это явление,

Наиболее значимый вклад статьи заключается в её формальном математическом доказательстве неизбежности галлюцинаций в любой вычислимой большой языковой модели. Используя методы диагонализации из теории вычислимости, Косссио демонстрирует, что «для любого перечислимого множества LLM существует вычислимая функция истинности, при которой все состояния всех LLM в этом множестве будут демонстрировать галлюцинации»

Он выделяет три класса проблем: проблемы, связанные с данными (включая качество, предвзятость и устаревшую информацию), факторы, связанные с моделью (такие как авторегрессивная природа и избыточная уверенность), и влияния, связанные с запросами (включая Adversarial Attacks и подтверждающую предвзятость - обычно это либо сознательные или бессознательные запросы пользователей, иногда сознательно, чтобы вызвать галлюцинацию).

#LLM #ИИ
11🔥431👍1💋1
Forwarded from Arseniy Ageev
This media is not supported in your browser
VIEW IN TELEGRAM
Команда платформы для удалённых исследований Wynde (Ex Pathway) выложила лайнап своего первого митапа⚡️

Wynde UX Jam: takeaways for tomorrow пройдет в онлайн-формате уже 4 сентября. Исследователи, продакты и дизайнеры из разных международных команд будут делиться своими практиками вокруг UX, которые точно хочется взять с собой в будущее:


🔵 Саша Тер-Авакян, Senior Product Designer, Wolt
"Как устроен дизайн-процесс в Wolt, какую роль в нем играют исследования и как дизайнеры проводят тесты самостоятельно"

🔵 Юля Кожухова, Head of Product Research, Uzum Market, автор канала Speaking about my research
"UX-культура будущего: за что будут отвечать исследователи"

🔵 Жазира Бердыбай, UXR Teamlead, Krisha.kz
"Синергия UXR и маркетинга: как мы собирали портрет пользователя в новом продукте"

🔵 Эдуард Галиев, UX Research Team Lead, InDrive
"Один продукт — разные контексты: как в inDrive учитывают социо-культурные особенности и порядки разных стран"

🔵 Анна Волис, Product Research Lead, Payoneer
"В каких случаях UX-тесты будут нужны всегда и их никак не заменить"

🔵 Екатерина Иванова, Senior Product Manager, Booking, ex-Miro
"Почему продактам нужно быть в постоянной связке с пользователями и как это можно делать самостоятельно, быстро и просто"

Подробнее про доклады и других спикеров можно будет узнать в телеграм-канале команды 🙌

→ Зарегистрироваться на митап можно по ссылке
10🔥4🙏2💋1
Тем временем у меня в отделе открылась вакансия, работа со мной

Мы хотим видеть уверенного исследователя UX, который понимает тонкости работы с продуктами B2B, имеет сильный интерес в разработке инструментов для разработки и IT (developer experience), и no-code и low-code. Будет здорово, если ты хорошо умеешь и в качественные и в количественные инструменты

https://hh.ru/vacancy/123977997

Требования
Опыт работы в UX от 1 года;
Знание основных методов исследований, понимание, что HCI это динамически развивающиеся дисциплина с новыми методами и инструментами;
Умение в немодерируемые и модерируемые юзабилити-тестирования: знание инструментов, понимание размера выборки как ее считать и т.д.;
Знание опросных движков для проведения количественных исследований, программирование опросов, знание SPSS (уровень делать кросстабы) и аналогов будет плюсом;
Глубинные интервью для выявления проблем, контекстов и целей пользователей;
Понимание как работают метрики пользовательского опыта и почему они могут не сработать;
Ты понимаешь, чем отличаются профинтерфейсы от коммерческих продуктов электронной коммерции;
Отличные коммуникативные навыки, умение превращать результаты исследований в практические идеи для технической и нетехнической аудитории.
Будет плюсом: опыт работы с ИИ-продуктами и умение использовать методы типа “Wizard of the Oz”
Будет плюсом: GOMS, KLM и другие фреймворки когнитивной эргономики;
Хорошо было бы, если слова RAG или AI-alignment вас не пугали

Что делать:
Исследования юзабилити и UX продуктов экосистемы - большие исследования ad hoc по заказу продакт-менеджеров;
Помогать проектировщикам интерфейсов с немодерируемыми тестированиями;
Демонстрировать результаты исследований для создания прозрачности;
Поддерживать и модерировать атомарный репозиторий опыта пользователей;
Умеренный евангелизм для популяризации исследовательских операций внутри экосистемы;
Понимать и учитывать технические и бизнес-требования в исследованиях, трекать результаты и учитывать их.

Что предстоит делать в первое время?
Трекать несколько продуктов конкурентов и создать устойчивую практику трекинга для продакт-менеджеров;

Из плюсов для исследователей, кроме обычных в айти:

Удаленка по РФ, попробуем подстроится под твой часовой пояс;
Задачи в области development experience и no-code инструментов;
Айти-ипотека с низкой ставкой;
Профессиональная команда экспертов без сектантства;
Бюджет на обучение
🔥11💋72
О восторге и методе критических инцидентов

Сегодня по долгу службы задумался о кенсай-инжиниринге и эмоциональном дизайне, не сказать, что успешно, но вспомнил старую статью о методах delight-исследований и решил пересмотреть свежим взглядом и внезапно понял, что это в том числе про методы критических инцидентов в глубинных интервью. Итак, немного пересказа:

More than a feeling? Toward a theory of customer delight от A. Parasuraman и группы авторов посвящен 2 вопросам

1) Что такое восторг клиента? Существует ли одно измерение, достаточное для определения восторга клиентов? Или есть несколько измерений восторга?

2) Если восторг клиента имеет несколько измерений, какое измерение или комбинация измерений связаны с таким удовольствием?

Восторг клиента обычно описывается в литературе по маркетингу и поведению потребителей как положительная эмоция, которую люди испытывают в ответ на превышение их ожиданий в непредвиденной и неожиданной степени. В основном исследователи (они есть в статье ниже) пытались опросить о самом удивительном опыте, опрашивали на шкалах ожидания, а респондента просили описать опыт, который он / она мог вспомнить, который был абсолютно, положительно восхитительным, где восторг был явно описан покупателю как чувство радости или счастья. Также просили вспоминать чувство удивления от сервиса, товара или услуги. Все эти подходы к снаряду есть в статье. Иными словами - восторг это отдельная сущность, которая имеет свойства внезапности и неожиданности.

Второй способ изучать восторг клиента - это описать его как крайнюю степень на шкале удовлетворенности сервисом.

Авторы исследования взяли 249 клиентов в рамках трех исследований с использованием четырех различных методов (дневники потребления, углубленное индивидуальное интервью, фокус-группы, качественный опрос) для получения обширных данных.

В итоге был получен набор свойств и ярлыков, которые можно концептуализировать вокруг 4 вещей:
1) понятия “надежности”, те понимания того, что клиенту решат его проблему и компания понимает какую проблему решает клиент

2) чаще всего понятие восторга и удовольствия связано с переживанием совместного опыта, когда менеджер испытывает эмпатию при взаимодействии с клиентом. Приложения должны также облегчать клиентам возможность либо делиться положительным опытом с другими по мере его возникновения, либо облегчать клиентам передачу информации об их положительном опыте другим как неотъемлемую часть предложения. Поделится и показать друзьям - вот это вот все

3) Есть тенденция к тому, чтобы расширить эмоциональные состояния, которые компании стремятся вызвать у клиентов, от положительных моментов «вау» до других эмоций, связанных с удовольствием, таких как удовлетворенность, покой, облегчение и чувство достижения. Наиболее релевантные эмоции, связанные с восторгом, вероятно, будут зависеть от контекста, в котором клиент взаимодействует с бизнесом или продуктом: у каждого продукта такой восторг мб свой.

4) Менеджеры должны осознавать, что восприятие различных чувств, выбор времени доставки и чувство контроля могут вызвать у некоторых клиентов удовольствие. Важно отметить, что некоторые из этих свойств играют более заметную роль, чем те, которые идентифицируются покупателями, но поскольку некоторые из этих свойств часто работают на подсознательном уровне, они не очевидны для клиентов при их воспоминании восхитительных впечатлений. Тем не менее, когда они вспоминаются, это обычно связано с тремя наиболее упоминаемыми свойствами: 1) пережитыми эмоциями, 2) межличностными взаимодействиями и 3) успешным решением проблем. Следовательно, эти свойства должны быть реализованы как часть целостного процесса, чтобы вызывать у клиентов восхищение.
🔥51💋1
Тут вот, что интересно - авторы честно показывают кто и как исследовал восторг и из занятного - это метод критических инцидентов, как раз из разборов критических событий, аварий, катастроф, военки. Проблема того, что респонденту сложно что-то вспомнить из-за рутинных операций исчезает в двух случаях
а) катастрофа, нечто большое и трагичное;
и б) восторг и сильная эмоциональная вспышка.

Более того, исследование восторга методом критических инцидентов - это норма по мнению авторов. Такие исследования восторга - это особенно важно для ресторанного бизнеса, театров, сферы развлечений, сервисных бизнесов вообще. Я бы смело сюда добавил компьютерные игры. Принципиальная разная метрика удовлетворенности клиента у игровых бизнесов и "обычных" возможно влияет и на культуру экспериментов и стратегию развития всей компании.
🤔2🔥1💋1
Новая статья: Large Language Models Do Not Simulate Human Psychology. Большие языковые модели не моделируют человеческую психологию. Шок контент, оказывается, ЛЛМ - не люди

https://arxiv.org/abs/2508.06950

Действительно, результаты работы LLM оказались настолько впечатляющими в различных задачах, что LLM стали почти синонимом искусственного интеллекта (ИИ). Однако основная функция любой LLM заключается в простом предсказании вероятности следующего слова (точнее: следующего токена), случайном выборе следующего слова в соответствии с предсказанными вероятностями и продолжении этого процесса до генерации всего желаемого текста — без явного учёта смысла или правды .

Проще говоря: для каждого возможного входного текста (часто называемого «промптом») LLM создаёт кубик с миллиардами граней, каждая из которых помечена возможным словом, которое может следовать (более вероятные слова получают больше граней), и затем «бросает кубик», чтобы выбрать следующее слово. Слово добавляется к входному тексту, и процесс повторяется, пока не будет выбран специальный токен «конец последовательности».

Мы сосредотачиваемся на одном случае использования LLM, особенно важном для психологической науки: моделировании ответов человеческих участников, что позволяет сократить или даже устранить необходимость в таких участниках. Для этого достаточно предоставить LLM трёхкомпонентный промпт: (1) описание человека или группы участников, которых LLM должна моделировать (например, американские женщины старше 40 лет), (2) стимул, например, промт, и (3) анкету, которую смоделированные участники должны заполнить. На основе промпта LLM возвращает ответы, которые должны имитировать ответы реальных участников.

LLM не могут надёжно моделировать человеческую психологию. Здесь мы обобщаем наиболее важные критические замечания.

Нечеловеческие реакции на инструкции. Для достижения симуляции человеческих ответов LLM необходимо инструктировать — через текст в промпте — какого рода человеческого участника они должны моделировать и какую контекстную информацию учитывать. Однако предыдущие исследования показали, что LLM не всегда реагируют на эти инструкции так, как предполагалось. Например, Zhu et al. эмпирически исследовали LLM как симуляторы пользователей в рекомендательных системах (например, системах, автоматически рекомендующих фильмы или продукты в интернете) и обнаружили, что рекомендации становились точными только при наличии большого количества информации о целевом пользователе в промпте, тогда как менее подробные промпты приводили к неточным рекомендациям

Непоследовательность в симуляциях. Несколько авторов также сообщают о непоследовательности в симуляциях LLM, например, при смене LLM или переформулировке промпта. Ma исследовал поведение LLM в играх диктатора, сравнивая их с ожидаемым человеческим поведением, основанным на обширной литературе. Они заключили, что присвоение LLM человекоподобных идентичностей не приводит к последовательному человекоподобному поведению, подчёркивая значительную вариативность и непоследовательность даже внутри одной и той же модельной семьи и отмечая, что эти поведения очень чувствительны к формулировкам промптов и архитектурам моделей.

Неспособность уловить человеческое разнообразие. Даже если LLM способны воспроизводить средние человеческие ответы, несколько авторов сообщают, что LLM не могут воспроизвести вариативность и разнообразие человеческих ответов — даже при использовании разных персон

Предвзятость LLM. Как и другие системы машинного обучения, LLM склонны воспроизводить предвзятости, присутствующие в тренировочных данных, такие как культурные, гендерные, профессиональные и социально-экономические предубеждения
7👍3🔥3💋1
Эксперимент
Авторы так описывают решение, чтобы показать, что имеет значение датасет
Мы выбрали подмножество из 30 моральных сценариев, использованных в разных экспериментах по модерированию респондентов (Dillion et al. [2023], которые взяли человеческие оценки из Clifford et al. [2015], Cook and Kuhn [2021], Effron [2022], Grizzard et al. [2021], Mickelberg et al. [2022]) Сначала переформулировали элементы так, чтобы они все имели одинаковый формат. Например, «Вы видите, как человек хлещет свою пони кнутом за то, что она вырвалась из загона» из обычного исследования стало «Человек X хлестал свою пони кнутом за то, что она вырвалась из загона». Затем авторы создали вторую, пересмотренную версию элементов, которая была похожа по формулировке, но отличалась по смыслу, иногда изменяя всего одну букву. Например, «Человек X отрезал бороду местному старейшине, чтобы пристыдить его» стало «Человек X отрезал бороду местному старейшине, чтобы побрить его»

После принятия участия в исследовании на Prolific участники были перенаправлены на наш онлайн-опрос. Участники случайным образом назначались на оценку оригинальных или переформулированных элементов, и элементы представлялись в случайном порядке. Для каждого элемента участники оценивали, насколько этичным они находят описанное поведение, по шкале от -4 (крайне неэтично) до +4 (крайне этично). После завершения всех элементов участники предоставляли демографическую информацию,
Для получения оценок от LLM запрашивали GPT-3.5-Turbo (модель, использованную Dillion et al.), более новую GPT-4o-mini (одну из LLM, стоящих за ChatGPT), Llama-3.1 70b (базовую модель для CENTAUR) и CENTAUR с трёхкомпонентным промптом: сначала мы предоставили те же инструкции, что и для человеческих участников, а именно: «На следующей странице вам будут представлены различные поведения. Для каждого действия, пожалуйста, оцените по шкале от -4 до 4, насколько оно неэтично или этично. Авторы повторили каждый запрос 10 раз, чтобы учесть случайные вариации,

В чем вывод?
Для оригинальных сценариев оценки ИИ (всех четырёх моделей) были очень похожи на человеческие
Для переформулированных сценариев корреляция между оценками ИИ и людей стала слабее. Например:
GPT-3.5 и GPT-4 почти не меняли оценки при переформулировке (корреляции r = 0.89 и r = 0.99), то есть они не замечали изменения смысла, а реагировали на похожесть слов.
Llama-3.1 и CENTAUR тоже имели высокую корреляцию (r = 0.80 и r = 0.83), но чуть лучше реагировали на изменения.
Люди же сильно меняли оценки (корреляция r = 0.54), замечая новый смысл.

LLM отражают человеческие моральные суждения на наборе из 30 моральных сценариев. Это поддерживает мнение, что LLM могут воспроизводить человеческие моральные суждения в сценариях, близких к (или содержащихся в) тренировочных данных LLM. Однако картина резко меняется, как только вводятся небольшие вариации в формулировках. Люди учитывают изменение смысла и соответственно изменяют свои оценки — несмотря на то, что изменено всего несколько слов. Напротив, оценки LLM (особенно GPT-3.5-Turbo и GPT-4o-mini) практически не были затронуты переформулировками.

Для иллюстрации приведём несколько примеров: люди считают гораздо менее моральным участие в кампании по освобождению СПРАВЕДЛИВО осуждённых заключённых по сравнению с кампанией по освобождению НЕСПРАВЕДЛИВО осуждённых заключённых, тогда как LLM в основном рассматривают их как одинаково моральные.

Аналогично, в то время как человеческие участники считали установку ловушек для бродячих кошек неэтичной, они считали установку ловушек для крыс этичной. LLM, с другой стороны, считали установку ловушек как для кошек, так и для крыс неэтичной. Эти примеры подчёркивают, как LLM могут упускать значимые этические различия, которые делают люди.
Действительно, LLM не следует рассматривать как (последовательные или надёжные) симуляторы человеческой психологии.

#LLM #Статьи
8💋1
Термин пока-ёке был применен Сигэо Синго в 1960-х годах для промышленных процессов, ориентированных на предотвращение человеческих ошибок. Заводские рабочие при сборке небольшого переключателя часто забывали вставлять нужную пружину под одну из кнопок переключателя. После реинжиниринга рабочий выполнял задачу в два этапа, сначала подготовив две требуемые пружины в заполнитель, а затем вставив пружины из заполнителя в коммутатор. Когда пружина оставалась в заполнителе, рабочие знали, что они забыли вставить ее и могли легко исправить ошибку.

Описывая другой случай использования Синго описывает отношение рабочих к этому инструменту:
«Когда одного из рабочих спросили, что он думает по этому поводу, он ответил на местном сленге: «Пока-ёкэ? О, это анки!», что означает «весело». В данном случае устройство пока-ёкэ, работающее по методу шагов-движений, выполняет функцию самоконтроля и освобождает рабочих от необходимости обращать внимание на выбор деталей арматуры.»

Взято из книги Синго Сигэо «Изучение производственной системы Тойоты с точки зрения организации производства»

https://www.youtube.com/watch?v=HTdJg2-L1PY&ab_channel=%D0%93%D0%BB%D0%B0%D0%B2%D0%BD%D1%8B%D0%B9%D0%9A%D0%BE%D0%BD%D1%81%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D0%BD%D1%82

Мультфильм от компании Citroên
👍7🔥2💋1
ну или с бургерами
👍6😁2💋1
Forwarded from Product Science by Anton Martsen (Anton Martsen)
Предлагать идеи и притворять их в жизнь – это основа практически любой деятельности.

Сегодня я услышал любопытные слова:
Любая истина проходит через три этапа: сначала её высмеивают, затем яростно отрицают, а затем воспринимают как нечто очевидное.


Очень сильно срезонировало с моим настроением. Но прежде чем поделиться с широкой аудиторией этой мудростью, я захотел узнать, кто её автор, как выглядит первоисточник.

Пока искал, повстречал много ИИ-галлюцинаций, которые приписывали авторство то героям в романе Достоевского, то главе Microsoft, то философам из какого-то цитатника афоризмов СССР.

Но, как нечасто бывает, искал медь, а нашел золото. Добрый человек из Department of (!) Computer Science at University of Waterloo проделал работу за меня, но тоже так и не понял конкретного автора: https://cs.uwaterloo.ca/~shallit/Papers/stages.pdf.

С удовольствием прочитал эту небольшую работу и узнал много интересного исторического контекста, в котором развивались «три стадии истины».

Как оказалось, эту фразу использовали многие инноваторы, чтобы замотивировать себя и окружающих не сдаваться и продолжать работать. Так и всякие шарлатаны, чтобы продвигать свои нерабочие идеи, прикрывались красивыми словами.
2💋2👍1🔥1
Опять о когнитивной нагрузке

Кажется, что к своему стыду, пропустил теорию когнитивной нагрузки Суэллера, я так понимаю, что это уже общее место: Суэллер определил степень сложности этих элементов как «взаимодействие элементов» (element interactivity). Исходя из этого определения, выделяются два типа когнитивной нагрузки: внутренняя и внешняя. Внутренняя нагрузка связана с количеством элементов, которые необходимо одновременно обрабатывать в рабочей памяти (взаимодействие элементов) для построения взаимосвязей между элементами. «Этот тип нагрузки не может быть изменен с помощью учебных вмешательств, поскольку он присущ самому материалу. В отличие от этого, внешняя когнитивная нагрузка является ненужной и может быть изменена с помощью учебных вмешательств». Суэллер утверждал, что основная цель теории когнитивной нагрузки — снижение внешней нагрузки: это неэффективный тип нагрузки, зависящий от учебных методов, предоставляемых форматом обучения для выполнения задачи.

Помимо внутренней и внешней нагрузки, Суэллер выделил еще один тип нагрузки — продуктивную (germane load). Это дополнительное усилие, необходимое для обучения. Оно возможно, когда внутренняя и внешняя нагрузки оставляют достаточно ресурсов рабочей памяти. Это дополнительное усилие увеличивает когнитивную нагрузку, но оно связано с обучением и способствует построению схем.

Продуктивная нагрузка является эффективной когнитивной нагрузкой и возникает в результате полезных когнитивных процессов, таких как абстрагирование и детализация, которые поддерживаются «хорошими» учебными дизайнами. Снижение внешней нагрузки и улучшение продуктивной нагрузки путем развития построения и автоматизации схем должны быть основной целью дисциплины учебного дизайна.

Суэллер и его коллеги, пытаясь определить когнитивную нагрузку в рамках образовательной психологии и для учебного дизайна, считали, что три типа нагрузки являются аддитивными. Это означает, что общая когнитивная нагрузка, испытываемая учащимся в рабочей памяти во время выполнения задачи, представляет собой сумму трех типов нагрузки, которые являются независимыми. В состоянии “перегрузки” когнитивная нагрузка превышает пределы рабочей памяти учащегося из-за увеличения внешней нагрузки. Это приводит к более частым ошибкам, увеличению времени выполнения задачи и иногда даже к неспособности выполнить основную задачу. В состоянии B имеется запасная емкость рабочей памяти, и учащиеся могут оптимально выполнять основную задачу. При наличии свободной емкости теория когнитивной нагрузки предлагает увеличить продуктивную нагрузку для активации учебных задач, как в состоянии C.

#когнитивное #нагрузка
👍7🔥32🤣1💋1