Цифровой геноцид
5.21K subscribers
1.55K photos
13 videos
308 files
1.08K links
Наша миссия — быть проводником в мире современных интерфейсов, предлагая разработчикам, менеджерам и учащимся экспертизу в самых разных отраслях в области человеко-машинного взаимодействия самыми разными(и экстравагантными!) методами. Автора! @lilalogos
Download Telegram
ChatGPT и косвенное влияние на UX и HCI. Отвечать будет Стивен Вольфрам

Давайте обратимся к недавней статье What Is ChatGPT Doing … and Why Does It Work? с тщательным разбором того, как работает ChatGPT и множеством подробностей о том, как все работает изнутри. Важно здесь отметить, что Стивен Вольфрам идет дальше и показывает и те многочисленные теоретические проблемы, которые не решает, а, наоборот, ставит эта нейросеть нового поколения: это очень важный аспект, о котором, мне кажется, пишут не так много.
https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/?fbclid=IwAR2b_XOlZc7hpTbDxmQWWVTc45AU2k9rmgDc4xz6unOew0vVkYZP5UjoqvM

Попробуем разобраться, о чем он вообще. Итак, сначала он описывает функцию градиентного спуска, рисует диаграммы частотности слов в корпусе и другие общие вещи, которые можно прочесть в любом курсе по работе машинного обучения. Пропустим эти общие вещи и обратимся к следующим частям

“Причина, по которой нейронная сеть может быть успешной при написании эссе, заключается в том, что написание эссе оказывается «вычислительно более легкой» задачей, чем думали до этого. И в некотором смысле это приближает нас к «теории» того, как нам, людям, удается делать такие вещи, как написание эссе, или вообще иметь дело с языком”

Меня, конечно, удивляет (как и многих) легкость изучения грамматически правильных фраз - это тривиальная задача, которая долгие годы казалось не такой уж и тривиальной - и что Стивен Вольфрам назвал глубоко спрятанной внутри ChatGPT логикой силлогизмов и учебника грамматики, теории, которую бот открыл после чтения огромного числа текстов. Смешно, что Вольфрам здесь вспоминает Mad Libs - эти примитивные опросники для детей, которые популярны в детских учебниках, когда надо продолжить фразу, чтобы написать историю.

Ключевое «естественнонаучное» наблюдение Вольфрама заключается в том, что трансформирующая архитектура нейронных сетей, подобная той, что используется в ChatGPT, по-видимому, способна успешно изучать вид вложенной древовидной синтаксической структуры, которая, по-видимому, существует во всех человеческих языках. Синтаксис обеспечивает одно из ограничений языка. Получается, что генеративная грамматика с ее деревьями существует в виде результата, которая выдает ChatGPT. Но есть и еще кое-что.

Почему нейросеть пишет именно то, что пишет в ответ на вопрос? Стивен Вольфрам здесь рисует пространство лингвистических признаков - которое объединено как семантически, так и по другим признакам. Мы можем посмотреть на траекторию, по которой следует текст для ChatGPT в пространстве функций, а затем мы можем увидеть, как ChatGPT продолжает это - ниже в посте картинка с примером того, как нейросеть выбирает слова

Здесь определенно нет «геометрически очевидного» закона движения. И это совсем не удивительно; мы, как пользователи, полностью ожидаем, что это будет значительно более сложная история в тексте, некоторое более осмысленное повествование с элементами креативности. И получается, что на данный момент мы не готовы «эмпирически декодировать» из его «внутреннего поведения» то, что ChatGPT «обнаружил» о том, как «собирается» человеческий язык.

Что нужно для создания «осмысленного человеческого языка»? В прошлом мы могли предположить, что это не что иное, как человеческий мозг. Но теперь мы знаем, что нейронная сеть ChatGPT вполне может создать осмысленный язык. .Успех ChatGPT неявно раскрывает важный «научный» факт: на самом деле в осмысленном человеческом языке гораздо больше структуры и простоты, чем мы когда-либо знали, и что, в конце концов, могут быть даже довольно простые правила, которые описать, как такой язык может быть составлен. Синтаксическая грамматика дает правила того, как слова, соответствующие таким вещам, как разные части речи, могут быть объединены в человеческом языке. Но чтобы разобраться со смыслом, нам нужно пойти дальше. И один из вариантов того, как это сделать, — подумать не только о синтаксической грамматике языка, но и о семантической.
👍2💋1
Семантическая грамматика обязательно связана с какой-то «моделью мира» — чем-то, что служит «скелетом», поверх которого можно наслаивать язык, состоящий из реальных слов. И здесь ближе к концу Вольфрам говорит о «значении пространства и семантических законах движения», он говорит о траекториях «в пространстве лингвистических признаков»: “выше мы обсуждали, что внутри ChatGPT любой фрагмент текста эффективно представлен массивом чисел, которые мы можем рассматривать как координаты точки в каком-то пространстве лингвистических признаков”

Получается, что когда ChatGPT продолжает фрагмент текста, это соответствует отслеживанию траектории в пространстве лингвистических признаков. Но что заставляет эту траекторию соответствовать тексту, который мы считаем значимым? И, возможно, существуют какие-то «семантические законы движения», которые определяют — или, по крайней мере, ограничивают — то, как точки в пространстве лингвистических признаков могут перемещаться, сохраняя при этом «осмысленность»?

Получается, что истории ChatGPT состоят из последовательности предложений. Эти предложения упорядочены по сюжетной траектории. Эти траектории могут быть ядром новой грамматики - семантической грамматики.

Цель такой грамматики — это иметь общий символический «конструктор» для понятий, который дал бы нам правила для того, какая сущность может сочетаться с другой сущностью, и, таким образом, для «потока» того, что мы могли бы преобразовать. на человеческий язык. Это приблизило бы нас к созданию универсального языка, языка, который был бы одинаково понятен и машине и человеку, и мог бы стать интерфейсом. Стивен Вольфрам думает, что им бы мог стать его язык Wolfram - Wolfram Language.

От себя я добавлю, что это может качественно изменить положение вещей в проблемной области с Zero Code — как создания языка, который одинаково понятен и машине и человеку, формируя качественно более удобную среду для разработки и программирования, приближая эпоху систем программирования не для программистов
👍10💋1
То, как выглядит пространство слов(близость) и то, как chatGPT использует выбор слов для создания осмысленного текста
💋3
Оценка технологии

Обычно под “оценкой технологии” понимают средство оценки новой технологии с момента её первой разработки до момента, когда она потенциально будет принята общественностью и органами власти для дальнейшего использования. Как правило, ярлык Technology assessment объединяет подходы к оценке экономической и технологической ценности технологий и технологических портфелей. Это также важно для бизнесов, чтобы выделять деньги или людей для развития технологий. Иногда, это также определяют как восприятие технологии со стороны общественного мнения: какой она выступает в головах пользователей? Опасной, полезной, ценной или неприемлимой…

Ранний пример оценки технологии дал пастор, естествоиспытатель и изобретатель Якоб Кристиан Шеффер, изобретатель механической стиральной машины. Когда он занимался его строительством в 1766/1768 году и заказал у регенсбургского плотника 60 копий, он написал подробное описание-инструкцию с несколькими дополнениями. Поскольку большинство «прачечных» с женщинами-прачками, по-видимому, опасались за свою работу, Шеффер напрямую сказал им, что их опасения необоснованны. Наоборот, они получат больше работы в будущем и «выиграют в любом случае». Он также доказывал: «Прачки, которые стирают в одном дома за день, теперь могут стирать в двух домах за один день и, таким образом, получать заработную плату, которую они в противном случае получали только за один дом».

Позже Шеффер опубликовал многочисленные отчеты об опыте прачечных самообслуживания, которое ему удалось продать за пределами Германии. В это время было необычно, чтобы техническое нововведение было нацелено в первую очередь на женщин и популяризировать в первую очередь среди них.
👍2🤯2💋1
Странные интерфейсы. Кроненберг

#кино #странные_интерфейсы

У интерфейсов в поп-культуре — целая история, которая заслуживает отдельного внимания. Тезис о том, что научная фантастика влияет на развитие реальных технологий слишком часто оспаривался, чтобы его можно было воспринимать всерьёз. Но некоторые фильмы и тексты об интерфейсах будущего, хотя и кажутся теперь забавными, могли послужить источником вдохновения для дизайнеров. Даже если это вдохновение от противного.

На протяжении всего 20 века режиссёры продолжали фантазировать на тему интерфейсов и взаимодействия пользователей с ними. В этих фантазиях прослеживались некоторые общие места. Но один фильм обходил меня вниманием слишком долгое время — речь пойдет о Дэвиде Кроненберге и его фильме «Экзистенция». На закрытой презентации игры виртуальной реальности под названием «Экзистенция» на ее великолепную создательницу Аллегру Гелла совершает покушение сумасшедший убийца, который хочет уничтожить и ее игру! Вынужденная спасаться бегством, Аллегра подключает младшего сотрудника к тестированию поврежденной системы тем, что … убеждает его сыграть в Экзистенцию вместе с ней.

Впервые на широких экранах кино появилась концепция органических интерфейсов — не только приставка была выполнена в форме органики с пуповиной-проводом, но и оружие имело форму живых организмов-моллюсков.

Посмотрите уж, не откажите себе в удовольствии. Кстати, новая игра о Гигере Scorn явно не только Гигером вдохновлялась.

P.S. А арт-директором фильма была канадская художница Carol Spier, которую Кроненберг брал во все свои фильмы.
👍6🌚3💋1
Боевой листок корпоративного мира Harvard Business review выдал таки свои свежие пояснения по использованию нейросетей типа ChatGPT.

“Вертикальный поиск является сильным вариантом использования LLM по нескольким причинам. Во-первых, они фокусируются на конкретных областях и вариантах использования — узких, но глубоких знаниях. Это упрощает обучение LLM на тщательно отобранных наборах данных, которые могут поставляться с исчерпывающей документацией, описывающей источники и технические детали модели. Это также упрощает регулирование этих наборов данных в соответствии с соответствующими законами, правилами и положениями об авторском праве, интеллектуальной собственности и конфиденциальности.

Меньшие по размеру и более целевые языковые модели также означают меньшие вычислительные затраты, что упрощает их более частое переобучение. Наконец, эти LLM будут регулярно тестироваться и проверяться сторонними экспертами ( и тестировщиками, добавлю), подобно тому, как аналитические модели, используемые в регулируемых финансовых учреждениях, подлежат строгим требованиям тестирования.

В областях, где экспертные знания, основанные на исторических фактах и ​​данных, составляют значительную часть работы, вертикальные LLM могут предоставить новое поколение инструментов повышения производительности, которые дополняют людей совершенно новыми способами. Представьте себе версию ChatGPT, подготовленную на основе рецензируемых и опубликованных медицинских журналов и учебников и встроенную в Microsoft Office в качестве помощника по исследованиям для медицинских работников. Или версия, подготовленная на десятилетиях финансовых данных и статей из ведущих финансовых баз данных и журналов, которые банковские аналитики используют для исследований.”
https://hbr.org/2023/02/generative-ai-wont-revolutionize-search-yet

Думаю, что пока всякие консультанты по UX не начали предлагать на питчах скевоморфизм в виде создания личностей для каждого из корпоративных помощников, у нас есть еще немного времени. Но я бы пригляделся к тому что почти все свежие анонсы виртуальных ассистентов имеют некоторую “личность” и, в общем-то, это понятная антропологизация в дизайне в последние десятилетия.

Гораздо интереснее и продуктивнее смотреть с точки зрения создания “бутиков экспертов”, маркетплейса “мудрецов”.
👍2💋1
Рубрика странные интерфейсы

Книга Виталия Файна «Человеко-­машинный диалог в художественном творчестве» - нигде не достать, но выглядит заманчиво

Фейн указывал на невозможность полной автоматизации работы скульптора, поскольку «скульптор (дизайнер, реконструктор) обычно не в состоянии предвидеть конечный результат работы или сформулировать критерий остановки рабочего процесса»
💋41
Создание визуального индустриального языка в СССР.

Эксперимент Леонида Левицкого в журнале "Техническая эстетика". Статья "Из опыта проектирования знаковой системы для технологической документации"

Специалист в области графического дизайна и промышленного дизайна, он затем стал карикатуристом и художником-постановщиком в нескольких фильмах.

Элементарная фраза состоит из знака, обозначающего функциональный элемент и его тип, и знака функции этого элемента или действия, управляющего им, включая обозначения характера и направления действия. Предполагается, что такой язык будет и композициональным, и даже немного контекстуальным. Обозначения позволяют передавать информацию рабочим и обозначать на чертежах функциональность в рамках одного предприятия. Такие мнемоязыки допускались, но насколько они были распрастранены - вопрос.
🔥9👍3💋2👏1
О выборе. Архитектура выбора и поведенческая экономика
но знает Бог, что в день, в который вы вкусите их, откроются глаза ваши, и вы будете, как боги, знающие добро и зло.
Бытие 3:5

Вернемся к выбору пользователя. Итак, чтобы сделать выбор пользователь должен хотя бы осознать, что выбор есть, даже если это осознание совсем минимально — например, выбор программы по привычке. При тестировании ПО способ осознания находится под значительным контролем экспериментатора. Некоторые известные и поразительные результаты тестирования «выбора» очень сильно завязаны на постановку задачи. Например, классическое различие между «спасением» или «умиранием» людей в вагонетке при том или ином выборе: иногда достаточно разницы формулировок.

Как и сотрудники лабораторий многие разработчики взаимодействий часто получают контроль над тем, каким образом выбор предоставляется пользователю. Так пользователям, которые приобретают программный продукт, часто предлагается вариант типа «Установите этот флажок, чтобы получать новости об обновлениях», который пользователь может мысленно прочитать «Установите этот флажок, чтобы получить еще больше спама».

Канеман в своей классической работе предполагал наличие целых двух способов выбора пользователем — быстрый способ A и медленная система B, каждая из которых эволюционно связана с процессами выбора и отлична скоростью реакций, временем на обработку информации и т.д. Все это круто, но жизнь ярче схем. Когда пользователь принимает решение за пределами лаборатории, то он редко становится перед явной проблемой выбора. Понимание ситуации и необходимость выбора может быть сложным процессом, который описывали сторонники натуралистического подхода (Кляйн, как-нибудь расскажу об этом подробнее позже). Попробую совсем по простому:

Представьте себе пожарную команду, которая выехала на вызов. Здание горит, огонь распространяется, меняется температура и очаг возгорания меняется в зависимости от материалов. Выбор решения будет зависеть от времени и стадии развития процесса пожара, пока его тушение не станет экономически невыгодным(простите за мем). Но таким же образом пользователи проводят диагностику и ремонт компьютера.

Пафосный термин «архитектура выбора» описывает ситуации, когда люди упускают из виду или игнорируют возможность выбора при взаимодействии с ПО и это основной способ воздействия на пользователей таких архитекторов. Это и операционная система Windows (которая предлагает новым пользователям удобный вариант по умолчанию для многих вариантов приложений, которые им пришлось бы настраивать по умолчанию), и параметры конфиденциальности по умолчанию для социальных сетей.

За пределами HCI это стало основной инновацией поведенческой экономики. Есть законы, в которых говорится, что каждый человек может рассматриваться как донор органов, если не указано иное. А сколько из вас получали налоговый вычет? То, что возникло для компьютеров с годами стало частью правовой культуры современного мира.

Все это стало nudges theory или, шире, теорией подталкивания.
«Подталкивание, как мы его будем далее называть, — это любой аспект процесса принятия решения, который побуждает людей изменять свое поведение определенным образом, не внося никаких ограничений в возможности выбора. Подталкивание называется простым, если его можно легко избежать. Подталкивание не является запретом. Например, выкладывание фруктов на уровне глаз считается подталкиванием; а запрет нездоровой пищи — нет.»
Ричард Талер, Касс Санстейн «Nudge. Архитектура выбора».

Но вообще и кроме пресловутых наджес есть много теорий и объяснений, которые описаны с разной степенью подробности. Например, книга Choice Architecture for Human-Computer Interaction - как кажется, достаточно мейнстримная (автор писал соответствующие главы в учебниках)
👍4🤔2💋1
Choice-Architecture-for-HCI.pdf
7.4 MB
Choice Architecture for Human-Computer Interaction
👍3💋1
Опережая события

В 1923 году редакционный карикатурист по имени Х.Т. Вебстер нарисовал юмористический комикс для New York World, изображающий вымышленную машину 2023 года, которая будет автоматически генерировать идеи и рисовать их в виде комиксов

.
🔥16👍61👏1💋1
Странные интерфейсы

Основатель советской космической медицинской психологии Федор Дмитриевич Горбов был одним из тех, кто отбирал в свою группу Гагарина.

Для тестирования кооперативности и групповой психологии в условиях стресса применялись разные методы. Так, на основе наблюдений за поведением кандидатов в бытовых ситуациях, он определял неформального лидера группы, действовавшего не в личных интересах. Изначально - душевая кабина

Горбов Ф.Д., Лебедев В.И. Психологические аспекты труда операторов. М.: Медицина, 1975.
👍11💋5🔥4😐2
Более поздняя версия гомеостата: каждый испытуемый должен был поставить на ноль, при этом воздействуя на остальные - требовалась кооперация с участниками, чтобы решить головоломку

Тактики работы и характер действий записывались
👍4💋3
Виртуальный ассистент Конфуций: изучение традиционных ценностей при помощи разговорных интерфейсов и ботнета

Сегодня любопытный проект от Adrian David Cheok и Emma Yann Zhang о древних мыслителях и виртуальных ассистентах.

Исследование рынков Дальнего Востока и Юго-Восточной Азии в период экономического роста всегда сталкивалось с проблемой смены поколений — традиционный запрос многих пользователей стоял в том, чтобы наладить коммуникацию между поколениями, найти учителя детям и заставить бабушек и внуков общаться при помощи современных средств на некие “вечные” темы (чтобы это не значило). На вопрос «что это за традиционные скрепы» очень устойчивый процент респондентов называли «конфуцианство».

Здесь целый ряд проблем: скучные и малопривлекательные тексты о конфуцианской этике в медиа, которые не интересны молодежи, устаревшая подача, невозможность подключить других пользователей к обсуждению топиков. Было разработано 2 прототипа: первый был простым приложением, который просто позволял вводить вопрос, и получать ответ из базы знаний по конфуцианству.

А: Кто такой Ян Хуэй?
Б: Ян Хуэй - мой любимый ученик.


Для второго прототипа также подготовили несколько серий диалогов, которые будут инициированы виртуальным собеседником.

Итак, собеседник может анализировать философские намерения пользователя и генерировать глубокие и содержательные ответы, основанный на конфуцианстве, особенно тему семьи. Сами пользователи оценивали релевантность ответов и удовлетворение на 80 процентов. Как по мне CSI и NPS говно метрики, но для Конфуция может быть и самое то.
🍓2
10.1007@978-3-319-94730-36.pdf
1.1 MB
A Virtual Confucius Chatbot. Reviews on Biomarker Studies in Psychiatric and Neurodegenerative Disorders (!!!)

Еще много всяких умных слов о кластеризации и NLP и тд и тп, но вы обратите внимание в КАКОМ журнале опубликован.
🍓1