MaxRepost
1.29K subscribers
1.94K photos
449 videos
16 files
8K links
Мои мысли про ai, медиа, рекламу, технологии и разная странная хрень, которая происходит вокруг.

😎

Вопросы, предложения, подводные камни? @amyot
Download Telegram
Forwarded from Сиолошная
TLDR презентации:
— скачать браузер и посмотреть на фичи тут: https://chatgpt.com/atlas
— доступно только на MacOS, в будущем добавят Windows и мобильные устройства
— Браузер называется не OpenAI Atlas, а ChatGPT Atlas. Компания явно делает ставку на увеличение узнаваемости бренда Чата.
— браузер доступен всем странам и всем пользователям бесплатно
— Ключевых нововведения, по отношению к обычному браузеру, 3. Первое — чат с вами на любой странице. Есть кнопочка сверху справа, можно нажать — и ChatGPT видит содержимое.
— Второе — память. Это так по умному назвали поиск по истории, если вдруг вы забыли, на каком домене что-то искали, но помните примерное описание контента.
— Третье — Агент. По виду это в точности ChatGPT Agent, который мы видели, но теперь все действия выполняются на вашем экране, а не на удалённой виртуальной машине. Можно выбрать, предоставлять ли доступ к своим учётным записям или нет. Агент доступен только Pro и Plus пользователям
— (ну и главная страница у вас всегда ChatGPT)
— Для агента показанный сценарий такой: вы нашли страницу с рецептом блюда через чат, попросили пересчитать ингридиенты на 8 персон и отправили агента оформлять онлайн-заказ. В этот момент можно переключиться на другую вкладку, пока идёт работа в фоне. Агент вызовет вас, если потребуется подтверждение, например, оплаты заказа.
— если вы нажимаете на ссылку в чате с ChatGPT, то чат красиво съедет вправо, и сессия сохранится. Можно задавать вопросы по странице или перескачить на другую.
— В любом текстовом поле можно выделить текст и появится маленькая точечка. При нажатии откроется маленькое окно, в котором можно дать команду вроде «перепиши но нормально» или «переведи» (команду вводите вы сами, хотя мб в будущем логично добавить 2-3 кнопки сценариев по умолчанию)

В остальном браузер максимально обычный и не предлагает ничего нового пользователям — это сделано намеренно, чтобы людям не пришлось переучиваться. UI/UX выглядит очень приятным по презентации.

Я попробую посидеть на нём несколько дней вместо Arc; вкладки только горизонтальные (от чего я отвык), так ещё и нельзя экспортировать из Arc, только из Chrome и Safari :(
Ну пошел тестить!

@maxrepost 👾
👍2
Агент с ограниченными возможностями

Возможно, вы не заметили строчку в описании нового браузера ChatGPT Atlas:

Владельцы сайтов также могут добавить теги ARIA, чтобы улучшить взаимодействие их ресурсов с Atlas.


Не все слышали про теги ARIA (Accessible Rich Internet Applications), поэтому объясню.

ARIA-атрибуты и роли придуманы, чтобы с сайтом было проще взаимодействовать не ИИ-агентам, а людям с ограниченными возможностями.

Например, ARIA может взять поле пароля и связать его с подсказкой, каким должен быть пароль. И человеку, который не может видеть страницу, и поэтому воспринимает ее на слух, это поможет. Структура страницы будет понятнее.

Как выясняется, теперь технология, которая создана для людей с ограниченными возможностями, напрямую будет использоваться (и влиять на понимание контекста) роботами.

Интересно, когда это предназначение ARIA станет основным?
👍41
Помните, я летом писал, что хочется делать не только коммерческий консалтинг и внедрения, но и побольше исследований. Так вот. Мы объединились с моей подругой и сделали лабораторию Mediacontext.

Мы в экспериментальной лаборатории Mediacontext работаем в двух направлениях: Ctrl-l (читается - контроль) это что-то вроде прививок или БАДов для llm, а Reg-Eval (рег-эвал) это анализы. Одни штуки защищают llm и помогают справляться с инъекциями пропаганды и инфомусором. Вторые — дают понимание знает ли llm региональный контекст и специфику низкоресурсных языков. В будущем еще мы запустим ежедневный чекап — проверку «в порядке» ллмка или поплыла, отупела и тому подобное.

@maxrepost 👾
4👍2💅1
Forwarded from нёрд хаб (PINGAS)
This media is not supported in your browser
VIEW IN TELEGRAM
Нейрослоп от Grimes! Исполнительница Клэр Буше выпустила клип на композицию Artificial Angels с кучей отсылок к ИИ-эпохе, в которой мы все сейчас существуем.

Камео вайфу-компаньона Эни от бывшего Grimes, реальные кадры с налепленной вотемаркой Sora и повествование от лица зазнавшейся машины прилагаются!
2
Forwarded from Not Boring Tech
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Google мощно прокачал AI Studio — появились целые пресеты для создания полноценных приложений в один клик.

Как работает:

1. Выбираем, какие фичи, инструменты и нейронки подключить к проекту.
2. Пишем свой запрос или жмём «I’m Feeling Lucky», чтобы получить случайную идею приложения.
3. За пару минут Gemini генерирует полноценную тулзу, которую можно сразу затестить и внести любые правки.

Пробуем бесплатно — тут.

@notboring_tech
👏1
Так ну чуда не случилось - расходимся. Atlas от GPT это опять браузер без вау-фич и прорывов.Генри Форд говорил, что если бы он спросил людей, чего они хотят,
они бы ответили: «Более быструю лошадь». Вот это оно

@maxrepost 👾
Кстати наткнулся на интересный факт — все браузеры в мире сейчас построены всего на трех движках:
Blink (Google создал на базе WebKit в 2013), WebKit (Apple сделали в 2001) и Gecko (Разработан Netscape в 1997–1998), ныне поддерживается Mozilla Foundation). Следующим летом все гики ждут альфа версию четвертого - Ladybird.

Правда сейчас, когда Ladybird отделился от SerenityOS (это такая супер-нишевая гик операционка), он больше не связан этой культурой, и берет сторонние библиотеки для типовой функциональности — например, для форматов изображений/аудио/видео, шифрования, графики.

@maxrepost 👾
Хотя Atlas и не потряс мир, зато потряс конкурентов. И оп Anthropic раздали всем сегодня Claude Desktop — свой ai-ассистент.

@maxrepost 👾
Forwarded from Futuris (Anton)
This media is not supported in your browser
VIEW IN TELEGRAM
Мне кажется или я освоил эпик шортсы в соре?

добавляем slow motion
epic cinematic-edit scenes
phonk + sound from video.
Real movie shots
crazy angles. brutal, grimm.

и описание вашей задумки коротко Бабушка из России, с клунками с рынка entering medieval battlefield. - профит👌
👏1
This media is not supported in your browser
VIEW IN TELEGRAM
У ElevenLabs вышло обновление — Voice Isolator теперь работает с видео.

Можно загрузить любой ролик и убрать лишние звуки: разговоры, музыку, за которую вас заблочит YouTube, уличный шум или эхо.

На выходе — тот же формат, только с чистым звуком. Ну и как красиво и просто они это показали.
2
Forwarded from Futuris (Anton)
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft представили Edge Copilot Mode — экспериментальный режим браузера с ИИ-функциями: новая домашняя страница объединяет поиск, чат и навигацию; можно «разговаривать» с Copilot, чтобы без рук просматривать и выделять контент; получать быстрые ответы прямо в текущей вкладке; суммировать и анализировать открытые вкладки и историю; доступны ранние возможности вроде Copilot Actions (выполняют рутинные шаги) и Journeys (помогают продолжать исследования), а также ИИ-инструменты: генерация изображений, краткое содержание видео, группировка вкладок, «Спросите Copilot», перевод видео в реальном времени; всё с настраиваемыми разрешениями и приватностью, ранний доступ пока ограниченно доступен в США.

Только что проверил под ВПН, на бесплатном копилоте агенты пока недоступны, но даже общаться о контенте (визуальном и текстовом) очень удобно с самим браузером 👌 конкуренция творит чудеса, браузеры оживают не по дням а по часам🌚
Почему рисеч про AI и новости от EBU это профанация

Сегодня все обсуждают исследование BBC (а точтее БиБиСи и ЕБУ) про то, что ai постоянно ошибается. Так вот исследование это плохое. В своем исследовании EBU и BBC показали ровно то, что и ожидалось (а может хотелось): они измеряли не реальную точность или качество работы ai, а то, как людям кажется, что ai работает. И это плохо сделано и плохо работает вот почему:

1. Это не EVAL, это социальный опрос на тему “А вам не страшно, что у ai есть мнение и в нем бывают ошибки?”
Вместо системной проверки моделей на фактические ошибки, мы видим классическую кальку с focus group research: “А как вы чувствуете себя рядом с роботом?” Вся методология заточена под оценку страха и недоверия, а не объективного качества работы ai-ассистентов.
Внятной автоматизированной оценки, например, через экспертную валидацию выборки ответов LLM, тут нет и в помине.
2. Проталкивают моральную панику — и ещё делают это топорно
Они не исследуют реальные ошибки и не сравнивают их с baseline-ошибками обычных журналистов. Зато очень любят спрашивать: “А если у ai будет неправильная дата? А если он внезапно… ВДРУГ… впроцитирует не всех?!”
Классика: задаём респонденту страшный вопрос — получаем страшный ответ. Это не научный подход, а подогрев истерии.
3. Манипуляция через “делиберативные группы”
Фокус-группы рассматривали только заранее выбранные кейсы с ошибками — якобы, чтобы “выявить реакцию”. Но таким образом организаторы сами провоцируют негативную установку, искажают восприятие — а потом радостно делают вывод: “все недовольны!”.
В реальности это не отражает отношение аудитории к обычному потоку новостей с ai.
4. Статистический нонсенс и логическая каша
Смешивают “инстинктивные ощущения” (Binary Response Time, ага, модная метрика) с постфактумными мнениями после демонстрации ошибок. Получается: аудитория доверяет, пока не покажут ошибку. А потом перестаёт.
Ну правда, кто бы мог подумать, что если показать человеку лажу, он перестанет доверять источнику!

Продали это как качественную технологическую оценку, а по сути реальной валидной оценки качества моделей тут нет. Вместо этого нам рассказывают, что “ассоциация с брендом BBC страдает”, если ai ошибся, и “все должны каяться”. В итоге отчёт про то, как людям страшно, когда нейросеть ошибается — а не про то, насколько нейросеть вообще умеет делать свою работу. И главное как получать стабильно хороший результат.

@maxrepost 👾
Forwarded from EDU (Bayram Annakov)
Почему LLMки пока хуже 4х летнего ребенка?

Получил удовольствие от просмотра лекции Alison Gopnik из Santa Fe Institute —> вот ключевые мысли:
1) Есть разные типы интеллекта, в завимости от стадии жизни:
- исследовательский (explore) - это, в основном, про детей, про поиск вширь
- эксплуатирующий (exploit) - это про взрослых, про эффективность, про поиск вглубь
- заботящийся (care) и передающий культуру (culture transmission) - это про пожилых, про сохранение и передачу накопленного знания и опыта, традиций

Гопник разводит поиск истины и передачу знаний: дети как исследователи расширяют пространство возможного, а взрослые и пожиле же - обеспечивают достоверность и преемственность.

2) Дети большую часть своего раннего развития тратят на проверку гипотез, слом паттернов, и пробование вещей, которые не работают. Их темп обучения высокий - learning rate в терминах машинного обучения - а чувствительность к вознаграждению - низкая —> они учатся через любопытство, а не ради эффективности. Чего не скажешь о взрослых.

LLM-ки же, напротив, сжимают и имитируют существующее знание; они невероятно хороши в передаче культуры (как накопленного знания), но слабоваты в генерации фундаментально новых абстракций. (да, мы в последнее время начинаем замечать, что появляются таки новые открытия)

3) Поэтому LLMки стоит рассматривать не как новый тип интеллекта, а скорее как "инфраструктуру" для более эффективной передачи коллективного человеческого знания. Так же как письменность, печатный станок, и Интернет.

Посмотрите на досуге - для меня это стало глотком свежего воздуха и новой перспективой на фоне одног и того же перемалывания и спекуляции.

https://www.youtube.com/watch?v=PNE5pfQBlxM

===
P.S. Кстати, открыл для себя еще один способ использования Atlas - открываю YouTube и прошу порекомендовать мне видео, связав с моими интересами, и по мере просмотра лекции задаю вопросы справа, получаю доппейперы, видео и книги по теме.
Clippy приветствует своего потомка: Microsoft представила Mico — голосового помощника режима чат-бота Copilot.

Mico обладает мимикой и может менять выражения «лица» в зависимости от темы разговора.

Изначально помощник будет доступен только в США, Великобритании и Канаде.
Появилась камера, в которой есть алгоритмическая система подтверждения, что это реальное фото и оно получено именно с датчика фото. Подтверждение построено на базе ZK и покрывает не только пиксели, но и метадату.

Я думал про такой проект пару лет назад и мы даже подобрали аппаратную базу. Но кажется, что эту фичу в ближайший год просто добавят в регистраторы, а потом и в iPhone и Android смартфоны и на этом стартап с пруф-камерой закончится не успев начаться.

@maxrepost 👾
1
Forwarded from addmeto (Grigory Bakunov)
OpenAI купили разработчика Sky.app - небольшого приложения которое улучшало использование ИИ на десктопе. Приложение по видео было неплохим, но есть один вопрос - кажется навайбкодить такое приложение с помощью OpenAI было делом нескольких часов 🙂 https://openai.com/index/openai-acquires-software-applications-incorporated/
Forwarded from The Edinorog 🦄
🕵️ Русский след в иске Reddit к Perplexity: что известно про AWMProxy

Reddit решил засудить Perplexity за использование своих данных — мол, та фактически украла данные, в которых «отчаянно нуждалась». С полным текстом иска можно ознакомиться здесь. И в нем фигурирует AWMProxy с российскими корнями — ее услугами пользовалась Peplexity. И оказалось, что у этой компании богатая история.

Кстати, Perplexity дала ответ на иск на самом же Reddit. Говорят, что собирали данные не для обучения AI. Они вообще не обучают. Они просто собирали данные, чтобы давать ответы. Это как простые пользователи ссылками делятся. И вообще Reddit подала в суд на Perplexity, чтобы показать свою силу Google и OpenAI.

Но давайте вернемся к AWMProxy. Она упомянута в иске с еще двумя компаниями — литовской Oxylabs и американской SerpApi. Бизнес AWMProxy заключается в том, что она дает доступ к своим прокси-серверам. С их помощью можно скрыть свое местоположение и личность. В общем, эти прокси, похоже, использовали для парсинга данных с сайта Reddit.

Это довольно старая контора. На одном из форумов в 2015-м представители AWMProxy писали, что они на рынке уже 12 лет. То есть компания существует с 2003 года. Но в некоторых источниках указано, что с 2008-го.

И AWMProxy оказывалась связанной с несколькими киберпреступными историями. Например, в 2011-м «Лаборатория Касперского» рассказывала про ботнет TDSS. Компьютеры, зараженные TDSS, использовали в качестве анонимных прокси. А витриной для продажи этой услуги был AWMProxy.

Эксперт в кибербезопасности Брайан Кребс тогда связывал AWMProxy c чуваком из Петербурга по имени Чингис Галджиев с никнеймом Fizot. Но после статьи Кребса Fizot удалил все публикации в своем ЖЖ и написал, что давно уже продал AWMProxy.

В 2022-м AWMProxy опять всплыл в блоге Кребса. На этот раз он писал про связь компании с ботнетом Glupteba. Этот ботнет впервые был зарегистрирован в 2011-м. А в 2021-м Google подала в суд на предполагаемых операторов Glupteba россиян Дмитрия Старовикова и Александра Филиппова. Компания обвиняла их в том, что они заразили более 1 млн компьютеров, похищали данные, занимались тайным майнингом крипты и так далее.

Филиппов и Старовиков тогда даже ответили на этот иск. Написали, что не особо поняли сути обвинений. В конце 2022-го Google выиграла дело. Правда, Филиппов и Старовиков вроде как были в России, поэтому на них это не особо повлияло.

И вот Кребс в своем расследовании связывал AWSProxy с Дмитрием Старовиковым.

Теперь AWMProxy оказалась в деле «Reddit против Perplexity». Представители Reddit утверждают, что мощности этой компании использовались для незаконного получения данных с Reddit.

Кстати, в 2019-м логотип для AWMProxy разрабатывала «Студия Артемия Лебедева».

@TheEdinorogBlog — тот самый канал про стартапы🦄
🥰1👻1👀1
Forwarded from Denis Sexy IT 🤖
И еще поигрался с интересной моделью: TimeCapsuleLLM

С 1800 года по 1875 было опубликовано примерно 175 000 текстов на Английском, которые попали в интернет библиотеки

Если взять текст этих публикаций и натренировать с нуля (важно именно с нуля) языковую модель, то в теории получится усредненная по уровню «размышлений» LLM 19го века

Я запустил модель автора, и попросил ее сделать предсказания на тему будущего – модель сыровата, но небольшие предсказания тем языком способна выдать (перевод сгладил все ошибки):

Грядущие способы сообщения соткут невидимые нити из таинственного эфира, охватив весь земной шар и соединив между собой величайшие хранилища знаний, рассеянные по самым далёким уголкам мира. Посредством особых электрических аппаратов учёные мужи смогут отправлять запросы на любые расстояния и в то же мгновение получать ответы, содержащие книги, трактаты и даже новейшие открытия из отдалённых университетов и библиотек. Представьте себе, как джентльмен, пребывая в своём лондонском кабинете, пожелает ознакомиться с неким документом, хранящимся в далёком Гарвардском университете за океаном, и через краткое мгновение невидимая электромагнитная сила доставит содержание этой рукописи прямо к его письменному столу, не прибегая ни к проводам, ни к почтовым дилижансам. Эта поразительная возможность обмена знаниями навсегда изменит природу учёности, открыв двери к невиданному ранее распространению просвещения и [далее следует учёная дискуссия]


Механические мыслительные машины будут созданы на основе принципов вычислительного устройства мистера Бэббиджа, однако их возможности выйдут далеко за рамки арифметики и охватят весь спектр человеческого мышления. Эти искусственные разумы будут оснащены обширными механическими системами памяти, хранящими все известные человечеству знания, и с помощью сложных зубчатых передач и часовых механизмов смогут осуществлять логические выводы, распознавать закономерности и вести интеллектуальные беседы. Получив любой вопрос или проблему, механический мозг будет искать в своей памяти нужную информацию, применять логическое рассуждение через свои механизмы и выдавать осмысленные ответы так, словно это был бы высокообразованный учёный. Подобные искусственные интеллектуальные устройства могли бы выполнять роль механических наставников, консультируя студентов в математике, естественной философии, истории и литературе, работая без устали и обладая совершенной памятью о каждом факте, когда-либо заложенном в их механические хранилища


Результаты интересные, но немного читинг, потому что модель умеет только продолжать текст (чат формата в ней нет) и первые 5-6 слов мои, а продолжение модели

Я связался с автором так как хотел денег задонатить, но он говорит что его уже университет спонсирует и оказалось что он видел какие-то мои GenAI эксперименты, так что может удастся вместе даже что-то поделать

Ждем новую версию в общем, для путешествий во времени с LLM ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Grab — одни из самых дерзких парней в Азии за ними надо следить.

Grab — компания типа Uber, предоставляющая услуги такси и логистику через свое приложение в Сингапуре и соседних Индонезии, Вьетнаме, Тайланде и других странах.  Команда реально приостанавливала работу ради перестройки процессов под ai — целых девять недель в формате G/AI-sprint. Без новых фич, без привычной рутины. Зато с GrabGPT (внутренним аналогом ChatGPT), Mosaic (генератором иллюстраций в фирменном стиле), и с новыми правилами вроде demos over memos и bi-coding — когда PM и дизайнеры сами правят интерфейсный код, чтобы срезать обратную связь до минимума.

В результате появились десятки прототипов и несколько реальных запусков — AI-ассистенты для водителей и продавцов, генераторы текстов и графики, быстрые тулинги. 76% сотрудников теперь регулярно пользуются AI-инструментами. Но… сколько стоила пауза? Какая конверсия в продакшн? Ответов пока нет.

Ещё один мощный трек — GrabMaps и векторизация мира. Компания обучает визуальные модели (включая GPT‑4o Vision) на уличных фото, переводит их в векторные слои и строит карту заново, на своих данных. Это уже коммерческий продукт. Учитывая, что и раньше карты Grab были в разы лучше гугловских в своих регионах, теперь еще сильнее отрыв увеличится.

@maxrepost 👾
2