Парное програмирование с большими языковыми моделями
Хочу рассказать о новом онлайн-курсе от DeepLearning.AI совместно с Google. Он посвящен применению больших языковых моделей (типа ChatGPT) в работе программиста.
На курсе расскажут, как упрощать код и повышать скорость разработки с помощью ИИ, как находить ошибки в коде и рефакторить его, а также как пояснять и документировать сложный код на разных языках программирования.
Курс рассчитан всего на 1 час, доступен бесплатно на платформе DeepLearning.AI и включает в себя практические задания на модели PaLM от Google.
Курс будет полезен программистам, которые хотят научиться применять возможности ИИ в своей работе. Его ведет Laurence Moroney, один из ведущих специалистов Google по искусственному интеллекту.
🤖 Ссылка на курс
Хочу рассказать о новом онлайн-курсе от DeepLearning.AI совместно с Google. Он посвящен применению больших языковых моделей (типа ChatGPT) в работе программиста.
На курсе расскажут, как упрощать код и повышать скорость разработки с помощью ИИ, как находить ошибки в коде и рефакторить его, а также как пояснять и документировать сложный код на разных языках программирования.
Курс рассчитан всего на 1 час, доступен бесплатно на платформе DeepLearning.AI и включает в себя практические задания на модели PaLM от Google.
Курс будет полезен программистам, которые хотят научиться применять возможности ИИ в своей работе. Его ведет Laurence Moroney, один из ведущих специалистов Google по искусственному интеллекту.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21❤7
Эффективное квантование нейросетей в 8-бит
Исследователи предложили новый подход к сжатию нейросетей (без обучения заново), позволяющий сократить размер моделей в 4 раза (практически) без потери точности.
Исследователи из Intel и AMD предложили новое 8-битное представление с плавающей запятой. Оно более эффективно представляет распределение данных в сети.
Глубокие нейронные сети требуют огромных вычислительных мощностей. Уменьшение размера моделей позволит использовать их на большем количестве устройств.
Модели с таким представлением протестировали на задачах обработки языка и изображений. Результаты показали лучшее качество по сравнению с обычным 8-битным форматом.
Более того, исследователи выкатили целую библиотеку Intel® Neural Compressor, в которой реализовали новый метод, а так же множетсво других вариантов сжатия нейросетей.
🔍 Статья
🔗 Neural Compressor
Исследователи предложили новый подход к сжатию нейросетей (без обучения заново), позволяющий сократить размер моделей в 4 раза (практически) без потери точности.
Исследователи из Intel и AMD предложили новое 8-битное представление с плавающей запятой. Оно более эффективно представляет распределение данных в сети.
Глубокие нейронные сети требуют огромных вычислительных мощностей. Уменьшение размера моделей позволит использовать их на большем количестве устройств.
Модели с таким представлением протестировали на задачах обработки языка и изображений. Результаты показали лучшее качество по сравнению с обычным 8-битным форматом.
Более того, исследователи выкатили целую библиотеку Intel® Neural Compressor, в которой реализовали новый метод, а так же множетсво других вариантов сжатия нейросетей.
🔍 Статья
🔗 Neural Compressor
👍20❤6🔥1
Интерактивная статья про тестирование ИИ
Журнал Nature выпустил занимательную интерактивную статью о том, как оценивают умные чатботы типа ChatGPT. Задача оказалось непростй даже для самих создателей ИИ.
В статье разбираются разные способы оценить, насколько хорошо чатботы понимают текст и умеют рассуждать. Есть классический тест Тьюринга, когда человек должен понять разговаривает он с ботом или с другим человеком. Есть и более современные подходы, где ИИ проходит серию испытаний, по результатам которых оцениваются разные его аспекты.
Но главная фишка этой статьи в интерактивных примерах, где можно самому пообщаться с чатботом или пройти тесты для ИИ. Такой формат позволяет лучше разобраться в сложностях оценки искусственного интеллекта.
Дальше в статье обсуждаются разные способы тестирования ИИ - психологические, поведенческие и другие. Анализируются плюсы и минусы каждого подхода простым языком.
В итоге авторы призывают создать более надежные тесты, чтобы понимать, что умеют чатботы, а что нет. Это важно для исследований и безопасного использования ИИ.
Рекомендую эту статью всем, кто интересуется темой тестирования умных чатботов. Интерактивный формат делает материал наглядным и доступным.
🕹 Интерактивная статья
Журнал Nature выпустил занимательную интерактивную статью о том, как оценивают умные чатботы типа ChatGPT. Задача оказалось непростй даже для самих создателей ИИ.
В статье разбираются разные способы оценить, насколько хорошо чатботы понимают текст и умеют рассуждать. Есть классический тест Тьюринга, когда человек должен понять разговаривает он с ботом или с другим человеком. Есть и более современные подходы, где ИИ проходит серию испытаний, по результатам которых оцениваются разные его аспекты.
Но главная фишка этой статьи в интерактивных примерах, где можно самому пообщаться с чатботом или пройти тесты для ИИ. Такой формат позволяет лучше разобраться в сложностях оценки искусственного интеллекта.
Дальше в статье обсуждаются разные способы тестирования ИИ - психологические, поведенческие и другие. Анализируются плюсы и минусы каждого подхода простым языком.
В итоге авторы призывают создать более надежные тесты, чтобы понимать, что умеют чатботы, а что нет. Это важно для исследований и безопасного использования ИИ.
Рекомендую эту статью всем, кто интересуется темой тестирования умных чатботов. Интерактивный формат делает материал наглядным и доступным.
🕹 Интерактивная статья
👍15❤7🔥1
Краткий обзор анонсированных на конференции MetaConnect2023 новых продуктов и исследований в области AI от компании Meta:
На MetaConnect2023 был представлен ряд новых продуктов, опирающихся на последние достижения в области искусственного интеллекта.
В частности, были анонсированы следующие AI-модели и исследования:
- Llama 2 - открытая модель для диалоговых систем
- Emu - генеративная нейросеть для картинок
- Масштабируемые контекстные модели для диалоговых систем
- Code Llama - генерация и обсуждение кода
- Segment Anything - сегментация изображений для Instagram
Эти разработки лягут в основу таких продуктов Meta, как виртуальные персонажи, стикеры и фильтры в Instagram, умный помощник и др.
Более подробно ознакомиться с этими исследованиями можно по ссылкам в посте. Интересно то, что после всех лет и инвестиций в исследования, Meta наконец то заходит в продакшен, и то ли еще будет!
На MetaConnect2023 был представлен ряд новых продуктов, опирающихся на последние достижения в области искусственного интеллекта.
В частности, были анонсированы следующие AI-модели и исследования:
- Llama 2 - открытая модель для диалоговых систем
- Emu - генеративная нейросеть для картинок
- Масштабируемые контекстные модели для диалоговых систем
- Code Llama - генерация и обсуждение кода
- Segment Anything - сегментация изображений для Instagram
Эти разработки лягут в основу таких продуктов Meta, как виртуальные персонажи, стикеры и фильтры в Instagram, умный помощник и др.
Более подробно ознакомиться с этими исследованиями можно по ссылкам в посте. Интересно то, что после всех лет и инвестиций в исследования, Meta наконец то заходит в продакшен, и то ли еще будет!
🔥10❤2
Партнёрство Cloudflare и Hugging Face
Cloudflare объявило о начале партнёрства с Hugging Face с целью сделать модели ИИ более доступными для разработчиков.
Что обещают? 👀
-В Hugging Face появятся безсерверные модели GPU без инфраструктурных "костылей" и оплат за неиспользуемые мощности. Просто выберите свою модель и работайте.
-Модели Hugging Face появятся в каталоге моделей Cloudflare
-Интеграционные инструменты Cloudflare станут частью Hugging Face Inference
Разработчики, использующие платформу Cloudflare, вскоре смогут развертывать модели Hugging Face прямо с панели управления Cloudflare, а те, кто использует Hugging Face, смогут развертывать модели непосредственно в Workers AI.
🤗 Блог
Cloudflare объявило о начале партнёрства с Hugging Face с целью сделать модели ИИ более доступными для разработчиков.
Что обещают? 👀
-В Hugging Face появятся безсерверные модели GPU без инфраструктурных "костылей" и оплат за неиспользуемые мощности. Просто выберите свою модель и работайте.
-Модели Hugging Face появятся в каталоге моделей Cloudflare
-Интеграционные инструменты Cloudflare станут частью Hugging Face Inference
Разработчики, использующие платформу Cloudflare, вскоре смогут развертывать модели Hugging Face прямо с панели управления Cloudflare, а те, кто использует Hugging Face, смогут развертывать модели непосредственно в Workers AI.
🤗 Блог
🔥28👍6❤3
Как использовать машинное обучение для оптимального размещения климатических датчиков
Ученые из Великобритании разработали умный алгоритм, который может подсказать, где лучше всего разместить датчики для мониторинга климата в Антарктике.
Эта труднодоступная область очень важна для понимания изменений климата, но сеть наблюдений там очень редкая. А установка каждой новой станции обходится дорого.
Чтобы оптимизировать размещение датчиков, ученые использовали метод машинного обучения - convolutional Gaussian neural process.
Модель проанализировала огромные массивы спутниковых данных об Антарктике, чтобы научиться предсказывать температуру в разных точках континента.
Затем алгоритм моделировал, как новые измерения в тех или иных местах уточнят его предсказания. Так он выявлял самые информативные точки для размещения датчиков.
В результате модель значительно превзошла другие методы в выборе оптимальных локаций. Это позволит лучше понимать климатические изменения в Антарктике и экономить на развертывании сенсорной сети (а еще этот подход отлично транслируется на другие типы датчиков и локаций).
Такой подход - первый шаг к созданию "цифровых двойников" природы. Модели на основе ИИ смогут направлять сбор данных об окружающей среде, чтобы максимально точно её отображать.
🗺️ Статья
🥸 Выступление
🌪️ Код
Ученые из Великобритании разработали умный алгоритм, который может подсказать, где лучше всего разместить датчики для мониторинга климата в Антарктике.
Эта труднодоступная область очень важна для понимания изменений климата, но сеть наблюдений там очень редкая. А установка каждой новой станции обходится дорого.
Чтобы оптимизировать размещение датчиков, ученые использовали метод машинного обучения - convolutional Gaussian neural process.
Модель проанализировала огромные массивы спутниковых данных об Антарктике, чтобы научиться предсказывать температуру в разных точках континента.
Затем алгоритм моделировал, как новые измерения в тех или иных местах уточнят его предсказания. Так он выявлял самые информативные точки для размещения датчиков.
В результате модель значительно превзошла другие методы в выборе оптимальных локаций. Это позволит лучше понимать климатические изменения в Антарктике и экономить на развертывании сенсорной сети (а еще этот подход отлично транслируется на другие типы датчиков и локаций).
Такой подход - первый шаг к созданию "цифровых двойников" природы. Модели на основе ИИ смогут направлять сбор данных об окружающей среде, чтобы максимально точно её отображать.
🗺️ Статья
🥸 Выступление
🌪️ Код
🔥21👍11🤯4
Данные с носимых устройств: готовы ли вы принимать решения о своем здоровье на их основе, или для вас это пока недостаточно надежный источник информации?
Whoop во вторник похвастался,
что заколабился с OpenAI, и теперь у нас не просто дэшборд со статистикой, а карманный тренер, с которым можно обсудить, когда запланировать тренировку, почему сегодня нет сил и подскажет, как заземлиться, если тело сигнализирует о стрессе.
Особенно приятно, что за фичу не надо платить дополнительно, бета доступна всем владельцам Whoop, а ещё GPT4 не будет дообучатся на данных пользователей.
Похоже, мы близки к временам, когда все носимое от часов до менструальных кап будет агрегировать информацию о теле для превентивного здравоохранения. Для этого хорошо бы смотреть на биоданные под разными углами.
И тут интересно выглядит уже Garmin, который поддержал исследование научной группы QIMP (почему они крутые - отдельно) из Университета Вены, чтобы получить мультимодальные данные: стандартные биосигналы с часов и невероятно подробные данные о метаболизме по whole body PET сканам.
Кстати, если вы недалеко от Вены, можете успеть поучаствовать. Для тревожных - доза радиации эквивалентна полету из Калифорнии в Лондон и обратно, а медицинская картинка выглядит космически (второе видео), плюс €75 компенсация за смелость.
Честно говоря, я больше доверяю, если данные мультимодальные, и интерпретируют их учёные и врачи, ну, или делают peer-review и верифицируют контент, как, например, у Flo.
А как у вас? Кому какой подоход кажется полезнее?
Whoop во вторник похвастался,
что заколабился с OpenAI, и теперь у нас не просто дэшборд со статистикой, а карманный тренер, с которым можно обсудить, когда запланировать тренировку, почему сегодня нет сил и подскажет, как заземлиться, если тело сигнализирует о стрессе.
Особенно приятно, что за фичу не надо платить дополнительно, бета доступна всем владельцам Whoop, а ещё GPT4 не будет дообучатся на данных пользователей.
Похоже, мы близки к временам, когда все носимое от часов до менструальных кап будет агрегировать информацию о теле для превентивного здравоохранения. Для этого хорошо бы смотреть на биоданные под разными углами.
И тут интересно выглядит уже Garmin, который поддержал исследование научной группы QIMP (почему они крутые - отдельно) из Университета Вены, чтобы получить мультимодальные данные: стандартные биосигналы с часов и невероятно подробные данные о метаболизме по whole body PET сканам.
Кстати, если вы недалеко от Вены, можете успеть поучаствовать. Для тревожных - доза радиации эквивалентна полету из Калифорнии в Лондон и обратно, а медицинская картинка выглядит космически (второе видео), плюс €75 компенсация за смелость.
Честно говоря, я больше доверяю, если данные мультимодальные, и интерпретируют их учёные и врачи, ну, или делают peer-review и верифицируют контент, как, например, у Flo.
А как у вас? Кому какой подоход кажется полезнее?
🔥9👍4❤3🤯1🤩1
Yandex ML Prize
Яндекс объявил о старте приема заявок на ежегодную премию в области машинного обучения – Yandex ML Prize.
Премия присуждается ученым и преподавателям из 11 стран за вклад в развитие таких направлений как компьютерное зрение, обработка естественного языка, поиск информации и др.
В премии открыто 5 номинаций:
- Для молодых исследователей (студентов)
- Для научных руководителей
- Для преподавателей в сфере ML
- За лучшую первую научную публикацию
- Для сотрудников Яндекса
Лауреаты получат денежные премии от 500 000 рублей до миллиона, а также доступ к сервисам Яндекса для научной работы.
Подать заявку можно до 16 октября. Победители будут объявлены в декабре.
Это хорошая возможность для исследователей, их наставников и преподавателей получить признание и поддержку для дальнейших исследований в области ML.
#премии_и_гранты
Яндекс объявил о старте приема заявок на ежегодную премию в области машинного обучения – Yandex ML Prize.
Премия присуждается ученым и преподавателям из 11 стран за вклад в развитие таких направлений как компьютерное зрение, обработка естественного языка, поиск информации и др.
В премии открыто 5 номинаций:
- Для молодых исследователей (студентов)
- Для научных руководителей
- Для преподавателей в сфере ML
- За лучшую первую научную публикацию
- Для сотрудников Яндекса
Лауреаты получат денежные премии от 500 000 рублей до миллиона, а также доступ к сервисам Яндекса для научной работы.
Подать заявку можно до 16 октября. Победители будут объявлены в декабре.
Это хорошая возможность для исследователей, их наставников и преподавателей получить признание и поддержку для дальнейших исследований в области ML.
#премии_и_гранты
👍20😁8🔥4🎉3❤1🤯1😢1
Сгенерированные стикеры в Messenger
Недавно компания Meta представила новую фишку с использованием AI в своих приложениях - сгенерированные стикеры. Теперь пользователи могут создавать на лету персонализированные стикеры, просто вводя текст (работает реально почти мгновенно).
Эта технология использует модель генерации изображений Emu и алгоритм Llama 2 для генерации уникальных высококачественных стикеров на основе текстовых подсказок. Пользователю достаточно ввести текст, и за считанные секунды (даже меньше) будет сгенерировано несколько стикеров на заданную тему.
Новая функция уже доступна для части пользователей на английском языке в приложениях WhatsApp, Messenger, Instagram и Facebook Stories. Она дает практически безграничные возможности для самовыражения и общения в мессенджерах.
Получается очень мило и интересно! В соцсетях уже пишут разгромные статьи по поводу отсутствия цензуры, но я думаю что за пару дней все поправят
Недавно компания Meta представила новую фишку с использованием AI в своих приложениях - сгенерированные стикеры. Теперь пользователи могут создавать на лету персонализированные стикеры, просто вводя текст (работает реально почти мгновенно).
Эта технология использует модель генерации изображений Emu и алгоритм Llama 2 для генерации уникальных высококачественных стикеров на основе текстовых подсказок. Пользователю достаточно ввести текст, и за считанные секунды (даже меньше) будет сгенерировано несколько стикеров на заданную тему.
Новая функция уже доступна для части пользователей на английском языке в приложениях WhatsApp, Messenger, Instagram и Facebook Stories. Она дает практически безграничные возможности для самовыражения и общения в мессенджерах.
Получается очень мило и интересно! В соцсетях уже пишут разгромные статьи по поводу отсутствия цензуры, но я думаю что за пару дней все поправят
🔥18👍7❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Ученые научили компьютер понимать нашу речь без имплантов в мозг
Представьте, что вы надели шлем, который записывает активность вашего мозга, пока вы слушаете чью-то речь. Оказывается, по этим данным можно понять, что именно вы слышите, и расшифровать сказанные слова и фразы!
Такой метод разработали исследователи из компании Meta. Их нейросеть проанализировала записи мозговой активности добровольцев и научилась угадывать, какие отрывки речи они слушали. Причем это возможно даже для незнакомых фраз, которых не было в обучающих данных! Самое крутое что и датасет и код выложены в открытый доступ.
Это открытие важно, потому что раньше расшифровать речь по мозговым сигналам получалось только с помощью имплантов непосредственно в мозг. А неинвазивные методы вроде ЭЭГ-шлемов давали очень приблизительный результат.
Новый подход сделает технологии распознавания речи по активности мозга безопаснее и доступнее для пациентов. А в Метаверсе он поможет устройствам точнее понимать команды и желания пользователей, "читая" сигналы их мозга. Так что скоро с умными очками или шлемами виртуальной реальности мы сможем общаться, просто "думая вслух"!
📎 Статья
🧠 Код
Представьте, что вы надели шлем, который записывает активность вашего мозга, пока вы слушаете чью-то речь. Оказывается, по этим данным можно понять, что именно вы слышите, и расшифровать сказанные слова и фразы!
Такой метод разработали исследователи из компании Meta. Их нейросеть проанализировала записи мозговой активности добровольцев и научилась угадывать, какие отрывки речи они слушали. Причем это возможно даже для незнакомых фраз, которых не было в обучающих данных! Самое крутое что и датасет и код выложены в открытый доступ.
Это открытие важно, потому что раньше расшифровать речь по мозговым сигналам получалось только с помощью имплантов непосредственно в мозг. А неинвазивные методы вроде ЭЭГ-шлемов давали очень приблизительный результат.
Новый подход сделает технологии распознавания речи по активности мозга безопаснее и доступнее для пациентов. А в Метаверсе он поможет устройствам точнее понимать команды и желания пользователей, "читая" сигналы их мозга. Так что скоро с умными очками или шлемами виртуальной реальности мы сможем общаться, просто "думая вслух"!
📎 Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32😢9👍6❤5🎉1
Как в Microsoft видят будущее AI: итоги встречи с их Chief Scientist
Немножко гонзо журналистики Вам в ленту. Только что вышел с доклада Джейми Тиван, Chief Scientist в Microsoft, отвечающей за исследования в области AI. Вот основные тезисы из того что она рассказала:
- Microsoft в целом считает себя "документной компанией" и стремится облегчить людям работу с документами. В частности, они проанализировали огромное количество диалогов сотрудников компаний в период пандемии (которые стали общаться больше из-за удаленки), чтобы понять реальные потребности пользователей.
- По мнению Джейми, хотя модели вроде GPT пока не могут полноценно заменить человека, они отлично справляются с генерацией идей и взглядов с новых ракурсов. Джейми видит потенциал ИИ в автоматизации рутинных задач, чтобы люди могли заниматься более ценной деятельностью.
- Также было отмечено, что в отличие от физических систем вроде автопилотов, развитие ИИ в сфере программного обеспечения для совместной работы практически ничем не ограничено. По мнению Джейми, ИИ - это инструмент повышения производительности, а не угроза замены людей.
- Кроме того, ИИ активно применяется в медицинской сфере, которая составляет 18% ВВП США - например, для автоматизированного анализа снимков или ведения историй болезни. Джейми убеждена в неизбежности и пользе масштабирования возможностей ИИ.
- Microsoft также активно работает над ответственным управлением данными в ИИ - они хотят применить свой успешный опыт облаков в этой сфере (а в облака они реально умеют, у них хостятся правительства стран и даже армия).
В целом, встреча еще раз убедила меня в серьезности намерений Microsoft внедрять ИИ в самых разных областях для повышения эффективности и создания новой потребительской ценности.
Немножко гонзо журналистики Вам в ленту. Только что вышел с доклада Джейми Тиван, Chief Scientist в Microsoft, отвечающей за исследования в области AI. Вот основные тезисы из того что она рассказала:
- Microsoft в целом считает себя "документной компанией" и стремится облегчить людям работу с документами. В частности, они проанализировали огромное количество диалогов сотрудников компаний в период пандемии (которые стали общаться больше из-за удаленки), чтобы понять реальные потребности пользователей.
- По мнению Джейми, хотя модели вроде GPT пока не могут полноценно заменить человека, они отлично справляются с генерацией идей и взглядов с новых ракурсов. Джейми видит потенциал ИИ в автоматизации рутинных задач, чтобы люди могли заниматься более ценной деятельностью.
- Также было отмечено, что в отличие от физических систем вроде автопилотов, развитие ИИ в сфере программного обеспечения для совместной работы практически ничем не ограничено. По мнению Джейми, ИИ - это инструмент повышения производительности, а не угроза замены людей.
- Кроме того, ИИ активно применяется в медицинской сфере, которая составляет 18% ВВП США - например, для автоматизированного анализа снимков или ведения историй болезни. Джейми убеждена в неизбежности и пользе масштабирования возможностей ИИ.
- Microsoft также активно работает над ответственным управлением данными в ИИ - они хотят применить свой успешный опыт облаков в этой сфере (а в облака они реально умеют, у них хостятся правительства стран и даже армия).
В целом, встреча еще раз убедила меня в серьезности намерений Microsoft внедрять ИИ в самых разных областях для повышения эффективности и создания новой потребительской ценности.
👍27❤5😁4🔥3🤯1
OpenAI рассматривает возможность производства собственных чипов для ИИ
Генеральный директор Сэм Альтман сделал приобретение необходимого количества чипов ИИ главным приоритетом для развития компании. Он уже публично сетовал на нехватку графических процессоров, на рынке которых доминирует Nvidia.
Использование ChatGPT обходится компании очень дорого. Согласно анализу аналитика Bernstein Стейси Расгон, каждый запрос стоит примерно 4 цента. Если запросы ChatGPT вырастут в десятую часть масштаба поиска Google, для поддержания работоспособности потребуется изначально графических процессоров примерно на 48,1 миллиарда долларов и чипов на сумму около 16 миллиардов долларов в год 💸
Пока неясно, будет ли OpenAI реализовывать план по созданию собственного чипа или купит технологии на рынке, как это произошло с Amazon.com и приобретением Annapurna Labs в 2015 году 👀
🌐 Статья
Генеральный директор Сэм Альтман сделал приобретение необходимого количества чипов ИИ главным приоритетом для развития компании. Он уже публично сетовал на нехватку графических процессоров, на рынке которых доминирует Nvidia.
Использование ChatGPT обходится компании очень дорого. Согласно анализу аналитика Bernstein Стейси Расгон, каждый запрос стоит примерно 4 цента. Если запросы ChatGPT вырастут в десятую часть масштаба поиска Google, для поддержания работоспособности потребуется изначально графических процессоров примерно на 48,1 миллиарда долларов и чипов на сумму около 16 миллиардов долларов в год 💸
Пока неясно, будет ли OpenAI реализовывать план по созданию собственного чипа или купит технологии на рынке, как это произошло с Amazon.com и приобретением Annapurna Labs в 2015 году 👀
🌐 Статья
🔥18🤯11👍5😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Одна из лучших визуализаций работы нейросетей для генерации текста
Наткнулся на классную статью из Financial Times, которая наглядно и доступно объясняет принцип работы нейросетей, генерирующих текст и изображения (трансформеры).
Это, пожалуй, одна из лучших визуализаций, которые я видел на эту тему. С помощью инфографики и примеров статья доходчиво объясняет ключевые концепции: как нейросеть кодирует слова, использует внимание для улавливания контекста, генерирует текст.
Всё изложено максимально просто и наглядно. Теперь даже новичок сможет за 5 минут понять, как устроены трансформеры, большие языковые модели и прочие нейросети нового поколения.
Конечно, визуализация не заменит глубокого погружения в тему. Но эта интерактивная статья - отличная стартовая точка, чтобы получить базовое представление об устройстве нейронных сетей для обработки естественного языка. Рекомендую к прочтению!
Ссылка
Наткнулся на классную статью из Financial Times, которая наглядно и доступно объясняет принцип работы нейросетей, генерирующих текст и изображения (трансформеры).
Это, пожалуй, одна из лучших визуализаций, которые я видел на эту тему. С помощью инфографики и примеров статья доходчиво объясняет ключевые концепции: как нейросеть кодирует слова, использует внимание для улавливания контекста, генерирует текст.
Всё изложено максимально просто и наглядно. Теперь даже новичок сможет за 5 минут понять, как устроены трансформеры, большие языковые модели и прочие нейросети нового поколения.
Конечно, визуализация не заменит глубокого погружения в тему. Но эта интерактивная статья - отличная стартовая точка, чтобы получить базовое представление об устройстве нейронных сетей для обработки естественного языка. Рекомендую к прочтению!
Ссылка
🔥41👍11❤2🤯2
Forwarded from Psychedelic Consciousness ( ex Unstoppable Technologies)
Unlearning in AI and EMDR: Conceptual Parallels and Distinctions
The technique described by Microsoft researchers to make AI "forget" copyrighted material, conceptually intriguing. The method bears a resemblance to the therapeutic approach of EMDR, a recognized treatment for trauma.
Conceptual Similarities:
Targeted Erasure: Just as the researchers aim to erase specific knowledge (e.g., Harry Potter content) from the AI model, EMDR targets specific traumatic memories in patients, aiming to desensitize their emotional charge.
Fine-tuning: The AI technique involves fine-tuning the model to effectively erase specific content. Similarly, EMDR involves a structured eight-phase approach, where the therapist fine-tunes the process based on the patient's responses.
Adaptability: The AI's ability to adapt and "unlearn" mirrors the brain's plasticity, where neural pathways can be restructured, especially when traumatic memories are reprocessed in EMDR.
Differences:
Mechanism: While the AI technique employs a three-part method involving training on target data, replacing unique expressions, and fine-tuning on alternative predictions, EMDR uses bilateral stimulation (often in the form of guided eye movements) to help patients process traumatic memories.
Objective: The primary goal for AI is to ensure copyright compliance and adaptability. In contrast, EMDR aims to alleviate distress from traumatic memories and promote psychological healing.
Complexity: Human emotions and memories are multifaceted, with deep-rooted connections to various life experiences. AI models, although complex, operate on data and algorithms without the emotional depth inherent in human cognition.
In conclusion, while the conceptual framework of "unlearning" or "forgetting" is present in both the AI technique and EMDR, the underlying mechanisms, objectives, and complexities differ. It's fascinating to observe how principles of neuroscience and psychology can find echoes in the realm of artificial intelligence.
https://venturebeat.com/ai/researchers-turn-to-harry-potter-to-make-ai-forget-about-copyright-material/
The technique described by Microsoft researchers to make AI "forget" copyrighted material, conceptually intriguing. The method bears a resemblance to the therapeutic approach of EMDR, a recognized treatment for trauma.
Conceptual Similarities:
Targeted Erasure: Just as the researchers aim to erase specific knowledge (e.g., Harry Potter content) from the AI model, EMDR targets specific traumatic memories in patients, aiming to desensitize their emotional charge.
Fine-tuning: The AI technique involves fine-tuning the model to effectively erase specific content. Similarly, EMDR involves a structured eight-phase approach, where the therapist fine-tunes the process based on the patient's responses.
Adaptability: The AI's ability to adapt and "unlearn" mirrors the brain's plasticity, where neural pathways can be restructured, especially when traumatic memories are reprocessed in EMDR.
Differences:
Mechanism: While the AI technique employs a three-part method involving training on target data, replacing unique expressions, and fine-tuning on alternative predictions, EMDR uses bilateral stimulation (often in the form of guided eye movements) to help patients process traumatic memories.
Objective: The primary goal for AI is to ensure copyright compliance and adaptability. In contrast, EMDR aims to alleviate distress from traumatic memories and promote psychological healing.
Complexity: Human emotions and memories are multifaceted, with deep-rooted connections to various life experiences. AI models, although complex, operate on data and algorithms without the emotional depth inherent in human cognition.
In conclusion, while the conceptual framework of "unlearning" or "forgetting" is present in both the AI technique and EMDR, the underlying mechanisms, objectives, and complexities differ. It's fascinating to observe how principles of neuroscience and psychology can find echoes in the realm of artificial intelligence.
https://venturebeat.com/ai/researchers-turn-to-harry-potter-to-make-ai-forget-about-copyright-material/
VentureBeat
Researchers turn to Harry Potter to make AI forget about copyrighted material
Their unlearning technique may also be more effective for fictional texts than non-fiction, since fictional worlds contain more unique...
❤4👍4🔥2
Как "стереть" из ИИ знания о Гарри Поттере
Для тех кто ничего не понял в предыдущем посте.
Исследователи из Microsoft предложили способ "стирать" конкретную информацию из обученных языковых моделей, не переобучая их заново.
Они протестировали свой метод на модели Llama 2-7B от Meta, "стерев" из неё все знания о книгах и персонажах Гарри Поттера. Для этого потребовалось всего около 1 часа дополнительной тренировки модели.
Авторы разработали трёхэтапную технику:
1. Обучили вспомогательную модель выделять токены, связанные с Гарри Поттером.
2. Заменили уникальные выражения обобщёнными, имитируя модель без этих знаний.
3. Дотренировали основную модель на этих заменённых данных.
В итоге модель разучилась обсуждать детали сюжета и персонажей Гарри Поттера, но сохранила общие способности.
Это важный шаг к созданию гибких языковых моделей, которые можно адаптировать под меняющиеся требования. В будущем такие методы помогут делать ИИ более ответственным и соответствующим законам об авторских правах.
Ссылка
Для тех кто ничего не понял в предыдущем посте.
Исследователи из Microsoft предложили способ "стирать" конкретную информацию из обученных языковых моделей, не переобучая их заново.
Они протестировали свой метод на модели Llama 2-7B от Meta, "стерев" из неё все знания о книгах и персонажах Гарри Поттера. Для этого потребовалось всего около 1 часа дополнительной тренировки модели.
Авторы разработали трёхэтапную технику:
1. Обучили вспомогательную модель выделять токены, связанные с Гарри Поттером.
2. Заменили уникальные выражения обобщёнными, имитируя модель без этих знаний.
3. Дотренировали основную модель на этих заменённых данных.
В итоге модель разучилась обсуждать детали сюжета и персонажей Гарри Поттера, но сохранила общие способности.
Это важный шаг к созданию гибких языковых моделей, которые можно адаптировать под меняющиеся требования. В будущем такие методы помогут делать ИИ более ответственным и соответствующим законам об авторских правах.
Ссылка
👍49😢15❤6😁5🔥3🤯1