Технозаметки Малышева
8.27K subscribers
3.72K photos
1.4K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
AI в проектировании: нужно больше, чем просто подражание

- Инженеры из Массачусетского технологического института считают, что AI-модели генерации содержимого имеют ограничения в инженерии.
- Такие модели хорошо воспроизводят уже существующие образцы, но в инновационном дизайне это недостаточно.
- Ведь инновации в инженерии часто требуют нечто большее, чем простое копирование старых образцов.
- Исследователи продемонстрировали, что при решении задач инженерного проектирования AI-модели, созданные с учетом требований инженерии, а не только статистической схожести, производят более инновационные решения, которые выводят проектирование на новый уровень.

Это изменит подход к взаимодействию с AI в инженерии: для истинной инновации требуется больше целеполагания, чем просто повторение существующего.

#МассачусетскийТехнологическийИнститут #AI #Инженерия
Замкнутый круг ИИ: Модели сталкиваются с проблемой "самопожирания".

- ИИ, обучающиеся на данных из интернета, начинают повторять их ошибки.
- Изученное ИИ становится источником данных для дальнейшего обучения, вызывая эффект внутреннего эха.
- Такая рекурсивная петля обучения может усугублять проблемы, вроде гендерных и расовых предубеждений.
- Исследования показали, что после нескольких циклов обучения на сгенерированном ИИ контенте, результаты становятся размытыми и неузнаваемыми.
- Для того чтобы эффективно обучать новые модели ИИ, требуются данные, не искажённые информацией, созданной ИИ.

С другой стороны, модели ИИ всё ещё требуется помощь человека для фильтрации и отбора данных.

#ИИ #Машинное_обучение #ChatGPT
Google представит новую модель AI - Gemini

- Новая AI-модель от Google, Gemini, скоро будет доступна на Makersuite.
- Gemini опережает своего предшественника, PaLM 2, по функциональности, поддерживая многоцелевую обработку данных.
- Gemini будет поддерживать ввод изображений, что делает его отличным выбором для тех, кто ранее искал такие возможности через неофициальные API.
- Кроме Gemini, на Makersuite будет запущена новая функция под названием Stubbs, позволяющая пользователям создавать и запускать собственные приложения, сгенерированные AI.

- Функция перевода между языками также будет полностью поддерживаться на Makersuite.
- Грядущие обновления дадут огромный толчок для индустрии приложений и сделают создание прототипов приложений более удобным и мгновенным.

#Google #Gemini #Makersuite
Forwarded from Банкста
Китай все больше опережает США по числу ИИ патентов, что свидетельствует о решимости азиатской страны формировать и влиять на технологию, которая будет критически важна для самых крупных экономик мира. @banksta
Добавил к боту функцию параллельного поиска.
Получилось что 3.5 модель стала давать такой же результат как GPT4, что подтверждает мою гипотезу, что GPT4 - это не новая модель как таковая, а GPT3.5 обвешанная скриптами и файнтюнингами.
Бот тут: https://xn--r1a.website/Cloud_GPT_bot
Новая международная структура образована для экспертов в AI и машинном обучении.

- AI Speakers Agency создана в ответ на растущий спрос на экспертов в области ИИ и машинного обучения.
- Бизнес-структура была создана руководителем Champions (UK) Plc, Jack Hayes.
- AI Speakers Agency объединяет ведущих международных спикеров, специализирующихся на искусственном интеллекте.
- Они предлагают необходимые знания для лучшей подготовки к будущему, где ИИ становится всеобъемлющим.
- Учреждение предоставляет экспертов по ИИ для как виртуальных, так и очных мероприятий.

Уже сейчас искусственный интеллект внедряется в 15% из всех бизнесов.
Появление такого агентства подчеркивает важность адаптации и познания ИИ.


#AI #ChampionsUKPlc #ArtificialIntelligence
Использование open source для создания ИИ-проектов

- Использование open source для создания ИИ-проектов становится все популярнее по мере того как фреймворки и библиотеки открытого исходного кода становятся доступнее.
- Open source обеспечивает уровень прозрачности и инноваций, которые могут существенно улучшить процесс разработки для комьюнити и снизить стоимость создания ИИ-моделей для программистов.
- Среди популярных инструментов open source для ИИ можно выделить TensorFlow, PyTorch, Keras, Apache MXNet и многие другие.
- Некоторые из них поддерживают широкий спектр функций и встроенных моделей, что упрощает задачи глубокого обучения и обработки естественного языка.
- Большинство "звездочек" на GitHub среди ИИ-проектов open source у архитектуры нейронных сетей GPT.

Вместо дополнительных затрат на разработку собственных ИИ-моделей и инструментов, программисты могут внедрять уже готовые решения от open source сообщества.


#OpenSource #AI #Github
s42256-023-00735-0.pdf
1.9 MB
AI поможет учёным отслеживать прогресс в искусственном интеллекте

- Международная команда ученых под руководством Марио Кренна из Института световых наук Макса Планка создала алгоритм AI, который помогает исследователям ориентироваться в научных публикациях по искусственному интеллекту и прогнозировать направления развития.
- Для этого был разработан инструмент Science4Cast, который позволяет задавать вопросы о будущем искусственного интеллекта.
- Science4Cast представляет собой графовое представление знаний, которое усложняется с выходом новых научных статей.
- Так, с помощью более 100 тысяч научных публикаций за 30 лет было создано 64 тысячи узлов.
- Дальнейшее развитие Science4Cast позволит научным работникам получать рекомендации от AI по будущим научным проектам.

Это открывает новые возможности для ускорения научного прогресса всего с помощью AI.

#AI #Science4Cast #MaxPlanckInstitute
Forwarded from Сиолошная
Пока государства спят, OpenAI, Anthropic, Google и Microsoft анонсируют Frontier Model Forum. На самом деле про него писали ещё в июле, однако сегодня появился апдейт.

Во-первых, назначили исполнительного директора — Chris Meserole. Интересных фактов сходу про него не нагуглилось, приходите в комментарии рассказать, если у вас есть информация. Вот что про него говорят коллеги из вышеуказанных компаний.

Во-вторых, выделяется более $10M в новый Фонд безопасности ИИ. Основное внимание Фонда будет уделяться поддержке разработки новых способов оценки моделей.

В-третьих, опубликовали 5-ти страничный документ, который описывает, что такое Red Teaming, и на примерах показывается, что делают компании с текущими моделями перед релизом. Например, OpenAI наняли 41 человека для того, чтобы потестировать ранние версии GPT-4 перед релизом. Кажется, что это мало, но покажите кто вообще об этом думал до релиза ChatGPT?

В-четвертых, полным ходом идёт разработка нового процесса раскрытия информации, с помощью которого передовые лаборатории смогут обмениваться информацией, связанной с обнаружением уязвимостей или потенциально опасных возможностей в передовых моделях.

Полная новость: https://openai.com/blog/frontier-model-forum-updates
1
Оптическая нейронная сеть с тысячами искусственных нейронов

- Группа исследователей создала событийно-ориентированную архитектуру, использующую фотонные процессоры для передачи и обработки данных светом.
- Сеть состоит из почти 8400 оптических нейронов из материала с изменением фазы, с волноводом, их соединяющим.
- У этой сети обнаружен потенциал для быстрой и энергоэффективной обработки данных AI приложений.
- Синапсы не являются аппаратными элементами, но кодируются свойствами оптических импульсов, позволяя интегрировать тысячи нейронов на одном чипе.
- Исследователи проверили производительность нейронной сети обучив ее отличать немецкие и английские тексты.

Это поможет более быстро и энергоэффективно обрабатывать данные для AI.
Forwarded from 42 секунды
Reuters: США ускорили внедрение новых ограничений экспорта чипов для ИИ

– Новые экспортные ограничения заработали на этой неделе
– Это почти на месяц раньше, чем планировали изначально
– США расширили ограничения для Китая, России, Ирана и др.
– Они запрещают экспорт модифицированных чипов для ИИ
– Речь, например, про передовые чипы Nvidia A800 и H800
– Компания создавала их специально для китайского рынка
– Также ограничения влияют на чипы Nvidia A100, H100 и L40S
– Но Nvidia не ожидает краткосрочного влияния на прибыль

@ftsec
Forwarded from Сиолошная
Не секрет, что для RLHF (Reinforcement Learning from Human Feedback) — последнего этапа тренировки систем типа ChatGPT — необходимы специализированные методы. Один из них — PPO (Proximal Policy Optimization), придуманный в стенах OpenAI в далёком 2017м году. В целом, логично: сами придумали метод, сами нарастили экспертизу через десятки экспериментов, и потом применяют тут и там.

Одним из основных отличий PPO от других методов тех времён заявлялась простота имплементации и низкое количество гиперпараметров, которые необходимо перебирать. На бумаге звучит здорово, но, к сожалению, на практике не всё так радужно.

Ещё в прошлом году я наткнулся на блогпост «The 37 Implementation Details of Proximal Policy Optimization» (подготовлен к конференции ICLR). По названию, думаю, уже можно прочувствовать всю боль «much simpler to implement» метода 🤣. Сбор всех частичек и воспроизведение результатов заняли у авторов ТРИ ГОДА. Какие-то вещи менялись прямо в коде репозитория OpenAI между разными версиями (с разницей в качестве в ДВА РАЗА), что-то не объяснялось в статье и никем не упоминалось, а некоторые вещи выглядели багами, но почему-то давали результат. У этой статьи есть видео-саммари в трёх частях, вот ссылка на плейлист. В общем, если вы хотите глубже разобраться, да или просто прокачаться — очень рекомендую к разбору.

На этом дело не закончилось, и те же авторы решили посмотреть репозиторий openai/lm-human-preferences 2019го года. Это код для статьи «Fine-Tuning Language Models from Human Preferences» с легендарными Paul Christiano и Alec Radford в соавторах. Здесь как раз впервые применяется PPO для оптимизации LLM под человеческие предпочтения. Ранние наработки по ChatGPT, говоря иначе.

Работа заняла уже меньше 3 лет, и вот буквально вчера появился блог «The N Implementation Details of RLHF with PPO», который практически в точности воспроизводит результаты работы OpenAI, но на PyTorch и с современными библиотеками, а не на устаревшем TensorFlow. Это, кстати, было одной из больших заноз. Например, оптимизатор Adam имплементирован в этих фреймворках по-разному, и из коробки просто не получалось повторить тренировку.

Но моя любимая история тут — это проблема с запуском на конкретном сетапе видеокарт (чтобы получить оригинальные метрики и кривые обучения и понимать, с чем сравнивать). Следите за руками:
1) на 1xV100 не хватает памяти, так как аккумулирования градиентов не было
2) на A100 запустить невозможно — старый TF не поддерживает новые видеокарты
3) на 8xV100 16GB тоже не хватает памяти
4) так что работает всё строго на 8xV100 32GB. Такая вот магия!

А ещё один из датасетов OpenAI потеряли при переезде с одного хранилища на другое 😱
В общем, чтиво получается максимально интересное и увлекательное, позволяющее лучше разобраться во всех тонкостях, причём даже если RLHF вам не интересен.

————————————————————————
Эх, а вот редставьте сколько бы всего интересного можно было найти в репозитории для тренировки и инференса LLM уровня GPT-4 🍿🚬...
Please open Telegram to view this post
VIEW IN TELEGRAM
Если будет 7 часов свободных (на выходных например ) - рекомендую посмотреть плейлист AWS - Generative AI Foundation.
Очень полезный обзор практически всех аспектов.

https://www.youtube.com/playlist?list=PLhr1KZpdzukf-xb0lmiU3G89GJXaDbAIF
Forwarded from Salute AI
⚡️ GigaChat API открыт для всех разработчиков — оцените как LLM впишется в ваши продукты без дополнительных затрат.

📌
⁃ Бесплатный доступ к LLM для экспериментов
⁃ 1 млн токенов в месяц (~3.5 млн символов)
⁃ Для некоммерческого использования
⁃ Можно заключить договор для коммерческого использования без ограничений

Для получения доступа достаточно перейти по ссылке и войти через Сбер ID, заранее отключив VPN.

P.S. Подпишитесь на канал 💬 Salute AI, чтобы быть в курсе важных новостей от SberDevices.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
Boston Dynamics: Making Chat (ro)Bots
https://www.youtube.com/watch?v=djzOBZUFzTw

В этом видео Мэтт и Вэчер знакомятся с роботом по имени Спот, который служит им гидом.
Они посещают различные станции и обсуждают применение GPT и других технологий AI в робототехнике.
Мэтт особенно подчеркивает, как данная система позволяет роботу мыслить креативно.
Спот демонстрирует свои возможности в различных индустриях, включая проведение экскурсий и выполнение хирургических операций.
Мэтт и Вэчер обсуждают будущее проекта и ожидают улучшения способностей роботов к пониманию действий, которые они могут предпринять в рамках окружающего мира.
Они считают, что это может быть применимо далеко за пределами потребностей текущих клиентов.

#AI #robotics #BostonDynamics
Oracle добавляет в свою инфраструктуру AI-технологии Nvidia

- Oracle привносит в свою инфраструктуру такие AI-средства Nvidia, как DGX Cloud AI и AI Enterprise.
- Клиенты Oracle теперь могут обрабатывать свои данные на передовых графических процессорах Nvidia.
- Это позволит компаниям легче интегрировать AI в свои продукты и быстрее выводить их на рынок.

Теперь создание и развертывание AI-приложений станет проще и быстрее благодаря передовым технологиям Nvidia, интегрированным в облачную инфраструктуру Oracle.

#Oracle #Nvidia #AI
1
Книга Open Source AI '2023

- обзор Open Source AI за 2023 год, который покрывает все ключевые категории, от оценки моделей до их внедрения.
- Информационный гид адресован специалистам, знакомым с базовыми принципами MLOps, которые хотят быстро посмотреть последние новинки в области open source AI за последний год.
- Обзор затрагивает не только модели, но и изменения в инфраструктуре, "подводные камни" лицензий и новые виды применения.

Теперь специалисты смогут чётко понимать современные тенденции в мире Open Source AI и быть в курсе последних инноваций.

#OpenSource #AI #обзор
Нейросеть начинает обучаться языку, подобно человеку

- Ученые создали нейросеть, способную делать обобщения о языке, подобно человеку.
- Нейросеть показывает результаты, сравнимые с человеческими, в применении новых слов в существующем словаре и использовании их в новых контекстах.
Это ключевой аспект человеческого познания, известный как систематическая генерализация.
- Предыдущие модели, такие как ChatGPT основаны на больших языковых моделях и умеют вести беседу в разных контекстах, но являются несистематичными и демонстрируют пробелы и неточности.

Теперь AI сможет научиться общению на любом языке, как человек, что облегчит взаимодействие между людьми и машинами.

#AI #Нейросеть #Язык
🎉1
Jetson - платформа NVIDIA для роботов и AI

- NVIDIA анонсировала обновления для своей платформы Jetson - аналог Arduino или Raspberri Pi на максималках. Встроенный Tensor & Generative AI

- Jetson уже используется в различных отраслях, например, в производстве, транспорте и здравоохранении.

- В рамках обновления NVIDIA представляет "лабораторию Gen AI Jetson", для ускорения разработки AI-приложений.

#NVIDIA #Jetson #AI

https://www.jetson-ai-lab.com/index.html
Руководство по дообучению Llama 2 с помощью LoRA

- Llama 2 - расширенная языковая модель от Meta, обладающая до 70 миллиардами параметров и увеличенной длиной контекста.
- Модель использует групповое внимание к запросу (GQA) для увеличения масштабируемости вывода.
- Llama 2 может быть дообучена с использованием LoRA для выполнения задач ответа на вопросы.
- LoRA сократила количество обучаемых параметров до 10 тысяч раз, что привело к улучшению производительности.
- Благодаря дообучению, Llama 2 может быть использована для создания чат-ботов, виртуальных ассистентов и других приложений, требующих понимания и генерации языка.

#Llama2 #LoRA #FineTuning
DeepSeek AI представляет 3D-моделирование с DreamCraft3D

- DeepSeek AI открыл доступ к официальной реализации DreamCraft3D - мощного метода генерации иерархического 3D-контента.

- Этот подход обеспечивает генерацию высококачественных и последовательных 3D-объектов, используя 2D-изображения в качестве отправной точки.
- Основной упор сделан на решение проблемы последовательности, с которой сталкиваются существующие методы.

- С помощью системы дистилляции оценок по модели диффузии, зависящей от обзора, обеспечивается создание геометрий, которые отображаются взаимосвязано.
- Используется Bootstrapped Score Distillation для улучшения текстур.
- Результат: последовательные 3D-объекты с фотореалистичными изображениями.

Появился новый инструмент для создания более реалистичных 3D-объектов.
https://youtu.be/0FazXENkQms


#DeepSeekAI #DreamCraft3D #3Dгенерация