Технозаметки Малышева
8.27K subscribers
3.72K photos
1.4K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Сиолошная
Не секрет, что для RLHF (Reinforcement Learning from Human Feedback) — последнего этапа тренировки систем типа ChatGPT — необходимы специализированные методы. Один из них — PPO (Proximal Policy Optimization), придуманный в стенах OpenAI в далёком 2017м году. В целом, логично: сами придумали метод, сами нарастили экспертизу через десятки экспериментов, и потом применяют тут и там.

Одним из основных отличий PPO от других методов тех времён заявлялась простота имплементации и низкое количество гиперпараметров, которые необходимо перебирать. На бумаге звучит здорово, но, к сожалению, на практике не всё так радужно.

Ещё в прошлом году я наткнулся на блогпост «The 37 Implementation Details of Proximal Policy Optimization» (подготовлен к конференции ICLR). По названию, думаю, уже можно прочувствовать всю боль «much simpler to implement» метода 🤣. Сбор всех частичек и воспроизведение результатов заняли у авторов ТРИ ГОДА. Какие-то вещи менялись прямо в коде репозитория OpenAI между разными версиями (с разницей в качестве в ДВА РАЗА), что-то не объяснялось в статье и никем не упоминалось, а некоторые вещи выглядели багами, но почему-то давали результат. У этой статьи есть видео-саммари в трёх частях, вот ссылка на плейлист. В общем, если вы хотите глубже разобраться, да или просто прокачаться — очень рекомендую к разбору.

На этом дело не закончилось, и те же авторы решили посмотреть репозиторий openai/lm-human-preferences 2019го года. Это код для статьи «Fine-Tuning Language Models from Human Preferences» с легендарными Paul Christiano и Alec Radford в соавторах. Здесь как раз впервые применяется PPO для оптимизации LLM под человеческие предпочтения. Ранние наработки по ChatGPT, говоря иначе.

Работа заняла уже меньше 3 лет, и вот буквально вчера появился блог «The N Implementation Details of RLHF with PPO», который практически в точности воспроизводит результаты работы OpenAI, но на PyTorch и с современными библиотеками, а не на устаревшем TensorFlow. Это, кстати, было одной из больших заноз. Например, оптимизатор Adam имплементирован в этих фреймворках по-разному, и из коробки просто не получалось повторить тренировку.

Но моя любимая история тут — это проблема с запуском на конкретном сетапе видеокарт (чтобы получить оригинальные метрики и кривые обучения и понимать, с чем сравнивать). Следите за руками:
1) на 1xV100 не хватает памяти, так как аккумулирования градиентов не было
2) на A100 запустить невозможно — старый TF не поддерживает новые видеокарты
3) на 8xV100 16GB тоже не хватает памяти
4) так что работает всё строго на 8xV100 32GB. Такая вот магия!

А ещё один из датасетов OpenAI потеряли при переезде с одного хранилища на другое 😱
В общем, чтиво получается максимально интересное и увлекательное, позволяющее лучше разобраться во всех тонкостях, причём даже если RLHF вам не интересен.

————————————————————————
Эх, а вот редставьте сколько бы всего интересного можно было найти в репозитории для тренировки и инференса LLM уровня GPT-4 🍿🚬...
Please open Telegram to view this post
VIEW IN TELEGRAM
Если будет 7 часов свободных (на выходных например ) - рекомендую посмотреть плейлист AWS - Generative AI Foundation.
Очень полезный обзор практически всех аспектов.

https://www.youtube.com/playlist?list=PLhr1KZpdzukf-xb0lmiU3G89GJXaDbAIF
Forwarded from Salute AI
⚡️ GigaChat API открыт для всех разработчиков — оцените как LLM впишется в ваши продукты без дополнительных затрат.

📌
⁃ Бесплатный доступ к LLM для экспериментов
⁃ 1 млн токенов в месяц (~3.5 млн символов)
⁃ Для некоммерческого использования
⁃ Можно заключить договор для коммерческого использования без ограничений

Для получения доступа достаточно перейти по ссылке и войти через Сбер ID, заранее отключив VPN.

P.S. Подпишитесь на канал 💬 Salute AI, чтобы быть в курсе важных новостей от SberDevices.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
Boston Dynamics: Making Chat (ro)Bots
https://www.youtube.com/watch?v=djzOBZUFzTw

В этом видео Мэтт и Вэчер знакомятся с роботом по имени Спот, который служит им гидом.
Они посещают различные станции и обсуждают применение GPT и других технологий AI в робототехнике.
Мэтт особенно подчеркивает, как данная система позволяет роботу мыслить креативно.
Спот демонстрирует свои возможности в различных индустриях, включая проведение экскурсий и выполнение хирургических операций.
Мэтт и Вэчер обсуждают будущее проекта и ожидают улучшения способностей роботов к пониманию действий, которые они могут предпринять в рамках окружающего мира.
Они считают, что это может быть применимо далеко за пределами потребностей текущих клиентов.

#AI #robotics #BostonDynamics
Oracle добавляет в свою инфраструктуру AI-технологии Nvidia

- Oracle привносит в свою инфраструктуру такие AI-средства Nvidia, как DGX Cloud AI и AI Enterprise.
- Клиенты Oracle теперь могут обрабатывать свои данные на передовых графических процессорах Nvidia.
- Это позволит компаниям легче интегрировать AI в свои продукты и быстрее выводить их на рынок.

Теперь создание и развертывание AI-приложений станет проще и быстрее благодаря передовым технологиям Nvidia, интегрированным в облачную инфраструктуру Oracle.

#Oracle #Nvidia #AI
1
Книга Open Source AI '2023

- обзор Open Source AI за 2023 год, который покрывает все ключевые категории, от оценки моделей до их внедрения.
- Информационный гид адресован специалистам, знакомым с базовыми принципами MLOps, которые хотят быстро посмотреть последние новинки в области open source AI за последний год.
- Обзор затрагивает не только модели, но и изменения в инфраструктуре, "подводные камни" лицензий и новые виды применения.

Теперь специалисты смогут чётко понимать современные тенденции в мире Open Source AI и быть в курсе последних инноваций.

#OpenSource #AI #обзор
Нейросеть начинает обучаться языку, подобно человеку

- Ученые создали нейросеть, способную делать обобщения о языке, подобно человеку.
- Нейросеть показывает результаты, сравнимые с человеческими, в применении новых слов в существующем словаре и использовании их в новых контекстах.
Это ключевой аспект человеческого познания, известный как систематическая генерализация.
- Предыдущие модели, такие как ChatGPT основаны на больших языковых моделях и умеют вести беседу в разных контекстах, но являются несистематичными и демонстрируют пробелы и неточности.

Теперь AI сможет научиться общению на любом языке, как человек, что облегчит взаимодействие между людьми и машинами.

#AI #Нейросеть #Язык
🎉1
Jetson - платформа NVIDIA для роботов и AI

- NVIDIA анонсировала обновления для своей платформы Jetson - аналог Arduino или Raspberri Pi на максималках. Встроенный Tensor & Generative AI

- Jetson уже используется в различных отраслях, например, в производстве, транспорте и здравоохранении.

- В рамках обновления NVIDIA представляет "лабораторию Gen AI Jetson", для ускорения разработки AI-приложений.

#NVIDIA #Jetson #AI

https://www.jetson-ai-lab.com/index.html
Руководство по дообучению Llama 2 с помощью LoRA

- Llama 2 - расширенная языковая модель от Meta, обладающая до 70 миллиардами параметров и увеличенной длиной контекста.
- Модель использует групповое внимание к запросу (GQA) для увеличения масштабируемости вывода.
- Llama 2 может быть дообучена с использованием LoRA для выполнения задач ответа на вопросы.
- LoRA сократила количество обучаемых параметров до 10 тысяч раз, что привело к улучшению производительности.
- Благодаря дообучению, Llama 2 может быть использована для создания чат-ботов, виртуальных ассистентов и других приложений, требующих понимания и генерации языка.

#Llama2 #LoRA #FineTuning
DeepSeek AI представляет 3D-моделирование с DreamCraft3D

- DeepSeek AI открыл доступ к официальной реализации DreamCraft3D - мощного метода генерации иерархического 3D-контента.

- Этот подход обеспечивает генерацию высококачественных и последовательных 3D-объектов, используя 2D-изображения в качестве отправной точки.
- Основной упор сделан на решение проблемы последовательности, с которой сталкиваются существующие методы.

- С помощью системы дистилляции оценок по модели диффузии, зависящей от обзора, обеспечивается создание геометрий, которые отображаются взаимосвязано.
- Используется Bootstrapped Score Distillation для улучшения текстур.
- Результат: последовательные 3D-объекты с фотореалистичными изображениями.

Появился новый инструмент для создания более реалистичных 3D-объектов.
https://youtu.be/0FazXENkQms


#DeepSeekAI #DreamCraft3D #3Dгенерация
Техника RAG в мире искусственного интеллекта

- RAG (Retrieval-Augmented Generation) – подход в области искусственного интеллекта, позволяющий предоставлять модели AI новые данные для выполнения конкретных задач.
- В отличие от техники fine-tuning, где существующая модель дообучается новыми данными, RAG просто передает модели информацию, на которой она не была обучена.
- Популярность RAG объясняется его простотой: модель не изменяется, а только использует временные внешние данные для непосредственного запроса.
- RAG, требующий лишь несколько документов для работы, предлагает более простой способ "заряжать" большие языковые модели для выполнения разнообразных задач.
- IBM, Microsoft, Google и Amazon разрабатывают решения и инструменты для помощи разработчикам приложений в использовании RAG.

Вывод: всё упрощается.
Теперь вместо сложной настройки AI модели достаточно предоставить ей нужную информацию для выполнения задачи.

#RAG #AI #IBM

https://arxiv.org/abs/2005.11401

https://www.promptingguide.ai/techniques/rag
Google инвестирует 2 млрд долларов в Anthropic

- Anthropic основан бывшими руководителями OpenAI и являются разработчиками Claude 2,- конкурента чат-бота OpenAI's ChatGPT.

- Anthropic уже получила инвестиции от компаний Salesforce и Zoom, и ранее в этом году была оценена в размере 4,1 миллиарда долларов.

#Google #Anthropic #AI
wca4z.gif
12 MB
IBM переписывает старые приложения на COBOL при помощи AI

- IBM применяет Генеративный ИИ для модернизации приложений на COBOL, преобразуя их в код на Java.
- Watsonx Code Assistant for Z разбивает код приложений на модульные части, определяет зависимости и переводит их на современный Java.
- IBM предлагает собственные консультационные услуги для идентификации приложений, подлежащих модернизации, и построения индивидуальных решений.
- Использование Watsonx Code Assistant обеспечивает безопасность данных, особенно важную для критических систем в банковской и финансовой сферах.

Наконец-то можно будет портировать тонны антикварного COBOLа на современные платформы.

#IBM #COBOL #WatsonxCodeAssistant

пресс-релиз IBM
Forwarded from e/acc
ChatGPT теперь поддерживает работу с файлами (загружай PDF и задавай вопросы) и совмещение разных модальностей в одном чате (может рисовать картинки, гуглить, писать и исполнять код в одном чате).

Для большинства это шок, потому что их стартап идея была разбита о быструю доставку качественного продукта команды OpenAI с инженерами за $600к в год.

Дабы предупредить будущий шок, давайте сразу обсудим, что ChatGPT выкатит в следующих версиях:

- подключение своих данных: Gmail, slack, WhatsApp
- общение в едином чате, который помнит все о вас. по сути - разговор с ассистентом.
- возможность соединять цепочки действий и плагинов (агенты)
- маркетплейс плагинов с монетизацией и курацией (curation, если на человеческом)
- полная мультимодальность: на вход видео, на выход голос; на вход музыку, на выход видео; на вход excel на выход диаграммы
- проактивный ИИ: сам поймёт когда и что у вас спросить или вам рассказать
- у каждого пользователя персональная модель, обученная на последних годах диалога (каждому — свою LoRA)
2🔥1
2105.11977.pdf
1.4 MB
Смешанный подход в обучении AI

- Исследование представляет смешанный подход в обучении Искусственного Интеллекта, сочетающий автономное обучение и прямое обучение.

- Этот подход реализуется через обучаемые автономные агенты (TAA).

- TAA может повышать эффективность вспомогательного обучения и дает пользователям возможность направлять траектории обучения в соответствии со своими ожиданиями.

- Разработка TAA может стать ключевым шагом к созданию агентов с интеллектом человеческого уровня.

Этот подход может повысить эффективность ИИ и сделать обучение более похожим на то, как учатся дети.

#AI #обучение #TAA

https://arxiv.org/abs/2105.11977
Groot: новый фреймворк для обучения с подкреплением в сфере манипуляций с объектами

- Groot - это современный фреймворк для обучения с подкреплением.
Разработан для работы со сложными 3D объектами.
- Этот фреймворк был создан специально для манипуляций, основанных на зрении, с использованием объемно-центрических объектов.
- Ключевым преимуществом Groot является его адаптивная обобщенная политика, которая способна автоматически улучшать свои стратегии на основе новых данных.

Мощность и универсальность нового фреймворка Groot обещает существенный прогресс в области робототехнического зрения и машинного обучения.

#Groot #ОбучениеСПодкреплением #3DМанипуляции
This media is not supported in your browser
VIEW IN TELEGRAM
Парень сделал мозговую
карту для любой задачи

Как это работает: пишете промт — что вы хотите сделать, ИИ раскладывает эти планы по пунктам.

Юзаем тут.

GeekNeural | #Useful
Forwarded from 42 секунды
The Information: Продажи OpenAI находятся под давлением, т.к. клиенты ищут более дешевые варианты ИИ

– OpenAI давно не единственный, кто продает генеративный ИИ
– Эта ситуация начинает влиять на рост продаж корп. клиентам
– На альтернативы подешевле уже перешли Salesforce, Wix и др.
– Уже 18 тыс. клиентов покупают сервисы OpenAI через Microsoft
– Так они сочетают технологии OpenAI и другие продукты
– Это проблема, т.к. Microsoft забирает большую часть дохода
– Похожие сервисы продают Google, AWS, Anthropic и Cohere
– Часть стартапов делают ИИ на базе открытого исходного кода
– Это позволяет не платить за дорогие модели от OpenAI и др.
– OpenAI работает над снижением стоимости своих технологий

@ftsec
Forwarded from 42 секунды
BleepingComputer: HackerOne выплатила «белым хакерам» за 10 лет более $300 млн за найденные ошибки

– За все время работы платформа HackerOne выплатила $300+ млн
– Выплаты получили «белые хакеры» и исследователи
– Вознаграждения на сумму $1+ млн получили 30 человек
– Один из них установил рекорд, заработав суммарно уже $4+ млн
– Платформа для поиска ошибок была основана более 10 лет назад
– С начала 2023 самой крупной выплатой были $100,05 тыс.
– Сред. стоимость найденной ошибки за 2023 была $500
– Уже более 50% «белых хакеров» используют генеративный ИИ

@ftsec
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 Stable Diffusion поражает скоростью в оффлайне.🔥

Теперь нйромонстр способен генерировать кадры быстро без подключения к интернету прямо на смартфоне. Все пруфы предоставлены на мероприятии Snapdragon Summit.

🧩 #ВысокиеТехнологии
Please open Telegram to view this post
VIEW IN TELEGRAM
Palantir стала лидирующим поставщиком AI, Data Science и Machine Learning

- Компания Palantir была признана лидером в отчете 2023 AI, Data Science, Machine Learning Wisdom of Crowds® Market Study, подготовленном Dresner Advisory Services.
- Доклад включает в себя статистику, моделирование, machine learning, нейронные сети и data mining для анализа фактов с целью прогнозирования будущих или иных неизвестных событий.
- Платформа искусственного интеллекта Palantir (AIP) позволяет организациям использовать мощь генеративного ИИ в своих ключевых операциях.
- Несмотря на важность AI / DS / ML во всех отраслях, только 29% организаций сегодня применяют генеративный ИИ, в основном в экспериментальных не-производственных целях.

Это открытие позволяет с гораздо большей точностью прогнозировать будущие события и изменения, что, безусловно, увеличит эффективность принятия решений.

#Palantir #AI #MachineLearning