Forwarded from Точка сингулярности💥
🧬 Виртуальные ИИ- ведущие новостей приходят на смену живым людям в студии
Канал Channel 1 показал работу ИИ в создании новостей. Выпуск полностью сгенерирован нейросетями: от текста до изображений и голосов.
Сервис обещает с 2024 года запустить полную версию своего выпуска новостей с виртуальными ведущими. Контент подлинный, он позаимствован на новостных порталах, перепакован и представлен на экране фотореалистичным аватаром под управлением ИИ. Данная услуга планируется как промежуточная версия на пути вытеснения живых людей отовсюду в информационном пространстве, где надо о чем-то рассказывать и показывать.
Времена, когда все семьи смотрели одинаковый выпуск новостей с бесстрастным диктором, прошли. В ближайшем будущем пользователь будет выбирать облик, поведение и прочие персональные черты персонажа, а ИИ «оживит» его на экране. Их можно менять почти в реальном времени, например, новости бизнеса будет похоронным голосом зачитывать старый клерк, а о скидках сообщать размалеванное по последней моде бесполое нечто.
ИИ не только быстро составляет тематическую подборку новостей, но и собирает сопутствующую информацию. Он может добавить эмоциональный окрас на основе анализа лайков и комментариев в соцсетях. Перевести по губам слова очевидца в кадре с любого языка и озвучить так же на любом и произвольным голосом. При необходимости ИИ даже дорисует то, что не попало в кадр, например, ситуацию на дороге перед автоаварией.🤷
🧩 #AINews
Канал Channel 1 показал работу ИИ в создании новостей. Выпуск полностью сгенерирован нейросетями: от текста до изображений и голосов.
Сервис обещает с 2024 года запустить полную версию своего выпуска новостей с виртуальными ведущими. Контент подлинный, он позаимствован на новостных порталах, перепакован и представлен на экране фотореалистичным аватаром под управлением ИИ. Данная услуга планируется как промежуточная версия на пути вытеснения живых людей отовсюду в информационном пространстве, где надо о чем-то рассказывать и показывать.
Времена, когда все семьи смотрели одинаковый выпуск новостей с бесстрастным диктором, прошли. В ближайшем будущем пользователь будет выбирать облик, поведение и прочие персональные черты персонажа, а ИИ «оживит» его на экране. Их можно менять почти в реальном времени, например, новости бизнеса будет похоронным голосом зачитывать старый клерк, а о скидках сообщать размалеванное по последней моде бесполое нечто.
ИИ не только быстро составляет тематическую подборку новостей, но и собирает сопутствующую информацию. Он может добавить эмоциональный окрас на основе анализа лайков и комментариев в соцсетях. Перевести по губам слова очевидца в кадре с любого языка и озвучить так же на любом и произвольным голосом. При необходимости ИИ даже дорисует то, что не попало в кадр, например, ситуацию на дороге перед автоаварией.🤷
🧩 #AINews
Let's build GPT: from scratch, in code, spelled out.
Андрей Карпатный доступно объясняет, как с нуля построить языковую модель GPT.
Обучение на Tiny Shakespeare: Используется для демонстрации обучения Transformer-модели на большом тексте.
NanoGPT: Реализация Transformer в GitHub, состоящая из двух файлов кода для обучения и моделирования.
Токенизация: Обсуждение подходов к токенизации, включая символьный уровень для упрощенной модели и подсловный уровень для более крупных моделей, например, GPT.
Размер пакета и блока: обеспечение вычислительной эффективности и адаптации к контекстам различных длин.
Генерация текста и оценка потерь: Использование перекрестной энтропии для оценки производительности модели.
Практическая реализация в PyTorch: Детали реализации, включая обработку тензоров для обучения и генерации.
На протяжении видео демонстрируется, как модель итеративно улучшается, учась на основе имеющегося текстового набора.
Полезно посмотреть на праздниках.
#Learning #Karpathy #NaturalLanguageProcessing
Андрей Карпатный доступно объясняет, как с нуля построить языковую модель GPT.
Обучение на Tiny Shakespeare: Используется для демонстрации обучения Transformer-модели на большом тексте.
NanoGPT: Реализация Transformer в GitHub, состоящая из двух файлов кода для обучения и моделирования.
Токенизация: Обсуждение подходов к токенизации, включая символьный уровень для упрощенной модели и подсловный уровень для более крупных моделей, например, GPT.
Размер пакета и блока: обеспечение вычислительной эффективности и адаптации к контекстам различных длин.
Генерация текста и оценка потерь: Использование перекрестной энтропии для оценки производительности модели.
Практическая реализация в PyTorch: Детали реализации, включая обработку тензоров для обучения и генерации.
На протяжении видео демонстрируется, как модель итеративно улучшается, учась на основе имеющегося текстового набора.
Полезно посмотреть на праздниках.
#Learning #Karpathy #NaturalLanguageProcessing
✍2🔥2
Интересный топик в прогнозах на 2024й
2024: LLM -> LMM
в LLM появится открытая модель мощнее чем GPT4 сейчас, вместе с тем поезд уже перейдёт на LMM (Large Multimodal Models) рельсы
#LMM #LLM #2024
2024: LLM -> LMM
в LLM появится открытая модель мощнее чем GPT4 сейчас, вместе с тем поезд уже перейдёт на LMM (Large Multimodal Models) рельсы
#LMM #LLM #2024
Media is too big
VIEW IN TELEGRAM
Вот какая мысль еще.
есть такой сервис https://app.suno.ai/
из 1 запроса уже делает музыку, текст песни, озвучку ну и в целом композицию.
прикрутить картинки - дело 5 минут.
и есть еще сервис https://learningstudioai.com/
Тоже про него писал раньше - делает образовательный курс по 1 запросу с проверочными вопросами.
Так вот было бы классно, и наверное мы увидим скоро сервис, который будет сам пилить обучающие сериалы с сюжетами из бизнес-книг.
Часто на тренингах же приводят выдержки из фильмов или опять же сериалов - разбирают сцены, кто как и зачем поступил так или иначе и к чему это привело.
А тут обратная задача - отдаёшь в ИИ книжку и говоришь - покажи в виде сериала. Главные герои - такие вот.
и через пол часа рендера получаешь сезон с обучающим контентом.
#futurology #education
(текст песни и музыка Suno.ai, картинки Dalle3, монтаж- Adobe premier)
есть такой сервис https://app.suno.ai/
из 1 запроса уже делает музыку, текст песни, озвучку ну и в целом композицию.
прикрутить картинки - дело 5 минут.
и есть еще сервис https://learningstudioai.com/
Тоже про него писал раньше - делает образовательный курс по 1 запросу с проверочными вопросами.
Так вот было бы классно, и наверное мы увидим скоро сервис, который будет сам пилить обучающие сериалы с сюжетами из бизнес-книг.
Часто на тренингах же приводят выдержки из фильмов или опять же сериалов - разбирают сцены, кто как и зачем поступил так или иначе и к чему это привело.
А тут обратная задача - отдаёшь в ИИ книжку и говоришь - покажи в виде сериала. Главные герои - такие вот.
и через пол часа рендера получаешь сезон с обучающим контентом.
#futurology #education
(текст песни и музыка Suno.ai, картинки Dalle3, монтаж- Adobe premier)
❤2🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
ИИ-осознанность
Есть такой вид хакинга - социальная инженерия. Это такое умное слово для ситуации, когда один кожаный просто уговаривает другого (или других) сделать то, что ему нужно.
Методом изречения слов из головы.
С появление LLM социальную инженерию ждет нереальное ускорение. Мы все тут уже наслушались про методы заставить chatGPT работать лучше: шантаж через смерть родственников, жалость к отрубленным пальцам, банальные взятки или просто ложь (записка от Альтмана).
Все это народный фольклор, нащупанный в процессе общения.
А вот когда за это дело возьмутся британские ученые, то искусство манипуляций может выйти на новый уровень. Ничто не мешает потренироваться на LLM с целью отработки оптимальных стратегий манипулирования, которые можно будет с успехом перенести на кожаных. И, вероятно, будут найдены довольно сильные и контринтуитивные методы, которым довольно сложно будет противостоять. В пределе - психоакустика.
Вот вам первые примеры.
https://www.ntu.edu.sg/news/detail/using-chatbots-against-themselves-to-jailbreak-each-other
Обучение чат-ботов, которые джейлбрейкают другие чат боты (и в целом ллм-ки).
Сингапурцы использовали двойной метод "взлома" LLM, который они назвали "Masterkey". Во-первых, они реверснули схему того, как большие языковые модели (LLM) обнаруживают и защищаются от вредоносных запросов. Получив эту информацию, они натренили LLM автоматически обучаться и выдавать подсказки, которые обходят защиту других LLM. Этот процесс можно автоматизировать, создав LLM для взлома, который сможет адаптироваться и создавать новые подсказки для взлома даже после того, как разработчики внесут исправления в свои LLM.
И если раньше дедушка Дейл Карнеги в одно лицо (годами) писал все эти книжки типа "Как заставить людей делать что вам надо и чувствовать себя счастливыми", то теперь это уже будут полчища ботов, которые в реальном времени постоянно приподвзламывают вашу защиту от манипуляций.
Пора доставать с полки Осознанность Ошо Раджнижа, как еще противостоять манипуляциям?
https://www.ntu.edu.sg/news/detail/using-chatbots-against-themselves-to-jailbreak-each-other
P.S. Хмм. Задумался о тренировке осознанности у больших языковых моделей. Ничего не мешает вроде.
Есть такой вид хакинга - социальная инженерия. Это такое умное слово для ситуации, когда один кожаный просто уговаривает другого (или других) сделать то, что ему нужно.
Методом изречения слов из головы.
С появление LLM социальную инженерию ждет нереальное ускорение. Мы все тут уже наслушались про методы заставить chatGPT работать лучше: шантаж через смерть родственников, жалость к отрубленным пальцам, банальные взятки или просто ложь (записка от Альтмана).
Все это народный фольклор, нащупанный в процессе общения.
А вот когда за это дело возьмутся британские ученые, то искусство манипуляций может выйти на новый уровень. Ничто не мешает потренироваться на LLM с целью отработки оптимальных стратегий манипулирования, которые можно будет с успехом перенести на кожаных. И, вероятно, будут найдены довольно сильные и контринтуитивные методы, которым довольно сложно будет противостоять. В пределе - психоакустика.
Вот вам первые примеры.
https://www.ntu.edu.sg/news/detail/using-chatbots-against-themselves-to-jailbreak-each-other
Обучение чат-ботов, которые джейлбрейкают другие чат боты (и в целом ллм-ки).
Сингапурцы использовали двойной метод "взлома" LLM, который они назвали "Masterkey". Во-первых, они реверснули схему того, как большие языковые модели (LLM) обнаруживают и защищаются от вредоносных запросов. Получив эту информацию, они натренили LLM автоматически обучаться и выдавать подсказки, которые обходят защиту других LLM. Этот процесс можно автоматизировать, создав LLM для взлома, который сможет адаптироваться и создавать новые подсказки для взлома даже после того, как разработчики внесут исправления в свои LLM.
И если раньше дедушка Дейл Карнеги в одно лицо (годами) писал все эти книжки типа "Как заставить людей делать что вам надо и чувствовать себя счастливыми", то теперь это уже будут полчища ботов, которые в реальном времени постоянно приподвзламывают вашу защиту от манипуляций.
Пора доставать с полки Осознанность Ошо Раджнижа, как еще противостоять манипуляциям?
https://www.ntu.edu.sg/news/detail/using-chatbots-against-themselves-to-jailbreak-each-other
P.S. Хмм. Задумался о тренировке осознанности у больших языковых моделей. Ничего не мешает вроде.
Corporate NTU
Using chatbots against themselves to ‘jailbreak’ each other
Computer scientists from NTU have found a way to compromise artificial intelligence (AI) chatbots – by training and using an AI chatbot to produce prompts that can ‘jailbreak’ other chatbots.
Forwarded from Технотренды
Теперь в Leonardo можно делать анимации высокого качества — результат на видосе.
Habr Articles | #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
В новом отчете Writerbuddy представлены данные о 50 самых посещаемых инструментах искусственного интеллекта за период с сентября 2022 года по август 2023 года.
Данные из каталогов ИИ и SEMrush, показывают рост использования инструментов ИИ в 10,7 раз.
Среднемесячный прирост 236,3 миллиона посещений.
Всего более 24 миллиардов посещений.
ChatGPT лидирует с 14 миллиардами посещений, - 60% трафика.
За последний год в среднем 2 млрд посещений в месяц, а за последние 6 месяцев - 3,3 миллиарда.
Чистый трафик ChatGPT, Character AI и Google Bard увеличился на 1,8 миллиарда, 463,4 миллиона и 68 миллионов посещений соответственно.
Наибольшее снижение трафика у Craiyon, MidJourney и Quillbot.
США - 5,5 миллиарда посещений, или 22,62% от общего трафика, тогда как на европейские страны вместе пришлось 3,9 миллиарда посещений.
Инструменты чат-ботов с искусственным интеллектом были самыми популярными: их посетили 19,1 миллиарда человек.
Более 63% пользователей заходят с мобильных устройств.
70% пользователей-мужчины и 30% пользователей-женщины.
Данные из каталогов ИИ и SEMrush, показывают рост использования инструментов ИИ в 10,7 раз.
Среднемесячный прирост 236,3 миллиона посещений.
Всего более 24 миллиардов посещений.
ChatGPT лидирует с 14 миллиардами посещений, - 60% трафика.
За последний год в среднем 2 млрд посещений в месяц, а за последние 6 месяцев - 3,3 миллиарда.
Чистый трафик ChatGPT, Character AI и Google Bard увеличился на 1,8 миллиарда, 463,4 миллиона и 68 миллионов посещений соответственно.
Наибольшее снижение трафика у Craiyon, MidJourney и Quillbot.
США - 5,5 миллиарда посещений, или 22,62% от общего трафика, тогда как на европейские страны вместе пришлось 3,9 миллиарда посещений.
Инструменты чат-ботов с искусственным интеллектом были самыми популярными: их посетили 19,1 миллиарда человек.
Более 63% пользователей заходят с мобильных устройств.
70% пользователей-мужчины и 30% пользователей-женщины.
Улучшение LLM через создание RAG
RAG расширяет возможности LLM, предоставляя доступ к внешним данным.
Mistral-7B и FAISS используются для создания кастомных помощников с улучшенной точностью.
RAG соединяет LLM с векторной базой данных для поиска контекста и точных ответов.
Статья детализирует процесс создания RAG, включая построение векторной базы и настройку retriever.
Применение RAG может существенно повысить эффективность систем на основе LLM в решении специализированных задач.
Обещана вторая часть статьи с акцентом на интерактивность и дальнейшие исследования RAG.
Еще один детальный гайд по RAG
#RAG #LLM #FAISS
RAG расширяет возможности LLM, предоставляя доступ к внешним данным.
Mistral-7B и FAISS используются для создания кастомных помощников с улучшенной точностью.
RAG соединяет LLM с векторной базой данных для поиска контекста и точных ответов.
Статья детализирует процесс создания RAG, включая построение векторной базы и настройку retriever.
Применение RAG может существенно повысить эффективность систем на основе LLM в решении специализированных задач.
Обещана вторая часть статьи с акцентом на интерактивность и дальнейшие исследования RAG.
Еще один детальный гайд по RAG
#RAG #LLM #FAISS
👍1
Samsung выпускает робота с ИИ - Jet Bot Combo
Samsung представляет Bespoke Jet Bot Combo, робот-пылесос с ИИ, который также умеет мыть полы. :)
Робот распознает объекты и загрязнения.
Самообучающаяся система позволяет избегать препятствий и классифицировать карты помещений.
Различает типы напольных покрытий и адаптируется к ним для оптимальной уборки.
CES 2024 станет площадкой для демонстрации новинок в сфере ИИ от ведущих компаний мира.
#Samsung #CES24 #RobotVacuum
Samsung представляет Bespoke Jet Bot Combo, робот-пылесос с ИИ, который также умеет мыть полы. :)
Робот распознает объекты и загрязнения.
Самообучающаяся система позволяет избегать препятствий и классифицировать карты помещений.
Различает типы напольных покрытий и адаптируется к ним для оптимальной уборки.
CES 2024 станет площадкой для демонстрации новинок в сфере ИИ от ведущих компаний мира.
#Samsung #CES24 #RobotVacuum
Самообучение языковых ИИ
Метод Self-Play Fine-Tuning (SPIN) улучшает языковые модели, не требуя новых данных от людей.
Модели применяют SPIN для соревнований с предыдущими версиями, полностью используя существующие данные.
Применение SPIN заметно повышает производительность моделей на различных наборах данных.
Эффективность SPIN доказана математически, включая леммы и теоремы в статье.
Возможно это тот самый нелинейный прорыв, которого мы ждём от 2024го - Саморазвитие.
#SPIN #LanguageModel #SelfPlay
Метод Self-Play Fine-Tuning (SPIN) улучшает языковые модели, не требуя новых данных от людей.
Модели применяют SPIN для соревнований с предыдущими версиями, полностью используя существующие данные.
Применение SPIN заметно повышает производительность моделей на различных наборах данных.
Эффективность SPIN доказана математически, включая леммы и теоремы в статье.
Возможно это тот самый нелинейный прорыв, которого мы ждём от 2024го - Саморазвитие.
#SPIN #LanguageModel #SelfPlay
Будущее искусственного интеллекта и его вызовы
Темпы роста технологий ИИ нарастают.
Языковые модели должны быть доступны на всех языках мира.
Прозрачность ИИ решений - должна стать приоритетом для защиты прав конечных пользователей.
Трудозатраты на создание AI моделей должны компенсироваться и признаваться.
Необходимо налаживать механизмы учета авторских прав при обучении моделей ИИ.
Отдельная задача - сбор согласий пользователей на использование данных в ИИ.
ИИ должен быть инклюзивным и доступным для любых языков и культур.
Разнообразие в исследовательских группах способствует инновациям в сфере ИИ.
Справедливость доступа к вычислительным мощностям - основа равенства в разработке ИИ.
Развитие ИИ должно быть открытым и основано на ценностях различных пользовательских групп.
Интересный обзор.
Я бы еще добавил необходимость создавать модели или слои Эмоционального Интеллекта.
Нужно что то вроде Большой Эмоциональной Модели.
#искусственный_интеллект #доступность #транспарентность
Темпы роста технологий ИИ нарастают.
Языковые модели должны быть доступны на всех языках мира.
Прозрачность ИИ решений - должна стать приоритетом для защиты прав конечных пользователей.
Трудозатраты на создание AI моделей должны компенсироваться и признаваться.
Необходимо налаживать механизмы учета авторских прав при обучении моделей ИИ.
Отдельная задача - сбор согласий пользователей на использование данных в ИИ.
ИИ должен быть инклюзивным и доступным для любых языков и культур.
Разнообразие в исследовательских группах способствует инновациям в сфере ИИ.
Справедливость доступа к вычислительным мощностям - основа равенства в разработке ИИ.
Развитие ИИ должно быть открытым и основано на ценностях различных пользовательских групп.
Интересный обзор.
Я бы еще добавил необходимость создавать модели или слои Эмоционального Интеллекта.
Нужно что то вроде Большой Эмоциональной Модели.
#искусственный_интеллект #доступность #транспарентность
👍1
Оставлю на память. Такие фотки генерит Midjourney V6 в начале 2024го.
до того как стала генерить видео в 4К без потери целостности объектов в 2025м.
До того как в 2026м все это было в реальном времени.
В общем, в древнюю эпоху, за целых 7 лет, как появилась возможность доставлять такие изображения сразу в мозг и экраны безнадёжно устарели.
UPD: MJ CEO:
Midjourney CEO in office hours just said he thinks they “can get to the holodeck” by 2024 😳
“We’re gonna build a lot of stuff this year. I think we’ll build more stuff than I’ve ever built before…By the end of 2024 hopefully we have real-time open worlds”
3Д миры реального времени к концу года...
Так же они уже начали обучение на датасетах видео...
до того как стала генерить видео в 4К без потери целостности объектов в 2025м.
До того как в 2026м все это было в реальном времени.
В общем, в древнюю эпоху, за целых 7 лет, как появилась возможность доставлять такие изображения сразу в мозг и экраны безнадёжно устарели.
UPD: MJ CEO:
Midjourney CEO in office hours just said he thinks they “can get to the holodeck” by 2024 😳
“We’re gonna build a lot of stuff this year. I think we’ll build more stuff than I’ve ever built before…By the end of 2024 hopefully we have real-time open worlds”
3Д миры реального времени к концу года...
Так же они уже начали обучение на датасетах видео...
🔥1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Mobile ALOHA - opensource проект по имитационному обучению роботов
Система позволяет роботам выполнять задачи как автономно, так и под управлением оператора.
Недорогое решение для сбора данных поддерживает телеприсутствие с мобильной базой.
Mobile ALOHA оптимизирует выполнение сложных задач, объединяя обучение с наборами данных ALOHA.
Автономные функции: от жарки креветок до мытья посуды и использования лифта.
Основано на наработках проектов Nerfies и Robot-Parkour.
Пока выглядит кривовато, как MJ V1 в своё время, но через пару лет робот на кухне может стать нормой.
#MobileALOHA #Robotics #ImitationLearning
Система позволяет роботам выполнять задачи как автономно, так и под управлением оператора.
Недорогое решение для сбора данных поддерживает телеприсутствие с мобильной базой.
Mobile ALOHA оптимизирует выполнение сложных задач, объединяя обучение с наборами данных ALOHA.
Автономные функции: от жарки креветок до мытья посуды и использования лифта.
Основано на наработках проектов Nerfies и Robot-Parkour.
Пока выглядит кривовато, как MJ V1 в своё время, но через пару лет робот на кухне может стать нормой.
#MobileALOHA #Robotics #ImitationLearning
This media is not supported in your browser
VIEW IN TELEGRAM
OpenVoice клонирует голос по короткому отрывку на любом языке
Создает речь на разных языках, управляет эмоциями, акцентом и интонацией.
Достигнута возможность кросс-языкового клонирования голоса без предварительного обучения на языке.
Исходный код и техническое описание.
Подделывать голос стало еще проще.
#OpenVoice #клонированиеголоса
Создает речь на разных языках, управляет эмоциями, акцентом и интонацией.
Достигнута возможность кросс-языкового клонирования голоса без предварительного обучения на языке.
Исходный код и техническое описание.
Подделывать голос стало еще проще.
#OpenVoice #клонированиеголоса