Neural Networks | Нейронные сети
1.39K subscribers
113 photos
29 videos
19 files
621 links
Нейронные сети в действии! Обучающие материалы и эксперименты. Также подписывайтесь на группу VK: https://vk.com/neurolearn

📨 Сотрудничество: @thelans
Download Telegram
Forwarded from MIL Team Partners
Привет! ⚡️
Зовем вас на Научный семинар «AI-кодеки: технологии, перспективы, вызовы»

5 декабря в 📍МФТИ собираемся обсудить, как нейросети перевернули мир сжатия видео и изображений:
– Путь развития технологий от истоков до SOTA, диффузии, random access
– Разбираем реальные кейсы и вызовы.
– Ловим инсайты от лучших экспертов!

Подробности – в карточках

🗓Когда: 5 декабря, 18:00

Регистрация до 4 декабря 15:00 на TimePad
Ссылка на запись и трансляцию будет в нашем канале @mil_team_partners. Вопросы – там же
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
​​🚀 Новинка от Stability: Stable Diffusion 3.5 Medium! 🤖

🤩 Основные преимущества:
1. Компактность: Модель такого же размера, как SDXL, и подходит для 10 ГБ VRAM, а с оптимизациями — даже для 8 ГБ! Ознакомьтесь с уже оптимизированной версией здесь: Hugging Face.
2. Скорость: В 3–4 раза быстрее, чем Stable Diffusion 3.5 Large, при этом качество остается на высоте.

🎨 Другие плюсы:
- Лицензия: Настоящее открытие!
- Разрешение: Поддержка до 2 мегапикселей (1440x1440).
- Гибкость в обучении: Проста в настройке и поддерживает предсказуемую тренировку. Надеемся на улучшенные файнтюны для еще лучшего понимания промптов благодаря enhanced MMDiT-X!

🔍 Читайте больше: Comfy

🎯 Где попробовать:
- Попробуйте сами тут: Hugging Face Space
- Ознакомьтесь с моделью подробно: Модель на Hugging Face
- Academic: Архив
- Исходный код: GitHub

🔥 Для всех, кто ищет мощные технологии без H100! 👀 💡 Время протестировать!
​​🔧 Prefect.io: Airflow, адаптированный для ML! 🤖
Мощный оркестратор, который сделает ваш MLOps проект ещё проще и эффективнее. 🚀 Prefect сочетает в себе все преимущества, такие как планирование на основе Cron и повторные попытки, но при этом предлагает безсерверную инфраструктуру и облачный UI интерфейс. ☁️

💡 Почему Prefect?
- Есть условно бесплатный тариф.
- Удобный облачный UI.
- Простой переход на ML оркестрацию.
Подробнее о сравнении с Airflow: Prefect vs. Airflow.

👨‍💻 Ресурсы:
- GitHub репозиторий с более чем 17K звёздами: GitHub
- Изучите применение на практике: Case Study

🎥 Быстрое введение: Узнайте, как превратить ваш Python скрипт в конвейер данных за 4 минуты. Подключение к Prefect Cloud, создание потоков, добавление задач и планирование: Введение в оркестрацию.

Начните прямо сейчас, зарегистрировав бесплатный аккаунт: Prefect Cloud.
Стимпанк-дирижабль и опасные викторианские девушки в короткометражном видео, созданном с помощью искусственного интеллекта - «Механические сумерки».
Стимпанк, который мы заслужили.
https://youtu.be/tqo0GBYHCVg?si=-wDF555eHC_hVpQf
🎤 Создай свою AI-певицу: музыка и клипы с нуля! 🎶

В этом видео вы узнаете, как создать уникальную AI-модель для вокала, написать музыку, анимировать рендеры и собрать всё это в стильный музыкальный клип. 🎬

🎛 Инструменты для творчества:
- 🔧 Генератор промптов: AI Photo Sales
- 🎨 Рендеринг: Rendernet
- 🔄 AI-музыка: Flux
- 🎵 Музыкальная платформа: Suno
- 🖌 Анимация и визуализация: Kling

🎥 Стоковые видео для ваших проектов:
1. 📹 UnlimVideos: AppSumo
2. 💻 Canva: Canva

Откройте для себя возможности AI в создании музыки и видеоконтента! 🌟
​​🚀 Современный алготрейдинг с ChatGPT: как искусственный интеллект меняет трейдинг 🤖📈

Погружаемся в глубины алготрейдинга, исследуя роль ChatGPT в данной сфере. Перед вами множество возможностей для оптимизации и улучшения инвестиционных стратегий с помощью AI. 📊

🔍 Ключевые темы обсуждения:
- Новые решения для всех: Современные подходы делают алготрейдинг доступным не только для профессионалов, но и для широкой аудитории.
- Проблемы существующих решений: Время, деньги, посредники и котировки — основные препятствия на пути к эффективной торговле.
- Преимущества новых технологий: Экономьте время и средства, получая более точные котировки и избавившись от лишних посредников.
- Роль ИИ в трейдинге: Узнайте, как искусственный интеллект помогает оптимизировать торговые стратегии и автоматизировать процессы.
- Практическое использование ChatGPT: Используйте AI для точных и целенаправленных действий в разработке стратегий.
- Создание эффективных стратегий: От идеи до реализации — как с использованием AI можно создать мощные торговые алгоритмы.
- Смещения вероятности: Ключ к успеху в алготрейдинге — понимание и использование различных видов маркеров для построения алгоритмов.
- Тестирование на TradingView: Эффективное использование платформы для максимизации результатов.
- Анализ и автоматизация: Внедрение ChatGPT для автоматизации анализа результатов тестирования.
- Интеграция рыночных фаз: Правильное внедрение фаз рынка в ваши стратегии может существенно повлиять на результаты.
- Основы портфельной торговли: Как строить и управлять эффективными портфелями для достижения финансовых целей.

🌟 Откройте для себя, как AI и технологии могут сделать ваш трейдинг более успешным и доступным!
🔍 Подходы к созданию промптов: от zero-shot до chain-of-thought 🤖

Изучаем различные стратегии для взаимодействия с нейросетями, чтобы добиться максимальной эффективности в генерации ответов! 📈

## Zero-shot подход
- Описание: Без примеров, полагаясь на обученные данные и навыки нейросети.
- Как это работает: Вы даёте straightforward запрос, и нейросеть отвечает, используя свои алгоритмы и контекст.
- Пример:
- Запрос: «Проведи анализ настроения текста: "Карбонара в этом ресторане была посредственной."»
- Ответ: «Настроение: негативное.».
- 📝 Упоминание: Популярные вступления, такие как «Фламинго — это…», помогут без уточнений.

## One-shot и few-shot подходы 🎯
- Описание: Использование одного или нескольких примеров для достижения сложных результатов.
- Когда полезно: Создание нового слова или работа в узкоспециализированной области.
- Пример:
- Определение: «Гакбакить» — прыгать от радости.
- Запрос: «Напиши свой пример с использованием этого слова.»
- Ответ: «Максим начал гакбакить по всей квартире от радости.»

## Chain-of-thought подход 🧠
- Описание: Подход, при котором нейросеть размышляет над заданием шаг за шагом.
- Как это работает: При помощи фразы «Давай подумаем над этим шаг за шагом» активируется цепочка мыслей.
- Применение: Полезно при решении сложных задач или сценариев.
- Пример задачи:
- Вопрос: «Сергей может ударить 25 раз за минуту. Бой длился 5 раундов по 3 минуты. Сколько ударов нанес Сергей?»
- Ответ: Пошаговая инструкция для вычислений.

Эти подходы помогают не только улучшить точность ответов, но и учат нейросеть мыслить последовательно и глубже анализировать запросы. Используйте их, чтобы раскрыть полный потенциал своих AI-проектов! 🌐💡

🔗 Основная статья здесь
🚀 Создание GPT на NumPy: от основ до генерации текста 🧠📊

Представьте, что вы можете создать собственную версию GPT всего в 60 строках кода с использованием NumPy. Погрузитесь в мир языковых моделей и узнайте, как именно работает GPT! 💻

🔗 Полезные статьи:
- Изучите оригинальное руководство: Jay K. Mody
- Интересные статьи на Хабре: Часть 1 и Часть 2

🔥 Основные этапы реализации:
1. Ввод:
- Токенизируйте строку, разделяя её на токены и сопоставляя токены с целочисленными значениями через словарь.
- Применяются методы вроде Byte-Pair Encoding для более сложной токенизации.

2. Вывод:
- Получайте вероятности следующего токена для предсказания.
- Используйте автоагрессию для генерации текста, добавляя токены обратно во ввод.

3. Сэмплирование:
- Внесите элемент случайности в генерацию через методы top-k, top-p и температурное регулирование.
- Эти методы позволят вам экспериментировать с творческими аспектами модели.

4. Обучение:
- Используйте градиентный спуск и перекрёстную энтропию для обучения модели в задачах языкового моделирования.

5. Промптинг и in-context learning:
- Модель GPT обучена выполнять задачи с использованием только контекста промпта, без дополнительных настроек.
OpenAI вновь на гребне волны с анонсом своих последних разработок — O3 и O3-mini!
Ждём открытой версии в конце января 2025 года и полной версии O3 в феврале 2025 года.

👥 Ведущие эксперты Sam Altman, Mark Chen, Hongyu Ren и специальный гость Greg Kamradt, президент фонда ARC Prize, представляют это революционное достижение в искусственном интеллекте. O3 может стать настоящим искусственным общим интеллектом (AGI).

🔍 Что нового в O3?

- Превосходит ожидания: O3 не только улучшает задачи, ранее недосягаемые для ИИ, но и может превосходить экспертов в таких областях, как программирование и наука.
- Компактность с мощью: O3-mini сочетает в себе преимущества mini-размера без ущерба в мощности и производительности.

🔐 Безопасность и тестирование: важный шаг на пути к безопасному будущему ИИ. OpenAI призывает всех к участию в тестировании безопасности новых моделей, чтобы гарантировать их надежность и безопасность использования.

📌 Полезные ссылки:
- Официальный сайт OpenAI: openai.com
- Заполните заявку на тестирование: https://openai.com/index/early-access-for-safety-testing/#how-to-apply

🎥 https://www.youtube.com/live/SKBG1sqdyIU?si=niXvy9f4b-r9dTUJ
🎥 https://youtu.be/MggbzUxFVVI?si=5_Y-K-3BTUHySUqN
🎬 Новая эра выразительных портретов с EMO! 🎭

Представляем вам EMO: Emote Portrait Alive — инновационную технологию для создания выразительных портретных видео с использованием аудиовизуальной диффузии. 🎥

🔗 Узнать больше:
- Проект EMO
- Подробности в статье

🔍 Почему EMO так важен?
Традиционные методы создания видео часто не улавливают тонкости человеческих эмоций и уникальные черты лиц. EMO решает эту проблему с помощью прямого преобразования аудио в видео, что исключает необходимость в 3D моделях и маркерах. Это позволяет добиваться невероятно реалистичных и выразительных анимаций, обеспечивая сохранение идентичности персонажа и плавность переходов.

🛠️ Как это работает?
1. Кодирование кадров: ReferenceNet извлекает ключевые особенности из изображения и кадров движения.
2. Диффузионный процесс: Аудиоэнкодер обрабатывает аудиоданные, слияя их с многофреймовым шумом для генерации изображения лица.
3. Денойзинг с вниманием: Backbone сеть использует внимание к референции и аудио для сохранения идентичности и управления движением.
4. Модуль времени: Регулирует временные аспекты и скорость движения, чтобы добиться естественного эффекта.

EMO позволяет создавать не только говорящие, но и поющие видео в различных стилях, задавая новые стандарты реализма и выразительности. Попробуйте и вы погрузиться в этот удивительный мир аудиовизуального искусства с EMO! 🎶😍
🎯 Рекомендательные системы от Сбера: RePlay - ваш инновационный проводник в мире рекомендаций! 📈

RePlay — это мощный фреймворк, разработанный специально для создания и оценки рекомендательных систем. Он предоставляет полный набор инструментов для каждого этапа разработки рекоммендационной системы:

🚀 Ключевые возможности:
- Предобработка и разделение данных: обеспечивает оптимальную структуру и формат данных для эффективной обработки.
- Широкий выбор моделей: поддержка как современных, так и стандартных моделей для построения и оценки рекомендаций.
- Оптимизация гиперпараметров: упрощает процесс настройки параметров модели для достижения наилучшей производительности.
- Метрики оценки: включает разнообразные метрики для оценки точности и эффективности рекомендаций.
- Ансамблирование и гибридизация: поддержка объединения прогнозов от различных моделей для улучшения качества рекомендаций.
- Переход от оффлайн к онлайн: легкое переключение между экспериментами и производственными средами, обеспечивая масштабируемость.

💻 Совместимость:
- Поддержка аппаратного обеспечения: совместим с CPU, GPU и Multi-GPU конфигурациями.
- Интеграция с кластерными вычислениями: поддержка PySpark для масштабирования и обработки больших объёмов данных.

Примеры использования:
- Получите базовые знания с 01_replay_basics.ipynb.
- Сравните модели на датасете MovieLens-1M с 02_models_comparison.ipynb.
- Узнайте про предобработку и использование LightFM с 03_features_preprocessing_and_lightFM.ipynb.
- Примените сплиттеры данных с 04_splitters.ipynb.
- Создайте рекомендации для продуктовых категорий с 08_recommending_for_categories.ipynb.

Видео и статьи также помогут углубить ваше понимание возможностей RePlay!

🌟 Заинтересованы в создании своей рекомендательной системы? Пробуйте с RePlay на GitHub и отметьте проект звёздочкой.💚
🚀 Перспективы ИИ на 2025 год 🧠

ИИ продолжает стремительно изменять наш мир, и 2025 год обещает новые удивительные возможности и инновации! 🔮 Давайте рассмотрим ключевые направления и их влияние на отрасль.

🔍 Фотореализм и визуализация
- Эволюция изображений: ИИ позволяет создавать фотореалистичные изображения, которые сложно отличить от настоящих. К 2025 году такие технологии будут повсеместно применяться в дизайне, моде, рекламе и кино.
- 📸 Применение: Возможности графики откроют новые горизонты для визуальных эффектов и креативных решений.

🎯 Гиперперсонализация
- Адаптация к потребностям: ИИ будет разрабатывать персонализированные рекомендации и предложения для каждого пользователя.
- 👗 Пример: В модной индустрии боты смогут создавать уникальные дизайны одежды на основе предпочтений клиентов.

🎮 Движущаяся графика и анимация
- Интерактивность: ИИ управляет анимацией, создавая динамичные элементы для видеоигр, рекламы и образования.
- 🎮 Пример: Персонажи видеоигр станут ещё более реалистичными и захватывающими благодаря новым технологиям.

🏗️ Генеративный дизайн в архитектуре и моде
- Инновации в дизайне: ИИ станет ключевым игроком в создании уникальных проектов в архитектуре и моде.
- 🏢 Пример: Боты создадут энергоэффективные здания, оптимизируя конструкции и материалы.

🛠️ Инструменты для не-дизайнеров
- Демократизация дизайна: ИИ упрощает процесс создания для всех. Благодаря инструментам на базе AI, каждый сможет разрабатывать профессиональные графики и видео.
- 🎨 Пример: Платформа Canva уже показывает, насколько доступным может быть дизайн для широкой аудитории.

2025 год обещает стать вехой в развитии технологий, где ИИ займет центральное место во всех аспектах нашей жизни. Мы на пороге новой эры креативности и инноваций! 🌟

Хотите оставаться в курсе новостей нейронных сетей? Подписывайтесь и делитесь своими мыслями в комментариях! 📲
Audio
💡 Генератор музыки SUNO v4:
- 🌌 Глубокая структура композиций: создавайте музыкальные шедевры с уникальными переходами и захватывающими ритмами.
- 🎼 Адаптивный стиль: возможность настроить композицию под любое настроение — от лиричного до динамичного.
- 🔥 Высокая точность воспроизведения: каждая нота звучит с чёткостью и глубиной.

🎵 Пример композиции:
Сейчас вы услышите пример того, на что способна SUNO v4. Закройте глаза и погрузитесь в мир, созданный её виртуозной музыкой.

🌎 https://suno.com/

#музыка #SUNOv4 #искусственныйинтеллект #новаямузыка #творчество
🔊 Создавай музыку с SUNO легко и быстро! 🎶

Регистрация и старт: Подпишитесь на бесплатный Basic Plan.

🎼 Создание трека:
- Введите текст в поле "Lyrics".
- Выберите стиль в "Style of Music".
- Укажите название в "Title".
- Нажмите "Create" и наслаждайтесь результатом!

🎵 Результат: Получите 2 великолепных трека.

💡 Право использования:
- Бесплатный тариф: Для некоммерческого использования, права сохраняются у SUNO.
- Платный тариф: Полные права, включая коммерческое использование.

🎤 Музыкальный стиль: Определяет ритм, инструменты и характер вашей музыки.

🎧 Ежедневные возможности: Открывается 50 кредитов в день, что позволяет создать до 10 треков.

Попробуйте SUNO сегодня и создайте свой музыкальный шедевр! 🚀

🌈 Статья о том, как всё устроено: https://habr.com/ru/articles/810187/

#Suno #Музыка #Творчество #МузыкальныйСтиль
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 GitHub Copilot теперь бесплатен в VSCode!

GitHub радует разработчиков, открыв бесплатный доступ к Copilot прямо в VSCode. Теперь пользоваться ИИ-помощником можно без подписки! 🎉
🌐 https://tproger.ru/news/--github-copilot-stal-polnostyu-besplatnym-vnutri-vscode

Что доступно в бесплатном плане? 🎁
- 2000 автодополнений кода в месяц (примерно 80 в день).
- 💬 50 чатов с Copilot.
- 🤖 Доступ к моделям GPT-4o и Claude 3.5 Sonnet.

Новые возможности Copilot 🚀
- 📝 Редактирование нескольких файлов: изменяйте сразу несколько файлов по своему желанию.
- 🔄 Выбор моделей ИИ: переключайтесь между разными моделями для оптимальных результатов.
- 🎙 Голосовой ввод: кодируйте голосом через VSCode Speech.
- 🔧 Помощь в терминале: автоматическое исправление ошибок команд.

Как начать? 🚀
1. 📥 Установите GitHub Copilot в VSCode.
2. 🔑 Войдите в свой аккаунт GitHub.

P.S.: Для российских пользователей Copilot доступен через VPN.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Google против OpenAI: Битва нейросетей

Google запустила тестирование Veo 2 — потенциального конкурента для Sora от OpenAI в области генерации 4K-видео. Veo 2 обещает удивить пользователей реалистичностью, плавностью анимации и широким выбором стилей — от реализма до ретро. По заявлениям Google, новая модель превосходит Sora по качеству кадров и гибкости настроек. Увидим, как развернется это противостояние! 🎥

🌎 Статья: https://tproger.ru/news/google-zapustila-testirovanie--ubijcy--sora-ot-openai--naskolko-ee-generacii-luchwe-

#нейронныесети #GoogleVeo2 #AIреволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Учебник по промптингу с Claude 🚀

На GitHub появился репозиторий с более чем 2000 звезд, содержащий учебные материалы для работы с Claude. В нем вы найдете интерактивную Google-таблицу, в которую легко интегрировать токен Claude, после чего можно начинать увлекательный процесс обучения с уроками и практическими заданиями.

Помимо привычных указаний по выбору профессии, вы научитесь:
🔹 Форматировать выходные данные
🔹 Применять Precognition (пошаговые размышления)
🔹 Использовать Few-Shot-промптинг
🔹 Проверять текст на галлюцинации и многому другому.

🔗 Ссылка на репозиторий: https://github.com/anthropics/prompt-eng-interactive-tutorial
🔗 Учебная таблица: https://docs.google.com/spreadsheets/d/19jzLgRruG9kjUQNKtCg1ZjdD6l6weA6qRXG5zLIAhC8/edit?pli=1&gid=809016489#gid=809016489
Forwarded from AI для Всех (Artemii)
Открытая реализация масштабирования времени обдумывания (inference time): от O1 к открытым моделям

Команда Hugging Face успешно воспроизвела и адаптировала для открытых моделей подход, который OpenAI впервые продемонстрировала в своей модели O1. Теперь эта техника доступна всем! 🚀

В 2024 году OpenAI первыми показалили, как увеличение времени "обдумывания" может значительно улучшить производительность модели на сложных задачах. В частности, их модель O1 демонстрировала постоянное улучшение результатов на математических задачах при увеличении вычислительного бюджета на этапе вывода.

Что удалось воспроизвести? 🔍

Команда Hugging Face адаптировала этот подход для открытых моделей и показала, что:
- Маленькая модель Llama 1B может достичь производительности Llama 8B
- Модель Llama 3B может конкурировать с Llama 70B
- Всё это возможно без доступа к закрытым моделям или огромным вычислительным ресурсам

Как это работает? 🤔

Основная идея та же, что и у OpenAI - дать модели больше времени на "размышление". Команда реализовала и сравнила три подхода:

1. Best-of-N (Базовый подход)
- Генерируем несколько решений
- Выбираем лучшее с помощью верификатора
- Простой, но эффективный метод

2. Beam Search (Продвинутый метод)
- Систематический поиск решений
- В 4 раза эффективнее Best-of-N
- Оптимален для сложных задач

3. DVTS (Новый метод от HF)
- Улучшение beam search
- Фокус на разнообразии решений
- Лучшая производительность при большом бюджете

Необходимые компоненты:
- Открытая базовая модель (например, Llama-3.2-1B-Instruct)
- Модель-верификатор (например, RLHFlow/Llama3.1-8B-PRM)
- Реализация стратегии поиска

Значение для сообщества 🌟

Эта работа особенно важна, потому что:
- Делает продвинутые техники доступными для всех
- Показывает, что маленькие открытые модели могут быть очень эффективными
- Предоставляет практическую реализацию для экспериментов

Что дальше? 🚀

Открытая реализация этих методов открывает новые возможности:
- Применение подхода к другим задачам
- Улучшение верификаторов
- Разработка новых стратегий поиска

Это отличный пример того, как открытые модели и исследования двигают область вперёд.

Блог-пост
Media is too big
VIEW IN TELEGRAM
🌟 Genesis — платформа физического моделирования! 🚀

Genesis объединяет в себе невероятно мощный физический движок, фотореалистичную графику и умный генератор данных. Вот что она умеет:
🔹 Универсальное моделирование материалов и явлений 🏗️
🔹 Полностью интерактивные 3D-сцены 🎮
🔹 Динамическая генерация видео и данных 📹
🔹 Целый спектр движений для людей и животных 🏃‍♂️🐾

И это только начало! Открыт исходный код движка и платформы для всех 🌐. Genesis оптимизирована для быстрейшей симуляции благодаря GPU-ускорению и параллельным вычислениям.

Скорость достигает до 43 миллионов FPS — это в 430,000 раз быстрее реального времени! Очередное обновление не за горами. 🌄

#Genesis #AI #НейронныеСети #Робототехника #Технологии