▪Видео
▪Код из видео
▪Упражнения по Numpy
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍4🔥1
▪Видео
▪Код из видео
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2👎1🔥1
Примите участие в AI Challenge - международном конкурсе по искусственному интеллекту для молодежи от Сбера
Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.
Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.
Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.
Зарегистрироваться можно прямо сейчас на сайте конкурса.
Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.
Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.
Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.
Зарегистрироваться можно прямо сейчас на сайте конкурса.
🦙TinyLlama-1.1B
Проект TinyLlama для предварительно обученых моделей Llama 1,1 млрд- 3 трлн. токенов.
TinyLlama использует точно такую же архитектуру и токенизатор, как и в Llama 2. Это означает, что TinyLlama может быть подключена и работать во открытых проектах, построенных на базе Llama. Ее компактность позволяет использовать модель во множестве приложений, с ограниченным объемом вычислений и памяти.
▪Github
@machinelearning_ru
Проект TinyLlama для предварительно обученых моделей Llama 1,1 млрд- 3 трлн. токенов.
TinyLlama использует точно такую же архитектуру и токенизатор, как и в Llama 2. Это означает, что TinyLlama может быть подключена и работать во открытых проектах, построенных на базе Llama. Ее компактность позволяет использовать модель во множестве приложений, с ограниченным объемом вычислений и памяти.
▪Github
@machinelearning_ru
🔥10❤2👍1
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю
Почитать:
— Machine Learning: хорошая подборка книг для начинающего специалиста
— Как понять, что клиента пора реактивировать?
— Книга «Математика в машинном обучении»
— Что нового в Pandas 2.1
— Готовые скрипты Python
— Влад Грозин о PhD в США, философии в Data Science, пузыре рекомендаций и голодающих геймерах
— Руководство по масштабированию MLOps
— Чем мы можем заменить тест Тьюринга
— Как (быстро) сделать русский локальный ChatGPT
— «SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)
— LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?
— YandexGPT 2 — большое обновление языковой модели Яндекса
— Deploying Apps on Render
— Mastering ZIP File Handling in Python: Reading and Creating Zip Archives
— The Minion Game - HackerRank Solution Python
— Iterables and Iterators - HackerRank Solution Python
— Regex Substitution - HackerRank Solution Python
— How to Solve the "No Idea!" Challenge in Python
— 🌐 UN Goals : Education & Gender Equity ⚖️
— Starting my Journey in Open Source
— Created a toggle_state_button with PyQt5
— Accelerating Releases with Pulumi: My Proxy Project Journey
Посмотреть:
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” (⏱ 58:40)
🌐 Introduction to Generative Art with Stable Diffusion, presented by HP Inc - Hunter Kempf (⏱ 43:48)
🌐 Emerging Approaches to AI Governance: Tech-Led vs Policy-Led - Ilana Golbin (⏱ 44:36)
Хорошего дня!
@machinelearning_ru
Почитать:
— Machine Learning: хорошая подборка книг для начинающего специалиста
— Как понять, что клиента пора реактивировать?
— Книга «Математика в машинном обучении»
— Что нового в Pandas 2.1
— Готовые скрипты Python
— Влад Грозин о PhD в США, философии в Data Science, пузыре рекомендаций и голодающих геймерах
— Руководство по масштабированию MLOps
— Чем мы можем заменить тест Тьюринга
— Как (быстро) сделать русский локальный ChatGPT
— «SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)
— LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?
— YandexGPT 2 — большое обновление языковой модели Яндекса
— Deploying Apps on Render
— Mastering ZIP File Handling in Python: Reading and Creating Zip Archives
— The Minion Game - HackerRank Solution Python
— Iterables and Iterators - HackerRank Solution Python
— Regex Substitution - HackerRank Solution Python
— How to Solve the "No Idea!" Challenge in Python
— 🌐 UN Goals : Education & Gender Equity ⚖️
— Starting my Journey in Open Source
— Created a toggle_state_button with PyQt5
— Accelerating Releases with Pulumi: My Proxy Project Journey
Посмотреть:
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” (⏱ 58:40)
🌐 Introduction to Generative Art with Stable Diffusion, presented by HP Inc - Hunter Kempf (⏱ 43:48)
🌐 Emerging Approaches to AI Governance: Tech-Led vs Policy-Led - Ilana Golbin (⏱ 44:36)
Хорошего дня!
@machinelearning_ru
👍9❤1
Анализ данных и машинное обучение в облаке
Если вам не хватает мощностей собственного компьютера для разработки модели машинного обучения, у вас краткосрочный проект, для которого нецелесообразно покупать мощные видеокарты, или вы хотели бы собрать небольшую платформу обработки данных, используйте Data Analytics Virtual Machine.
В чем преимущества Data Analytics Virtual Machine в @Selectel:
◽Это виртуальные серверы с предустановленным набором инструментов для анализа данных, BI и машинного обучения. Решение подойдет для небольших команд и стартапов и поможет с хранением, обработкой, анализом и визуализацией данных.
◽Вам не придется тратить время на установку драйверов для видеокарты, Python и библиотек для работы с ML. Все компоненты предустановлены, сервер разворачиватся из образа и сразу готов к работе.
◽ Отсутствие vendor lock-in. Решение построено на базе Open Source инструментов: Jupyter, Prefect, Apache Superset. Вы платите только ресурсы облака по модели pay-as-you-go.
Арендовать готовый сервер и узнать больше о решении можно по ссылке: https://slc.tl/nh4l6
Реклама ООО «Селектел» 2VtzquuEHM2
Если вам не хватает мощностей собственного компьютера для разработки модели машинного обучения, у вас краткосрочный проект, для которого нецелесообразно покупать мощные видеокарты, или вы хотели бы собрать небольшую платформу обработки данных, используйте Data Analytics Virtual Machine.
В чем преимущества Data Analytics Virtual Machine в @Selectel:
◽Это виртуальные серверы с предустановленным набором инструментов для анализа данных, BI и машинного обучения. Решение подойдет для небольших команд и стартапов и поможет с хранением, обработкой, анализом и визуализацией данных.
◽Вам не придется тратить время на установку драйверов для видеокарты, Python и библиотек для работы с ML. Все компоненты предустановлены, сервер разворачиватся из образа и сразу готов к работе.
◽ Отсутствие vendor lock-in. Решение построено на базе Open Source инструментов: Jupyter, Prefect, Apache Superset. Вы платите только ресурсы облака по модели pay-as-you-go.
Арендовать готовый сервер и узнать больше о решении можно по ссылке: https://slc.tl/nh4l6
Реклама ООО «Селектел» 2VtzquuEHM2
This media is not supported in your browser
VIEW IN TELEGRAM
Библиотека, которая позволяет создавать графы, настраивать размер нодов, их цвет и прочие характеристики:
Если вам необходимо создать интерактивный граф в нескольких строках кода на языке Python, используйте Pyvis.
▪Github
▪Docs
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤2🔥1
CodeFuse-MFTCoder - это проект CodeFuse с открытым исходным кодом для многозадачной Code-LLMs (
▪Github
@machinelearning_ru
large language model for code tasks), включающий модели, наборы данных, код и руководства по работе.▪Github
@machinelearning_ru
❤3👍3🔥2
FlexiTech.ai — российская команда профессионалов по разработке решений на базе AI и ML, применяющая инновационные технологии. В портфолио вы найдете задачи любой сложности, среди них: внедрение рекомендательных систем, атрибуция товара, распознавание и классификация изображений, изменение фона на изображении с товаром, предсказание спроса, а также обработка текстов на естественном языке.
Команда обладает большим опытом интеграции AI решений непосредственно в ваш pipeline с учетом вашего технологического стека.
🌐 Специалисты FlexiTech.ai обладают широкой экспертизой в разных сферах и всегда в курсе мировых тенденций,
💡Используемые передовые алгоритмы, делают сложные задачи быстрыми и легкими.
🏆 Реализованные интеллектуальные рабочие процессы увеличивают производительность и снижают издержки крупнейших предприятий в eCommerce, Retail, FinTech, EdTech и других отраслях.
Обращайтесь к @Flexitech_ai и сделайте свою команду больше, быстрее и эффективнее!
Команда обладает большим опытом интеграции AI решений непосредственно в ваш pipeline с учетом вашего технологического стека.
🌐 Специалисты FlexiTech.ai обладают широкой экспертизой в разных сферах и всегда в курсе мировых тенденций,
💡Используемые передовые алгоритмы, делают сложные задачи быстрыми и легкими.
🏆 Реализованные интеллектуальные рабочие процессы увеличивают производительность и снижают издержки крупнейших предприятий в eCommerce, Retail, FinTech, EdTech и других отраслях.
Обращайтесь к @Flexitech_ai и сделайте свою команду больше, быстрее и эффективнее!
🔥5❤2👍1
Efficient Controllable Generation for SDXL with T2I-Adapters
T2I-Adapter - это эффективная подключаемая модель, которая обеспечивает дополнительные настройки для предварительно обученных моделей "текст-изображение".
В этом вопросе T2I-адаптеры имеют конкурентное преимущество перед ControlNets. T2I-адаптеры имеют меньший размер, и, в отличие от ControlNets, T2I-адаптеры запускаются всего один раз.
• Руководство
@machinelearning_ru
T2I-Adapter - это эффективная подключаемая модель, которая обеспечивает дополнительные настройки для предварительно обученных моделей "текст-изображение".
В этом вопросе T2I-адаптеры имеют конкурентное преимущество перед ControlNets. T2I-адаптеры имеют меньший размер, и, в отличие от ControlNets, T2I-адаптеры запускаются всего один раз.
• Руководство
@machinelearning_ru
👍5❤4🔥1
• Видео
• Код из видео
• Часть 1
• Часть 2
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥2👍1
🔊Stable Audio: продвинутая нейросеть для генерации музыки и звука из текста от Stability AI
Stability AI выпустили Stable Audio — нейросеть для создания музыки и звуков по текстовой подсказке заданной пользователем длины. Stable Audio способна генерировать 95 секунд стереоаудио с частотой дискретизации 44,1 кГц менее чем за одну секунду на графическом процессоре NVIDIA A100. Работа с сильно уменьшенным скрытым представлением аудиозаписей по сравнению с оригинальными записями значительно сократило время вывода модели. Это первая нейросеть от Stability AI для генерации музыки.
📌Проект
@machinelearning_ru
Stability AI выпустили Stable Audio — нейросеть для создания музыки и звуков по текстовой подсказке заданной пользователем длины. Stable Audio способна генерировать 95 секунд стереоаудио с частотой дискретизации 44,1 кГц менее чем за одну секунду на графическом процессоре NVIDIA A100. Работа с сильно уменьшенным скрытым представлением аудиозаписей по сравнению с оригинальными записями значительно сократило время вывода модели. Это первая нейросеть от Stability AI для генерации музыки.
📌Проект
@machinelearning_ru
❤6👍1
Бывает, что написали код, а он долго отрабатывает, хотя делает все верно. В таком случае предлагаем провести профилирование программы и заглянуть в стек вызовов.
Процесс профилирования кода – сбор характеристик работы программы, таких как время выполнения отдельных фрагментов, число верно предсказанных переходов и т.д. Использование данного инструмента поможет нам увидеть скрытые проблемы в коде, и подскажет, на что необходимо обратить внимание в первую очередь.
Для профилирования кода разработано множество инструментов на различных языках программирования, например, CProfiler, но в рамках данной публикации мы использовали YAPPI (Yet Another Python Profiler) – библиотека для профилирования кода с поддержкой многопоточности и асинхронности, разработанная на языке программирования С.
Yappi обладает наиболее гибким API, позволяющим профилировать как весь код, так и отдельные его части. Одним из преимуществ выбранной нами библиотеки является ее доступность во внутренней сети банка. Более подробно о данной библиотеке, вы можете узнать, из документации по ссылке.
Используя данную библиотеку, мы построим отчет о работе программы и визуализируем его для наглядности.
Визуализацию отчета проведем при помощи библиотеки gprof2dot. Выбранная нами библиотека является одной из не многих, кто может проводить визуализацию стека вызовов.
К недостаткам данной библиотеки можно отнести неспособность прорисовать весь граф стека вызовов, в случае, когда он очень длинный.
Однако этот недостаток легко нивелируется преимуществами, которые предоставляет библиотека:
▪️чтение большого числа форматов файлов профилировщиков;
▪️обрезка узлов и ребер ниже определенного порога;
▪️эффективное использование цветов для привлечения внимания к «особенным точкам»;
▪️работа на любой платформе, где присутствует Python и Graphviz.
Доступность данной библиотеки во внутренней сети банка добавляет ей еще один плюс в карму. Для более детального знакомства с данной библиотекой, предлагаем пройти по ссылке.
Посмотрим применение этих библиотек на практике.
📌Читать
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1
📌 Обучение нейросети, которая создаёт субтитры в видеоплеере любого сайта
Яндекс Браузер представил встроенную нейросеть, генерирующую субтитры ко всем русскоязычным видео в интернете, в том числе на сайтах, на которых владелец это не предусмотрел. Это нужная фича для тех, кто плохо слышит или просто забыл наушники. Работает всё это для Windows, macOS и Linux.
При этом разработчики добились, чтобы нейросеть потребляла в 5 раз меньше оперативной памяти: с 800 Мб до 150 Мб. Например, разделив архитектуру модели на две независимые части, они получили ускорение свёрток больше чем в 5 раз и экономию оперативной памяти больше чем в 3 раза (30 Мб → 8 Мб). Также было решено выделять общий префикс в явном виде, после чего удалось сохранить ещё более 400 Мб.
При этом разработчики оставили realtime on-device инференс (с обновлением раз в 600 мс в одном потоке), не потеряв в качестве по сравнению с серверным решением.
Процесс разработки команда описала в статье на Хабре.
@machinelearning_ru
Яндекс Браузер представил встроенную нейросеть, генерирующую субтитры ко всем русскоязычным видео в интернете, в том числе на сайтах, на которых владелец это не предусмотрел. Это нужная фича для тех, кто плохо слышит или просто забыл наушники. Работает всё это для Windows, macOS и Linux.
При этом разработчики добились, чтобы нейросеть потребляла в 5 раз меньше оперативной памяти: с 800 Мб до 150 Мб. Например, разделив архитектуру модели на две независимые части, они получили ускорение свёрток больше чем в 5 раз и экономию оперативной памяти больше чем в 3 раза (30 Мб → 8 Мб). Также было решено выделять общий префикс в явном виде, после чего удалось сохранить ещё более 400 Мб.
При этом разработчики оставили realtime on-device инференс (с обновлением раз в 600 мс в одном потоке), не потеряв в качестве по сравнению с серверным решением.
Процесс разработки команда описала в статье на Хабре.
@machinelearning_ru
👍7🔥3❤1
OpenAI’s ChatGPT Nails 150+ Difficult Tasks!
https://www.youtube.com/watch?v=9o_hFlsfaBI
@machinelearning_ru
https://www.youtube.com/watch?v=9o_hFlsfaBI
@machinelearning_ru
YouTube
OpenAI’s ChatGPT Nails 150+ Difficult Tasks!
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "Reflexion: Language Agents with Verbal Reinforcement Learning" is available here:
https://arxiv.org/abs/2303.11366
Video editing: https://twitter.com/g…
📝 The paper "Reflexion: Language Agents with Verbal Reinforcement Learning" is available here:
https://arxiv.org/abs/2303.11366
Video editing: https://twitter.com/g…
❤4🔥1
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю
Почитать:
— Разработка систем генеративного ИИ на базе ML Platform: создаем конкурента ChatGPT без миллионных инвестиций
— Создание приложения для потоковой передачи видео с физическими элементами управления
— Создаём субтитры для любого видео в интернете с помощью нейросети в браузере
— Тестирование производительности на Python: Пошаговое руководство с Flask
— Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях
— DVC — прекрасный инструмент для DataScience
— Как мы создали нейросеть, которая составила рейтинг компаний, занимающихся ИИ в России
— Узнайте, как создать аудиоприложение LangChain на Python всего за 5 минут!
— Dream Booth — очень умное дообучение stable diffusion
— LlamaIndex: создаем чат-бота без боли и страданий. Часть 3
— Есть один нюанс: как мы спасаем нейросети от классификации неоднозначных текстов
— Как machine learning улучшает рекомендации по каталогу сайта на 80%. Повышаем эффективность collaborative filtering
— Short-circuiting
— Tuple Immutability
— How Does Nerve Regen Formula Work?
— Code Review - The foundation for quality software
— Trying to bridge the gap between WFC “Even Simpler Tiled Model” and Constraint Satisfaction Problem (CSP) propositional rules
— Code review - a unique way of debugging
— Automating Product Descriptions in Odoo with OpenAI's GPT-3 and Python
— Creating Own Chat GPT
— Elastic D&D - Week 4 - Text Note Input
— Scenario-Based Testing with Vedro
Посмотреть:
🌐 ODSC Webinar | A Path to Insights Starts with Trusted Data (⏱ 23:23)
🌐 Not Just Deep Fakes: Apps of Visual Generative Models in Pharma Manufacturing - Guglielmo Iozzia (⏱ 01:18:40)
🌐 Leveraging Generative AI in Education - A M Aditya (⏱ 31:24)
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” (⏱ 58:40)
Хорошего дня!
@machinelearning_ru
Почитать:
— Разработка систем генеративного ИИ на базе ML Platform: создаем конкурента ChatGPT без миллионных инвестиций
— Создание приложения для потоковой передачи видео с физическими элементами управления
— Создаём субтитры для любого видео в интернете с помощью нейросети в браузере
— Тестирование производительности на Python: Пошаговое руководство с Flask
— Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях
— DVC — прекрасный инструмент для DataScience
— Как мы создали нейросеть, которая составила рейтинг компаний, занимающихся ИИ в России
— Узнайте, как создать аудиоприложение LangChain на Python всего за 5 минут!
— Dream Booth — очень умное дообучение stable diffusion
— LlamaIndex: создаем чат-бота без боли и страданий. Часть 3
— Есть один нюанс: как мы спасаем нейросети от классификации неоднозначных текстов
— Как machine learning улучшает рекомендации по каталогу сайта на 80%. Повышаем эффективность collaborative filtering
— Short-circuiting
— Tuple Immutability
— How Does Nerve Regen Formula Work?
— Code Review - The foundation for quality software
— Trying to bridge the gap between WFC “Even Simpler Tiled Model” and Constraint Satisfaction Problem (CSP) propositional rules
— Code review - a unique way of debugging
— Automating Product Descriptions in Odoo with OpenAI's GPT-3 and Python
— Creating Own Chat GPT
— Elastic D&D - Week 4 - Text Note Input
— Scenario-Based Testing with Vedro
Посмотреть:
🌐 ODSC Webinar | A Path to Insights Starts with Trusted Data (⏱ 23:23)
🌐 Not Just Deep Fakes: Apps of Visual Generative Models in Pharma Manufacturing - Guglielmo Iozzia (⏱ 01:18:40)
🌐 Leveraging Generative AI in Education - A M Aditya (⏱ 31:24)
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” (⏱ 58:40)
Хорошего дня!
@machinelearning_ru
👍4🔥4🥰1
Media is too big
VIEW IN TELEGRAM
📌 Видео
📌 Код и полезные ресурсы
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3🔥1