Forwarded from Loskir's
🛒 Большое обновление Price Monitor!
• Агрегация цен из нескольких магазинов. Теперь показываются цены не только из Глобуса, но и из Ленты! Поддержка других магазинов — в планах
• Редизайн страницы товара. Сравнивайте цены в разных магазинах, смотрите историю цен на графике, узнавайте информацию о сроках действия скидок.
• Обновлённый сканер штрих-кодов. Распознаёт лучше, работает быстрее.
• Новый домен 😏
Попробуйте сами: pricemonit.ru/product/000000000000355946_ST
• Агрегация цен из нескольких магазинов. Теперь показываются цены не только из Глобуса, но и из Ленты! Поддержка других магазинов — в планах
• Редизайн страницы товара. Сравнивайте цены в разных магазинах, смотрите историю цен на графике, узнавайте информацию о сроках действия скидок.
• Обновлённый сканер штрих-кодов. Распознаёт лучше, работает быстрее.
• Новый домен 😏
Попробуйте сами: pricemonit.ru/product/000000000000355946_ST
Forwarded from Мишин Лернинг
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 IMAGEN VIDEO — Диффузии уже не остановить!
tl;dr
Помните Make-A-Video от MetaAI? Так вот — забудьте! Команда Google Brain только что создало лучшее Text-to-Video решение!
Если вкратце, то это имагеновый гомолог далишного Make-A-Video 🤖
Ну, а если чуть подробнее:
— Text Prompt подается в T5 энкодер
— Затем Base Model (5.6B ❤️) диффузит 16 кадров 40x24 pix в скромных 3 fps
— Затем темпоральный апсемплер TSR (1.7B) делает 32 кадра 40x24pix уже в 6 fps
— И пространственный апскейлер SSR-1 (1.4B) готовит предыдущие 32 кадра в разрешении 80x48 pix, и сразу второй SSR-2 (1.2B) делает 320x192
— Затем следуют еще два стейджа временного и один каскад пространственного суперреза и в итоге мы получаем 128 кадров в разрешении 1280x768 в 24fps
Основной фишкой такого подхода является Video U-Net — архитектура, пространственные операции которого выполняются независимо
по кадрам с общими параметрами (батч X время, высота, ширина, каналы), тогда как временная операции сработают уже на всему 5D тензору (батч, время, высота, ширина, каналы).
Сделаю потом более подробный пост, а пока рекомендую всем посмотреть результаты на сайте проекта!
🚀 Imagen Video
📄 paper
🤖 мишин лернинг
tl;dr
Помните Make-A-Video от MetaAI? Так вот — забудьте! Команда Google Brain только что создало лучшее Text-to-Video решение!
Если вкратце, то это имагеновый гомолог далишного Make-A-Video 🤖
Ну, а если чуть подробнее:
— Text Prompt подается в T5 энкодер
— Затем Base Model (5.6B ❤️) диффузит 16 кадров 40x24 pix в скромных 3 fps
— Затем темпоральный апсемплер TSR (1.7B) делает 32 кадра 40x24pix уже в 6 fps
— И пространственный апскейлер SSR-1 (1.4B) готовит предыдущие 32 кадра в разрешении 80x48 pix, и сразу второй SSR-2 (1.2B) делает 320x192
— Затем следуют еще два стейджа временного и один каскад пространственного суперреза и в итоге мы получаем 128 кадров в разрешении 1280x768 в 24fps
Основной фишкой такого подхода является Video U-Net — архитектура, пространственные операции которого выполняются независимо
по кадрам с общими параметрами (батч X время, высота, ширина, каналы), тогда как временная операции сработают уже на всему 5D тензору (батч, время, высота, ширина, каналы).
Сделаю потом более подробный пост, а пока рекомендую всем посмотреть результаты на сайте проекта!
🚀 Imagen Video
📄 paper
🤖 мишин лернинг
Look at this, вчерашние эксперименты становятся сегодняшними инструментами
https://3dnews.ru/1075677/microsoft-predstavila-designer-prilogenie-dlya-sozdaniya-izobrageniy-po-tekstovomu-opisaniyu-na-osnove-iisistemi-dalle
https://3dnews.ru/1075677/microsoft-predstavila-designer-prilogenie-dlya-sozdaniya-izobrageniy-po-tekstovomu-opisaniyu-na-osnove-iisistemi-dalle
3DNews - Daily Digital Digest
Все самое интересное из мира IT-индустрии
Самые интересные и оперативные новости из мира высоких технологий. На нашем портале - все о компьютерном железе, гаджетах, ноутбуках и других цифровых устройствах. А также обзоры новых игр, достижения современной науки и самые любопытные онлайн-проекты.
Forwarded from AI для Всех
Нейрокомпрессия звука
Сжатие является важной частью современного Интернета, поскольку оно позволяет людям легко обмениваться высококачественными фотографиями, прослушивать аудиосообщения, транслировать любимые передачи и многое другое.
Сегодня, исследователи из Мета совершили прорыв в области гиперкомпрессии аудио с помощью ИИ. Представьте себе, что вы слушаете аудиосообщение друга в районе с низким качеством связи, а оно не тормозит и не глючит.
Они создали трехкомпонентную систему и обучили ее сжимать аудиоданные до заданного размера. Затем эти данные могут быть декодированы с помощью нейронной сети.
Они добились примерно 10-кратной степени сжатия по сравнению с MP3 при 64 кбит/с без потери качества. Хотя подобные методы уже применялись для речи, они первыми применили их для стереофонического аудио с частотой дискретизации 48 кГц (т.е. качество CD), которое является стандартом для распространения музыки.
Pied Piper только что стал реальностью, более того - опенсорсной.
🦦 Блог-пост
📖 Статья
🤤 Код
Сжатие является важной частью современного Интернета, поскольку оно позволяет людям легко обмениваться высококачественными фотографиями, прослушивать аудиосообщения, транслировать любимые передачи и многое другое.
Сегодня, исследователи из Мета совершили прорыв в области гиперкомпрессии аудио с помощью ИИ. Представьте себе, что вы слушаете аудиосообщение друга в районе с низким качеством связи, а оно не тормозит и не глючит.
Они создали трехкомпонентную систему и обучили ее сжимать аудиоданные до заданного размера. Затем эти данные могут быть декодированы с помощью нейронной сети.
Они добились примерно 10-кратной степени сжатия по сравнению с MP3 при 64 кбит/с без потери качества. Хотя подобные методы уже применялись для речи, они первыми применили их для стереофонического аудио с частотой дискретизации 48 кГц (т.е. качество CD), которое является стандартом для распространения музыки.
Pied Piper только что стал реальностью, более того - опенсорсной.
🦦 Блог-пост
📖 Статья
🤤 Код
Forwarded from Борис опять
Например, очень интересная параллель: ML сейчас очень похож на телеграф в ~1870 годы.
Сходства:
* Телеграф уже существовал, выполнял важные функции и зарабатывал много денег, но все это не было построенно на какой-то стройной теории. Телеграф был, а науки об электричестве не было. Например, методом тыка догадались, что скрученный провод почему-то хуже проводит сигнал, но про явление интерференции не знали. Весь прогресс был построен на том, что энтузиасты перебирали кучу идей и смотрели, что работает. Во многом у нас в ML так же: в первую очередь эксперименты, а теории нормальной нет. Но у нас есть преимущество: научный метод давно изобрели, нам должно быть легче.
* Многие изобретатели и компании богатели просто адаптируя телеграф под разные запросы. Например, сделали систему автоматического подсчета голосов подключив телеграф к кнопкам на столах конгрессменов. С ML так же: корневая технология известна, вопрос где и как применить.
* Каждые пять минут выходили новые патенты, где в телеграфе что-то немного подкручивали и он становился чуть-чуть лучше. В ML каждые пять минут выходят статьи, где к модели прикрутили новый слой или лосс и она стала на 0.001% лучше. И там, и там почти все эти свистки не меняют ситуации в корне. Однако в случае телеграфа они в конце-концов накопились и произошла смена парадигмы (quadruplex телеграф, а потом и телефон). Наверняка так будет и в ML.
* Вся индустрия контроллировалась двумя-тремя корпорациями-гигантами, потому что строить такие системы и проводить эксперименты требовало больших вложений. Корпорации нанимали лучших ученых-изобретателей совершенствовать свои технологии, а так же выкупали за большие деньги компании изобретателей-фрилансеров. Часто лишь даже ради того, чтобы они не достались конкурентам.
Сходства:
* Телеграф уже существовал, выполнял важные функции и зарабатывал много денег, но все это не было построенно на какой-то стройной теории. Телеграф был, а науки об электричестве не было. Например, методом тыка догадались, что скрученный провод почему-то хуже проводит сигнал, но про явление интерференции не знали. Весь прогресс был построен на том, что энтузиасты перебирали кучу идей и смотрели, что работает. Во многом у нас в ML так же: в первую очередь эксперименты, а теории нормальной нет. Но у нас есть преимущество: научный метод давно изобрели, нам должно быть легче.
* Многие изобретатели и компании богатели просто адаптируя телеграф под разные запросы. Например, сделали систему автоматического подсчета голосов подключив телеграф к кнопкам на столах конгрессменов. С ML так же: корневая технология известна, вопрос где и как применить.
* Каждые пять минут выходили новые патенты, где в телеграфе что-то немного подкручивали и он становился чуть-чуть лучше. В ML каждые пять минут выходят статьи, где к модели прикрутили новый слой или лосс и она стала на 0.001% лучше. И там, и там почти все эти свистки не меняют ситуации в корне. Однако в случае телеграфа они в конце-концов накопились и произошла смена парадигмы (quadruplex телеграф, а потом и телефон). Наверняка так будет и в ML.
* Вся индустрия контроллировалась двумя-тремя корпорациями-гигантами, потому что строить такие системы и проводить эксперименты требовало больших вложений. Корпорации нанимали лучших ученых-изобретателей совершенствовать свои технологии, а так же выкупали за большие деньги компании изобретателей-фрилансеров. Часто лишь даже ради того, чтобы они не достались конкурентам.
Forwarded from я обучала одну модель
Еще одно из внезапных умений новой Midjourney V4 – очень крутой пиксель-арт
Forwarded from Ivan Begtin (Ivan Begtin)
Иногда поражает какие стартапы получают финансирование, например, стартап OneSchema [1] автоматизирует загрузку и проверку CSV файлов. Основатели позиционируют свой продукт как the embeddable CSV importer for developers и получили недавно $6.3 миллиона инвестиций от нескольких венчурных фондов.
Лично мне эта задача всегда казалась слишком маленькой чтобы её стоило или было бы важно автоматизировать. Но, нет, оказывается венчурные фонды думают иначе.
Это хороший пример небольшого, но очень точного продукта для работы с данными решающего очень узкую задачу и оказавшегося востребованным.
Ссылки:
[1] https://www.oneschema.co
[2] https://www.oneschema.co/blog/oneschema-announces-6m-fundraise
#datatools #startups #data #csv
Лично мне эта задача всегда казалась слишком маленькой чтобы её стоило или было бы важно автоматизировать. Но, нет, оказывается венчурные фонды думают иначе.
Это хороший пример небольшого, но очень точного продукта для работы с данными решающего очень узкую задачу и оказавшегося востребованным.
Ссылки:
[1] https://www.oneschema.co
[2] https://www.oneschema.co/blog/oneschema-announces-6m-fundraise
#datatools #startups #data #csv
Forwarded from Ivan Begtin (Ivan Begtin)
В StackOverflow, сервисе вопросов и ответов, изначально для инженеров и программистов, запретили использование ChatGPT [1]. Пока временно, а там будет видно․ Главная причина в том что ChatGPT генерирует ответы которые выглядят как хорошие, а на самом деле не так уже хороши, а то и плохи.
А вот у Бена Томпсона в блоге пост AI Homework [2] о последствиях применения ChatGPT в некоторых областях, в частности в школе и студентами.
На всякий случай напомню что ChatGPT это свежий движок по генерации ответов и поддержания разговора
от команды которая делала языковую модель GPT-3. Его особенность в высокой осмысленности ответов, которые, даже если неверны, начинают походить на осмысленный диалог. У ChatGPT меньше чем за неделю уже более 1 миллиона пользователей, так что мы ещё немало услышим и о самом продукте и о том что в ближайшие месяцы будет появляться на его основе․
Ссылки։
[1] https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
[2] https://stratechery.com/2022/ai-homework/
#ai #startups
А вот у Бена Томпсона в блоге пост AI Homework [2] о последствиях применения ChatGPT в некоторых областях, в частности в школе и студентами.
На всякий случай напомню что ChatGPT это свежий движок по генерации ответов и поддержания разговора
от команды которая делала языковую модель GPT-3. Его особенность в высокой осмысленности ответов, которые, даже если неверны, начинают походить на осмысленный диалог. У ChatGPT меньше чем за неделю уже более 1 миллиона пользователей, так что мы ещё немало услышим и о самом продукте и о том что в ближайшие месяцы будет появляться на его основе․
Ссылки։
[1] https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
[2] https://stratechery.com/2022/ai-homework/
#ai #startups
Meta Stack Overflow
Policy: Generative AI (e.g., ChatGPT) is banned
Moderator Note: This post has been locked to prevent comments because people have been using them for protracted debate and discussion (we've deleted over 300 comments on this post alone, not even
Forwarded from Нейросети и Блендер
Немного размышлений
Хочу просто напомнить, мы сейчас находимся в той части реальности, где арты генерятся за 10 минут, а текст для них генерирует chatGPT при указании только фраз - "уникальный, невероятный арт с.."
Тем временем новая текстовая модель умеет правильно симулировать не только виртуальную машину и обращаться внутри машины в инет, который она создает на основе своего датасета, но и делать более приземленные вещи - анализируя паблик в тг предлагать вам новые посты и писать их в вашем стиле.
С помощью chatGPT без знания JavaScript получилось даже создать генарт на p5js. И тем временем с момента релиза модели не прошло и недели.
Нас ждет максимально интересное будущее.
Хочу просто напомнить, мы сейчас находимся в той части реальности, где арты генерятся за 10 минут, а текст для них генерирует chatGPT при указании только фраз - "уникальный, невероятный арт с.."
Тем временем новая текстовая модель умеет правильно симулировать не только виртуальную машину и обращаться внутри машины в инет, который она создает на основе своего датасета, но и делать более приземленные вещи - анализируя паблик в тг предлагать вам новые посты и писать их в вашем стиле.
С помощью chatGPT без знания JavaScript получилось даже создать генарт на p5js. И тем временем с момента релиза модели не прошло и недели.
Нас ждет максимально интересное будущее.