Наткнулся на упоминание WeWork в списке компаний, которые потерпели крах, а я был не в курсе. Решил по-быстрому выяснить что да как. GPT-4 за считанные секунды разложил по полочкам, что с компанией и менеджментом было не так — уже много времени сэкономил. В довесок ещё и рассказал, что можно было бы улучшить в компании, чтобы она стала процветающей. Понятно, что не всё так просто, но уже что-то.
GPT-4 на пост нового CEO WeWork.
GPT-4 на пост нового CEO WeWork.
Спиритический сеанс удался, с нами Адам Нейман! Положил ему на стол отчет GPT-4 и он ответствовал в традиционной для стартаперов манере. Можете попробовать его сами что-то спросить, пока его нейродуша ещё с нами.
https://sl.bing.net/iWLUEfqJUVE
https://sl.bing.net/iWLUEfqJUVE
MeshDiffusion — новая модель для генерации 3D по промту на основе SD.
* Может генерить трёхмерные меши даже объектов, которые видно не полностью (додумает чего не достаёт)
* Использует шум для интерполирования и изменения формы объектов
* Можно применить текстуры о TEXTure
Страница проекта
Код
* Может генерить трёхмерные меши даже объектов, которые видно не полностью (додумает чего не достаёт)
* Использует шум для интерполирования и изменения формы объектов
* Можно применить текстуры о TEXTure
Страница проекта
Код
This media is not supported in your browser
VIEW IN TELEGRAM
LERF (Language Embedded Radiance Fields) — Подписывание и поиск объектов в NeRF.
Работает на 3D CLIP эмбедингах. Текстовый поиск можно делать в реальном времени. Нет необходимости в масках и файнтюне. Тут примеры, в которых можно вкл/выкл LERF, чтобы посмотреть как выглядит NeRF с подписями и без.
Есть пример использования LERF в связке с ChatGPT для интеграции с роботом уборщиком.
Выглядит прям production-ready. Уже вижу как у рекламщиков слюнки текут использовать это в своём пайплайне. Кстати напомнило эту рекламу Philips 2008 года.
Сайт
Код (будет внедрен в Nerfstudio)
Бумага
Работает на 3D CLIP эмбедингах. Текстовый поиск можно делать в реальном времени. Нет необходимости в масках и файнтюне. Тут примеры, в которых можно вкл/выкл LERF, чтобы посмотреть как выглядит NeRF с подписями и без.
Есть пример использования LERF в связке с ChatGPT для интеграции с роботом уборщиком.
Выглядит прям production-ready. Уже вижу как у рекламщиков слюнки текут использовать это в своём пайплайне. Кстати напомнило эту рекламу Philips 2008 года.
Сайт
Код (будет внедрен в Nerfstudio)
Бумага
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI выпустили инструмент Reimagine. Позволяет вкинуть картинку и тут же получить несколько её вариаций. Инструмент встроен в сервис Clipdrop, на котором изображение можно дальше редактировать: удалить фон, удалить нежелательные элементы, изменить освещение, повысить четкость или увеличить разрешение.
Сайт
Блог
Сайт
Блог
Forwarded from Playmuse RU
🔥Playmuse партнер Believe
Благодаря усилиям команды Playmuse Records и компетенции в дистрибуции медиаконтента у нас появился личный кабинет у французского дистрибьютора Believe.
Артисты, которые будут делать релизы через Playmuse Records, смогут попасть более чем на 200 стриминговых сервисов по всему миру, включая Spotify, Apple Music, YouTube Music, Amazon Music.
Выпустив треки через наш лейбл музыканты смогут получать роялти в TON. Это позволит максимально использовать функционал нашего маркетплейса! Так, привлекая поклонников с помощь NFT, артисты смогут разделить с ними роялти от стриминга своей музыки.
Благодаря усилиям команды Playmuse Records и компетенции в дистрибуции медиаконтента у нас появился личный кабинет у французского дистрибьютора Believe.
Артисты, которые будут делать релизы через Playmuse Records, смогут попасть более чем на 200 стриминговых сервисов по всему миру, включая Spotify, Apple Music, YouTube Music, Amazon Music.
Выпустив треки через наш лейбл музыканты смогут получать роялти в TON. Это позволит максимально использовать функционал нашего маркетплейса! Так, привлекая поклонников с помощь NFT, артисты смогут разделить с ними роялти от стриминга своей музыки.
Неделька выдалась интенсивная. Краткий обзор произошедшего:
Понедельник
Runway запустили модель для обработки видео GEN-1. Работает через бота в дискорде для ограниченного числа тестеров. Уже есть довольно интересные работы.
Сам тоже побаловался.
Alpaca 7B: народ из Стенфорда взял модель LLaMA и за ~$100 на восьми A100 80GB натренировал её до уровня уровня ответов GPT-3/ChatGPT. Кто-то в сообществе запустил это даже на телефоне и Raspberry Pi. Скоро можно будет тренить модель локально на своём датасете и придавать аватру личные характеристики, чтобы он за тебя зарабатывал.
Банки США полетели в ад, запуская тем самым крипту в космос.
Вторник
OpenAI выпустили GPT-4. Может обрабатывать за раз до 20 тыс символов; принимать на вход картинку и логически рассуждать о ней; буквально из наброска от руки собрать сайт в секунды; и многое другое, чего нам самим предстоит откопать. Выяснилось, что в Bing Chat последние 5 недель как раз и использовался GPT-4 оптимизированный под поиск.
Google релизнут AI-функционал для своего набора инструментов Workspace, что позволит: делать выжимки из Gmail писем/Google Docs/Sheets; автозаполнять письма/доки/презы; прочие интеграции последуют. Также они анонсировали API доступ к своей мульти-модальной нейронке PaLM, которая может работать с текстом, изображениями, видео, музыкой, кодом.
Antropic выпустили Claude, свою версию чат-бота, который доступен через API. Можно потестить в Notion, Quora, и DuckDuckGo, например. Кстати Google в них инвестировали.
Beatport анонсировали партнёрство с блокчейном Polkadot и парачейном Aventus для запуска маркетплейса Beatport.io. Сблизит артистов и слушателей и даст использовать NFT для получения ништяков.
Среда
Midjourney V5: детальность изображений поднялась на уровень профессиональных фото; артефактов типа лишних и пальцев и прочего практически нет; можно делать картинку с разным соотношением сторон. Изменился подход к промту: вместо набора слов теперь лучше писать целиком, что ты хочешь получить, словно ты общаешься с ChatGPT.
Четверг
Microsoft добавила AI в их набор инструментов Copilot. Тема такая же как с Google Workspace: нейронки будут помогать нам внутри ворда, экселя, почты и тд. Можно будет чатиться с коллегами выжимками из своих доков или вызывать их в переписку. Можно и просто задать нейронке вопрос: у меня что-то запланировано на вторник или о чем был разговор на созвоне с командой в прошлую пятницу?
Bing Chat стал открыт для всех (хотя у меня работает только через VPN) и появилась возможность делиться ответами нейронки с кем-угодно. Отвечать можно, есть аккаунт Microsoft (если стоит винда, то он у тебя есть)
Baidu презентовали, но не показали вживую, свой ответ ChatGPT под названием Ernie. Так как это было предзаписанное видео с тщательно отобранными ответами, особо это никого не впечатлило. Акции Baidu -10% в моменте.
Winamp выкатил доступ для артистов к своей новой платформе. Обещают: подписки аля Patreon; NFT; дистрибуцию; и не только. Есть интересные идеи по функционалу, но UX/UI пока сырой. Платформа станет открыта слушателям 15 апреля. Посмотрим.
Пятница
LERF: появилась возможность размечать в NeRF'ах объекты и искать их через тектстовый запрос.
Для Stable Diffusion вышел официальный инструмент Reimagine для однокнопочной генерации 4 вариаций картинки. А сообщество замутило модель с контролем объектов в композиции на уровне промта, плюс text-2-3D модель.
———————————————————-
На следующей неделе запуск новой фичи от Runway, конференция Nvidia GTC 20-23 марта, похоже анонсы от Stability AI, и новости по трене и запуску Alpaca на новых девайсах.
Понедельник
Runway запустили модель для обработки видео GEN-1. Работает через бота в дискорде для ограниченного числа тестеров. Уже есть довольно интересные работы.
Сам тоже побаловался.
Alpaca 7B: народ из Стенфорда взял модель LLaMA и за ~$100 на восьми A100 80GB натренировал её до уровня уровня ответов GPT-3/ChatGPT. Кто-то в сообществе запустил это даже на телефоне и Raspberry Pi. Скоро можно будет тренить модель локально на своём датасете и придавать аватру личные характеристики, чтобы он за тебя зарабатывал.
Банки США полетели в ад, запуская тем самым крипту в космос.
Вторник
OpenAI выпустили GPT-4. Может обрабатывать за раз до 20 тыс символов; принимать на вход картинку и логически рассуждать о ней; буквально из наброска от руки собрать сайт в секунды; и многое другое, чего нам самим предстоит откопать. Выяснилось, что в Bing Chat последние 5 недель как раз и использовался GPT-4 оптимизированный под поиск.
Google релизнут AI-функционал для своего набора инструментов Workspace, что позволит: делать выжимки из Gmail писем/Google Docs/Sheets; автозаполнять письма/доки/презы; прочие интеграции последуют. Также они анонсировали API доступ к своей мульти-модальной нейронке PaLM, которая может работать с текстом, изображениями, видео, музыкой, кодом.
Antropic выпустили Claude, свою версию чат-бота, который доступен через API. Можно потестить в Notion, Quora, и DuckDuckGo, например. Кстати Google в них инвестировали.
Beatport анонсировали партнёрство с блокчейном Polkadot и парачейном Aventus для запуска маркетплейса Beatport.io. Сблизит артистов и слушателей и даст использовать NFT для получения ништяков.
Среда
Midjourney V5: детальность изображений поднялась на уровень профессиональных фото; артефактов типа лишних и пальцев и прочего практически нет; можно делать картинку с разным соотношением сторон. Изменился подход к промту: вместо набора слов теперь лучше писать целиком, что ты хочешь получить, словно ты общаешься с ChatGPT.
Четверг
Microsoft добавила AI в их набор инструментов Copilot. Тема такая же как с Google Workspace: нейронки будут помогать нам внутри ворда, экселя, почты и тд. Можно будет чатиться с коллегами выжимками из своих доков или вызывать их в переписку. Можно и просто задать нейронке вопрос: у меня что-то запланировано на вторник или о чем был разговор на созвоне с командой в прошлую пятницу?
Bing Chat стал открыт для всех (хотя у меня работает только через VPN) и появилась возможность делиться ответами нейронки с кем-угодно. Отвечать можно, есть аккаунт Microsoft (если стоит винда, то он у тебя есть)
Baidu презентовали, но не показали вживую, свой ответ ChatGPT под названием Ernie. Так как это было предзаписанное видео с тщательно отобранными ответами, особо это никого не впечатлило. Акции Baidu -10% в моменте.
Winamp выкатил доступ для артистов к своей новой платформе. Обещают: подписки аля Patreon; NFT; дистрибуцию; и не только. Есть интересные идеи по функционалу, но UX/UI пока сырой. Платформа станет открыта слушателям 15 апреля. Посмотрим.
Пятница
LERF: появилась возможность размечать в NeRF'ах объекты и искать их через тектстовый запрос.
Для Stable Diffusion вышел официальный инструмент Reimagine для однокнопочной генерации 4 вариаций картинки. А сообщество замутило модель с контролем объектов в композиции на уровне промта, плюс text-2-3D модель.
———————————————————-
На следующей неделе запуск новой фичи от Runway, конференция Nvidia GTC 20-23 марта, похоже анонсы от Stability AI, и новости по трене и запуску Alpaca на новых девайсах.
This media is not supported in your browser
VIEW IN TELEGRAM
Text-2-Video гонка набирает обороты.
Появилась опенсорс диффузионная модель для синтеза видео из текста под названием ModelScope. Некоторые примеры прям напоминают Imagen от гугла или Make-a-Video от запрещенки. Вотермарк можно убрать инпейтингом в Runway, например. Кстати ждём, что последние там релизнут сегодня.
Демо
Github
Появилась опенсорс диффузионная модель для синтеза видео из текста под названием ModelScope. Некоторые примеры прям напоминают Imagen от гугла или Make-a-Video от запрещенки. Вотермарк можно убрать инпейтингом в Runway, например. Кстати ждём, что последние там релизнут сегодня.
Демо
Github
Подход к видео на завязке Stable Diffusion + ControlNet на скриптах тоже подрастает. Чувак запилил Криминальное чтиво в стиле мультиков Pixar.
Видео
Код
Видео
Код
YouTube
Pulp Fiction but it is Pixar animation movie
This is an example video of using ''Reference based SD+CN animation script'. You can find it here: https://github.com/volotat/Reference-based-SD-CN-Animation
You can follow me here to see more of my work:
Twitter: https://twitter.com/volotat
Github: ht…
You can follow me here to see more of my work:
Twitter: https://twitter.com/volotat
Github: ht…
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и text-2-video ответочка от Runway подъехала: GEN-2. Теперь можно генерить видео чисто промтом без опорного видео или изображения.
А ведь с момента запуска GEN-1 прошел почти месяц.... гонка AI просто дичайшая
Анонс
Дискорд Runway
А ведь с момента запуска GEN-1 прошел почти месяц.... гонка AI просто дичайшая
Анонс
Дискорд Runway
1930 vs 2023
Microsoft добавили в Bing возможность генерить картинки по описанию. Для запуска нужно в боковой панели Bing перейти в Image Creator, или в чате перейти в Креативный режим, и вбить контекст и желаемый стиль изображения. Под капотом улучшенная версия DALL-E, которая также в вотчине OpenAI.
Хотел попробовать сам, но нашел в боковой панели инструмента Image Creator. А в чате бинг генерить картинку отказался. Вероятно будут разворачивать фичу постепенно.
Но можно запустить Image Creator отдельно в браузере. На старте тебе даётся 25 бустов (аля кредитов). Как они закончатся, их можно будет восполнить из Microsoft Rewards, которые отображаются в Bing в правом верхнем углу и начисляются за пользование браузером, в том числе и чатом.
Хотел попробовать сам, но нашел в боковой панели инструмента Image Creator. А в чате бинг генерить картинку отказался. Вероятно будут разворачивать фичу постепенно.
Но можно запустить Image Creator отдельно в браузере. На старте тебе даётся 25 бустов (аля кредитов). Как они закончатся, их можно будет восполнить из Microsoft Rewards, которые отображаются в Bing в правом верхнем углу и начисляются за пользование браузером, в том числе и чатом.