Метаверсище и ИИще
48K subscribers
6.05K photos
4.52K videos
47 files
6.96K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Gemini 3 появилась в AIStudio.

Немного дороже gpt5.1 и Gemini 2.5

Банана пока не обновилась.

@cgevent
🔥22😁4👍1
Gemini 3 проходит тест на шестипалого...

@cgevent
😁69👍13😱41
This media is not supported in your browser
VIEW IN TELEGRAM
Вместе с Gemini 3 Гугл выпустил свой ... Курсор!

Он называется Antigravity и это IDE для разработки.

Все это хозяйство бесплатное пока - тарифные планы Team и Enterprise ещё не анонсированы.

Если копнуть глубже, то из Antigravity можно (пока) обращаться не только к Gemini 3, но и к Claude Sonnet 4.5 и (хмм) gpt-oss.

https://antigravity.google/

@cgevent
46😁14🔥10👎5👍1😱1
Media is too big
VIEW IN TELEGRAM
Кока, но не Кола.

Это очень смешно сделано.

Но я вечером удалю от греха подальше, вон с реддита потерли уже везде, где дотянулись.

Пишут, что Клинг 2.5

@cgevent
1😁214👎28🔥209👍9😱4🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Сборка кубика Рубика в Gemini 3.

Промпт был: Make a 3D Rubik's cube simulation, include the buttons "shuffle", and "solve". both play a nice smooth animation.

Потом попросил добавить поле для скорости анимации.

Все сделал с первого раза.

Код тут: https://pastebin.com/Hca34iUV

Я уж было подумал, что он подтягивает алгоритмы сборки кубика, но нет, он просто кэширует повороты в очередь при шаффлинге, а потом разматывает обратно тем же путем.

@cgevent
😁74🔥276👍3
Похоже Нанабанану тихо раскатывают, но довольно странным образом.

Что бы я не сгенерил в Gemini.google.com, выбрав Банану, я получаю сообщение:

You’ve reached your limit. Images will be created with the previous version until your limit resets on Nov 19, 7:30 PM.

Типа я достиг лимита новой версии, и дальше будет генерация в старой версии. Сама картинка тоже выглядит как в старой версии бананы. Хотя у меня Про аккаунт. ВПН не влияет на результат.

Ждем вечера?

@cgevent
👍19😁113
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Перевод The Smol Training Playbook:
The Secrets to Building World-Class LLMs


Подписчик Сергей Долгов проделал титанический труд - перевел культовый гайд по тренировке своих языковых моделей.

Вот что он пишет:

На первый взгляд SMOL Playbook от HuggingFace, которым мы обязаны почти всем в AI-опенсорсе - это эссе размером в 2️⃣0️⃣0️⃣ страниц о том, как обучать большие модели. Но для меня это - изысканный десерт весом в полтонны, которым никак не можешь наесться. Слой за слоем я читал и находил все новые и новые инсайты, многие из которых подтверждали мои предположения и опыт, но бОльшая часть была ошеломляюще новой.

Если в 2024 вы собирали простых ассистентов на GPT, этой весной освоили n8n и Комфи, а сейчас уже делаете 40-секундные ролики на Sora, то, возможно, в следующем году вы уже будете тренировать LLM для целых компаний или, как минимум, руководить теми, кто их тренирует . Спрос растет на тех, кто хорошо разбирается в принципах работы нейронок.

Я занимаюсь тем, что собираю команды, обучаю и внедряю ИИ. Две недели назад я взялся за перевод SMOL Playbook от тех самых HuggingFace, которым мы обязаны почти всем в AI-опенсорсе. Это книга о том, как все устроено в мире LLM, как не растянуться на входе в него и многократно не споткнуться по ходу дела. Благодаря этому материалу всего за несколько вечеров вы сможете разложить процесс по полочкам и избежите дорогих ошибок:
▶️выбор архитектуры под вашу задачу
▶️подготовка и чистка датасета
▶️тонкости обучения и отладки
▶️ экономии вычислений.
Кофаундер и ведущие исследователи HuggingFace честно (и с изрядным юмором!) пишут о всех граблях, ограничениях и компромиссах, с которыми они столкнулись, и которые 100% ждут вас (тут, видимо, нужен скрытый текст) если вы не прочитаете этот текст.
Так что, если в будущем вы допускаете, что можете попасть в одну из этих когорт...
🧑‍💻 AI-инженер и ресёрчер, которому нужна компактная и быстрая модель
🙆🏻‍♂️ Стартапер с ограниченным бюджето, которому нужно протестировать гипотезу и не сжечь деньги
🧛‍♂️ Руководитель, желающий понять, почему одни LLM выстреливают, а другие нет
... прочитайте эту книгу, возможно она сэкономит вам месяцы жизни. И определенно доставит удовольствие!


Спасибо Сергею за такой труд.

@cgevent
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83👍1811😁2👎1
Forwarded from Хирон
Идеология преимущества

Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?

Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:

🧠 «Хирон. ИИ. Архитектура математического преимущества»

P.S. Будущее - это алгоритм, который можно написать
👎46👍62😁2🔥1
Introducing SAM 3D: Powerful 3D Reconstruction for Physical World Images

Ничего себе! Метачка разродилась целым набором проектов.

Meta Segment Anything Model 3 - с кодом, весами, датасетами и кодом для файнтюна. Видео-сегментация и композ.

Segment Anything Playground - это демо для всех этих проектов, пока работает быстро и даже без регистрации.

И наконец: SAM 3D: Powerful 3D Reconstruction for Physical World Images

И вот это уже прям 3Д-генератор.

Там есть две модели. SAM 3D Objects для реконструкции объектов и сцен, и SAM 3D Body для оценки тела и формы человека.

На входе фото, на выходе 3Д. Чем не 3Д-генератор.

Причем 3Д-болваны получаются сразу со скелетом.

Они так и пишут про целевую аудиторию: 3Д моделинг, VR\AR, геймдев.

Я думаю, что не стоит ждать прям высокополигональных деталей, это больше про 3D reconstructions, но надо разбираться.

Тьма ссылок, посмотрите хотя бы видосы, это новый уровень.

https://ai.meta.com/blog/sam-3d/

https://ai.meta.com/blog/segment-anything-model-3/

Демо-плейграунд:
https://www.aidemos.meta.com/segment-anything
(там есть и обычное вырезание объектов по видео)

Кодищще:
https://github.com/facebookresearch/sam3

Статья: SAM 3: Segment Anything with Concepts
https://ai.meta.com/research/publications/sam-3-segment-anything-with-concepts/

@cgevent
32👍24🔥4👎2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Более того, Метачка уже встраивает это в свои продукты.

Про приложение Edits я уже писал, а вот теперь новая фишка: примерочная 3Д-объектов, содранных с других картинок.
SAM 3D and SAM 3 теперь под капотом новой фичи "View in Room" на барахолке Facebook Marketplace.

Забираешь объект с одной фото, реконструируешь среду с другой и примеряешь объект.

Кстати, для недвиги может хорошо зайти.

@cgevent
👍48👎4🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
А вот тут можно поглядеть как работает Sam3D.
Он еще и камеру трекает.

https://www.aidemos.meta.com/segment-anything/editor/convert-body-to-3d

@cgevent
🔥49😱15👍53👎3
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Студия «Артман»

В студии «Артман» давно обитает маленький вязаный житель. 3D-дизайнеру Юре пришло в голову его оживить, заодно показав наш офис и отправив малыша в путешествие.

Использовался для этого Kling AI, After Effects — для монтажа, фото делал на телефон, для звука — Suno.

Из основных технических проблем:

1) Во многих шотах котик превращался из вязаной игрушки с «лапками-цилиндриками» в настоящего котёнка с суставами. Из-за этого приходилось пересчитывать видосы, закликивать генерации. В целом, даже в финальном результате в некоторых шотах на силуэтных ракурсах видно шёрстку.

2) Поскольку нейронка не помнит, что было в предыдущем кадре, то скрывать и показывать снова объекты не получалось. Например, после поворота мордочки в кадр возвращалась уже другая мордочка. То же самое случалось, когда котёнок, например, заходил за лампу, а потом появлялся совсем другим. Чтобы это решить, делал монтажный подрез таких вещей.

Весь процесс занял около двух дней.


@cgevent
64👍54🔥27👎8🙏3
Всё под рукой: как единое ИИ-рабочее окно меняет работу с нейронками

Когда мы все привыкли к нейронкам и вроде бы научились пользоваться самыми разными ИИ, казалось бы, что еще может удивить? Чего ещё нам не хватает, чтобы было максимально просто и удобно? Может, все инструменты в одном окне?

На платформе GPTunneL собрана экосистема самых топовых нейросетей, которая работает как единое интегрированное окно. А ещё, все последние обновления нейронок сразу же доступны на платформе. Отслеживать новинки и инструменты удобно в ТГ-канале @gptunnel

В ноябре в сервисе есть скидки до 80% на Veo 3.1, Veo 3.1 и Sora 2 Pro. Их как раз можно использовать через промпты, которые в @gptunnel часто публикуются для создания трендовых креативов. Например, скоро выйдет финал сериала "Очень странные дела", и к нему сейчас можно получить промпт в комментариях

Подписывайтесь на @gptunnel и переходите на платформу GPTunneL - будете в курсе выхода последний версий топовых нейронок.

#промо
1👎39🔥63👍2
Nano Banana Pro раскатали в Gemini

https://gemini.google.com/app

Nano Banana Pro - это то же самое, что и Nano Banana 2.

Вот с такой задачей не справлялся никто:

Plot sin(x) from 0 to 2*pi. Generate the resulting graph image. make picture christmas style

Новая Банана справилась.

Поехали тестировать, а я пособираю деталей про разрешение и другие параметры.

@cgevent
1🔥69👍8👎2😁21
Для сравнения: вот так делали chatGPT-Image-1(красным) и старая Banana.

Plot sin(x) from 0 to 2*pi. Generate the resulting graph image. make picture christmas style

Внутри новой Нанабананыпро мозги от Gemini 3 Pro.

@cgevent
30🔥13👍3😁2