Подсобрал еще немного утечек про Нанабананскую.
Для начала, нейминг, скорее всего, будет Nano Banana Pro. Циферок не будет.
Почему?
Потому что новая Нанабанана будет здоровенной рассуждающей моделью. Она сможет ревьюить картинки на стадии генерации, соотносить их с замыслом и исправлять. Внутри будет внутренний критик, который будет следить за качеством и соответствием промпту. И хотя кодовое имя новой Бананы Gempix2 - циферка скорее всего превратится в Pro.
И да, она будет дороже, по крайней мере в API - по поводу лимитов в Gemini App и AI Studio ничего, конечно, неизвестно.
С неймингом Gemini 3 тоже будут изменения. Там будет Thinking и еще много чего.
Сроки: 18 - 22 ноября.
Терпим, обессиленные ожиданием...
@cgevent
Для начала, нейминг, скорее всего, будет Nano Banana Pro. Циферок не будет.
Почему?
Потому что новая Нанабанана будет здоровенной рассуждающей моделью. Она сможет ревьюить картинки на стадии генерации, соотносить их с замыслом и исправлять. Внутри будет внутренний критик, который будет следить за качеством и соответствием промпту. И хотя кодовое имя новой Бананы Gempix2 - циферка скорее всего превратится в Pro.
И да, она будет дороже, по крайней мере в API - по поводу лимитов в Gemini App и AI Studio ничего, конечно, неизвестно.
С неймингом Gemini 3 тоже будут изменения. Там будет Thinking и еще много чего.
Сроки: 18 - 22 ноября.
Терпим, обессиленные ожиданием...
@cgevent
❤29🔥15👍7😁3
Description: Gemini 3 Pro is the next generation in the Gemini series of models, a suite of highly-capable, natively multimodal, reasoning models.
Model dependencies: This model is not a modification or a fine-tune of a prior model.
Inputs: Text strings (e.g., a question, a prompt, document(s) to be summarized), images, audio, and
video files, with a token context window of up to 1M.
Outputs: Text, with a 64K token output.
https://web.archive.org/web/20251118111103if_/https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf
@cgevent
Model dependencies: This model is not a modification or a fine-tune of a prior model.
Inputs: Text strings (e.g., a question, a prompt, document(s) to be summarized), images, audio, and
video files, with a token context window of up to 1M.
Outputs: Text, with a 64K token output.
https://web.archive.org/web/20251118111103if_/https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf
@cgevent
👍11👎9🔥6❤1
Forwarded from Борис опять
Gemini 3 Pro бенчмарки простыми словами
- Очень большой рост на Humanity's Last Exam: это про решение очень сложных задач.
- Очень большой рост на Arc AGI 2: это про способность понимать правила задачи по парочке примеров и далее применять их в новых случаях.
- Большой рост по способностям понимать сложные изображения вроде скриншотов и графиков (бывшие коллеги из eBay обратите внимание).
- SWE-bench verified лишь незначительно отстаёт от Sonnet 4.5: это про способность решать реальные задачи по разработке софта. Короче модель на уровне Соннета.
- Большой рост по всему, что касается тулколлов и агентности. Особенно Vending Bench 2 выделяется — это про долгосрочное планирование.
Все стандартные бенчи типа MMMLU чуть-чуть выросли.
В общем большая ставка на агентность. Возможно на этой модели уже можно сделать какой-то рабочий computer use.
Выглядит как рост уровня того, что было при переходе от GPT-3.5 к GPT-4. Давно такого не было! Но подождем результатов на арене, SWE Rebench и прочих штуках, где нельзя оверфитнуться на тест
- Очень большой рост на Humanity's Last Exam: это про решение очень сложных задач.
- Очень большой рост на Arc AGI 2: это про способность понимать правила задачи по парочке примеров и далее применять их в новых случаях.
- Большой рост по способностям понимать сложные изображения вроде скриншотов и графиков (бывшие коллеги из eBay обратите внимание).
- SWE-bench verified лишь незначительно отстаёт от Sonnet 4.5: это про способность решать реальные задачи по разработке софта. Короче модель на уровне Соннета.
- Большой рост по всему, что касается тулколлов и агентности. Особенно Vending Bench 2 выделяется — это про долгосрочное планирование.
Все стандартные бенчи типа MMMLU чуть-чуть выросли.
В общем большая ставка на агентность. Возможно на этой модели уже можно сделать какой-то рабочий computer use.
Выглядит как рост уровня того, что было при переходе от GPT-3.5 к GPT-4. Давно такого не было! Но подождем результатов на арене, SWE Rebench и прочих штуках, где нельзя оверфитнуться на тест
👍33❤15👎1
Начало 2025. Директора крупных ИИ компаний: через 6 месяцев 90-100 процентов кода будет писать ИИ.
Конец 2025. Интернет лежит мертвый на половине планеты.
Совпадение?
А вы ожидали чего-то другого?
@cgevent
Конец 2025. Интернет лежит мертвый на половине планеты.
Совпадение?
@cgevent
1😁134👍9❤4😱2
А ещё вчера Cloudflare купил replicate.com, одиного из ведущих сервисов, предоставляющих доступ по API к огромному количеству ИИ-моделей.
А сегодня Cloudflare повалился и обрушил половину интернета.
Совпадение?
@cgevent
А сегодня Cloudflare повалился и обрушил половину интернета.
Совпадение?
@cgevent
😁69🔥15👍7😱5❤1
🔥22😁4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Вместе с Gemini 3 Гугл выпустил свой ... Курсор!
Он называется Antigravity и это IDE для разработки.
Все это хозяйство бесплатное пока - тарифные планы Team и Enterprise ещё не анонсированы.
Если копнуть глубже, то из Antigravity можно (пока) обращаться не только к Gemini 3, но и к Claude Sonnet 4.5 и (хмм) gpt-oss.
https://antigravity.google/
@cgevent
Он называется Antigravity и это IDE для разработки.
Все это хозяйство бесплатное пока - тарифные планы Team и Enterprise ещё не анонсированы.
Если копнуть глубже, то из Antigravity можно (пока) обращаться не только к Gemini 3, но и к Claude Sonnet 4.5 и (хмм) gpt-oss.
https://antigravity.google/
@cgevent
❤46😁14🔥10👎5👍1😱1
Media is too big
VIEW IN TELEGRAM
Кока, но не Кола.
Это очень смешно сделано.
Но я вечером удалю от греха подальше, вон с реддита потерли уже везде, где дотянулись.
Пишут, что Клинг 2.5
@cgevent
Это очень смешно сделано.
Но я вечером удалю от греха подальше, вон с реддита потерли уже везде, где дотянулись.
Пишут, что Клинг 2.5
@cgevent
1😁214👎28🔥20❤9👍9😱4🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Сборка кубика Рубика в Gemini 3.
Промпт был: Make a 3D Rubik's cube simulation, include the buttons "shuffle", and "solve". both play a nice smooth animation.
Потом попросил добавить поле для скорости анимации.
Все сделал с первого раза.
Код тут: https://pastebin.com/Hca34iUV
Я уж было подумал, что он подтягивает алгоритмы сборки кубика, но нет, он просто кэширует повороты в очередь при шаффлинге, а потом разматывает обратно тем же путем.
@cgevent
Промпт был: Make a 3D Rubik's cube simulation, include the buttons "shuffle", and "solve". both play a nice smooth animation.
Потом попросил добавить поле для скорости анимации.
Все сделал с первого раза.
Код тут: https://pastebin.com/Hca34iUV
Я уж было подумал, что он подтягивает алгоритмы сборки кубика, но нет, он просто кэширует повороты в очередь при шаффлинге, а потом разматывает обратно тем же путем.
@cgevent
😁74🔥27❤6👍3
Похоже Нанабанану тихо раскатывают, но довольно странным образом.
Что бы я не сгенерил в Gemini.google.com, выбрав Банану, я получаю сообщение:
You’ve reached your limit. Images will be created with the previous version until your limit resets on Nov 19, 7:30 PM.
Типа я достиг лимита новой версии, и дальше будет генерация в старой версии. Сама картинка тоже выглядит как в старой версии бананы. Хотя у меня Про аккаунт. ВПН не влияет на результат.
Ждем вечера?
@cgevent
Что бы я не сгенерил в Gemini.google.com, выбрав Банану, я получаю сообщение:
You’ve reached your limit. Images will be created with the previous version until your limit resets on Nov 19, 7:30 PM.
Типа я достиг лимита новой версии, и дальше будет генерация в старой версии. Сама картинка тоже выглядит как в старой версии бананы. Хотя у меня Про аккаунт. ВПН не влияет на результат.
Ждем вечера?
@cgevent
👍19😁11❤3
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Перевод The Smol Training Playbook:
The Secrets to Building World-Class LLMs
Подписчик Сергей Долгов проделал титанический труд - перевел культовый гайд по тренировке своих языковых моделей.
Вот что он пишет:
На первый взгляд SMOL Playbook от HuggingFace, которым мы обязаны почти всем в AI-опенсорсе - это эссе размером в2️⃣ 0️⃣ 0️⃣ ➕ страниц о том, как обучать большие модели. Но для меня это - изысканный десерт весом в полтонны, которым никак не можешь наесться. Слой за слоем я читал и находил все новые и новые инсайты, многие из которых подтверждали мои предположения и опыт, но бОльшая часть была ошеломляюще новой.
Если в 2024 вы собирали простых ассистентов на GPT, этой весной освоили n8n и Комфи, а сейчас уже делаете 40-секундные ролики на Sora, то, возможно, в следующем году вы уже будете тренировать LLM для целых компаний или, как минимум, руководить теми, кто их тренирует . Спрос растет на тех, кто хорошо разбирается в принципах работы нейронок.
Я занимаюсь тем, что собираю команды, обучаю и внедряю ИИ. Две недели назад я взялся за перевод SMOL Playbook от тех самых HuggingFace, которым мы обязаны почти всем в AI-опенсорсе. Это книга о том, как все устроено в мире LLM, как не растянуться на входе в него и многократно не споткнуться по ходу дела. Благодаря этому материалу всего за несколько вечеров вы сможете разложить процесс по полочкам и избежите дорогих ошибок:
▶️ выбор архитектуры под вашу задачу
▶️ подготовка и чистка датасета
▶️ тонкости обучения и отладки
▶️ экономии вычислений.
Кофаундер и ведущие исследователи HuggingFace честно (и с изрядным юмором!) пишут о всех граблях, ограничениях и компромиссах, с которыми они столкнулись, и которые 100% ждут вас (тут, видимо, нужен скрытый текст) если вы не прочитаете этот текст.
Так что, если в будущем вы допускаете, что можете попасть в одну из этих когорт...
🧑💻 AI-инженер и ресёрчер, которому нужна компактная и быстрая модель
🙆🏻♂️ Стартапер с ограниченным бюджето, которому нужно протестировать гипотезу и не сжечь деньги
🧛♂️ Руководитель, желающий понять, почему одни LLM выстреливают, а другие нет
... прочитайте эту книгу, возможно она сэкономит вам месяцы жизни. И определенно доставит удовольствие!
Спасибо Сергею за такой труд.
@cgevent
The Secrets to Building World-Class LLMs
Подписчик Сергей Долгов проделал титанический труд - перевел культовый гайд по тренировке своих языковых моделей.
Вот что он пишет:
На первый взгляд SMOL Playbook от HuggingFace, которым мы обязаны почти всем в AI-опенсорсе - это эссе размером в
Если в 2024 вы собирали простых ассистентов на GPT, этой весной освоили n8n и Комфи, а сейчас уже делаете 40-секундные ролики на Sora, то, возможно, в следующем году вы уже будете тренировать LLM для целых компаний или, как минимум, руководить теми, кто их тренирует . Спрос растет на тех, кто хорошо разбирается в принципах работы нейронок.
Я занимаюсь тем, что собираю команды, обучаю и внедряю ИИ. Две недели назад я взялся за перевод SMOL Playbook от тех самых HuggingFace, которым мы обязаны почти всем в AI-опенсорсе. Это книга о том, как все устроено в мире LLM, как не растянуться на входе в него и многократно не споткнуться по ходу дела. Благодаря этому материалу всего за несколько вечеров вы сможете разложить процесс по полочкам и избежите дорогих ошибок:
Кофаундер и ведущие исследователи HuggingFace честно (и с изрядным юмором!) пишут о всех граблях, ограничениях и компромиссах, с которыми они столкнулись, и которые 100% ждут вас (тут, видимо, нужен скрытый текст) если вы не прочитаете этот текст.
Так что, если в будущем вы допускаете, что можете попасть в одну из этих когорт...
🙆🏻♂️ Стартапер с ограниченным бюджето, которому нужно протестировать гипотезу и не сжечь деньги
🧛♂️ Руководитель, желающий понять, почему одни LLM выстреливают, а другие нет
... прочитайте эту книгу, возможно она сэкономит вам месяцы жизни. И определенно доставит удовольствие!
Спасибо Сергею за такой труд.
@cgevent
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83👍18❤11😁2👎1
Forwarded from Хирон
Идеология преимущества
Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?
Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:
🧠 «Хирон. ИИ. Архитектура математического преимущества»
P.S.Будущее - это алгоритм, который можно написать
Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?
Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:
🧠 «Хирон. ИИ. Архитектура математического преимущества»
P.S.
👎46👍6❤2😁2🔥1
Introducing SAM 3D: Powerful 3D Reconstruction for Physical World Images
Ничего себе! Метачка разродилась целым набором проектов.
Meta Segment Anything Model 3 - с кодом, весами, датасетами и кодом для файнтюна. Видео-сегментация и композ.
Segment Anything Playground - это демо для всех этих проектов, пока работает быстро и даже без регистрации.
И наконец: SAM 3D: Powerful 3D Reconstruction for Physical World Images
И вот это уже прям 3Д-генератор.
Там есть две модели. SAM 3D Objects для реконструкции объектов и сцен, и SAM 3D Body для оценки тела и формы человека.
На входе фото, на выходе 3Д. Чем не 3Д-генератор.
Причем 3Д-болваны получаются сразу со скелетом.
Они так и пишут про целевую аудиторию: 3Д моделинг, VR\AR, геймдев.
Я думаю, что не стоит ждать прям высокополигональных деталей, это больше про 3D reconstructions, но надо разбираться.
Тьма ссылок, посмотрите хотя бы видосы, это новый уровень.
https://ai.meta.com/blog/sam-3d/
https://ai.meta.com/blog/segment-anything-model-3/
Демо-плейграунд:
https://www.aidemos.meta.com/segment-anything
(там есть и обычное вырезание объектов по видео)
Кодищще:
https://github.com/facebookresearch/sam3
Статья: SAM 3: Segment Anything with Concepts
https://ai.meta.com/research/publications/sam-3-segment-anything-with-concepts/
@cgevent
Ничего себе! Метачка разродилась целым набором проектов.
Meta Segment Anything Model 3 - с кодом, весами, датасетами и кодом для файнтюна. Видео-сегментация и композ.
Segment Anything Playground - это демо для всех этих проектов, пока работает быстро и даже без регистрации.
И наконец: SAM 3D: Powerful 3D Reconstruction for Physical World Images
И вот это уже прям 3Д-генератор.
Там есть две модели. SAM 3D Objects для реконструкции объектов и сцен, и SAM 3D Body для оценки тела и формы человека.
На входе фото, на выходе 3Д. Чем не 3Д-генератор.
Причем 3Д-болваны получаются сразу со скелетом.
Они так и пишут про целевую аудиторию: 3Д моделинг, VR\AR, геймдев.
Я думаю, что не стоит ждать прям высокополигональных деталей, это больше про 3D reconstructions, но надо разбираться.
Тьма ссылок, посмотрите хотя бы видосы, это новый уровень.
https://ai.meta.com/blog/sam-3d/
https://ai.meta.com/blog/segment-anything-model-3/
Демо-плейграунд:
https://www.aidemos.meta.com/segment-anything
(там есть и обычное вырезание объектов по видео)
Кодищще:
https://github.com/facebookresearch/sam3
Статья: SAM 3: Segment Anything with Concepts
https://ai.meta.com/research/publications/sam-3-segment-anything-with-concepts/
@cgevent
❤32👍24🔥4👎2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Более того, Метачка уже встраивает это в свои продукты.
Про приложение Edits я уже писал, а вот теперь новая фишка: примерочная 3Д-объектов, содранных с других картинок.
SAM 3D and SAM 3 теперь под капотом новой фичи "View in Room" на барахолке Facebook Marketplace.
Забираешь объект с одной фото, реконструируешь среду с другой и примеряешь объект.
Кстати, для недвиги может хорошо зайти.
@cgevent
Про приложение Edits я уже писал, а вот теперь новая фишка: примерочная 3Д-объектов, содранных с других картинок.
SAM 3D and SAM 3 теперь под капотом новой фичи "View in Room" на барахолке Facebook Marketplace.
Забираешь объект с одной фото, реконструируешь среду с другой и примеряешь объект.
Кстати, для недвиги может хорошо зайти.
@cgevent
👍48👎4🔥3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот тут можно поглядеть как работает Sam3D.
Он еще и камеру трекает.
https://www.aidemos.meta.com/segment-anything/editor/convert-body-to-3d
@cgevent
Он еще и камеру трекает.
https://www.aidemos.meta.com/segment-anything/editor/convert-body-to-3d
@cgevent
🔥49😱15👍5❤3👎3