Метаверсище и ИИще
50.8K subscribers
6.36K photos
5.06K videos
48 files
7.37K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Так, похоже завтра весь день будем разбираться с тем, что на НЕ показали в презентации GPT-4o.

С картинками и 3Д в особенности.
И там похоже Клондайк.
👍22🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Просят ее сгенерить 6 (консистентных) ракурсов одного и того же промпта.

A sea lion sculpture. On the circular base of the sculpture, the word "OpenAI" is etched out


А потом "а теперь давай 3д модель по 6ти картинкам".
👍28🔥15
Дай, думаю, лягу спать пораньше. И тут хрясь!, и мне выдают доступ.
Ишотеперьделать?
👍47🔥23
Там по ходу свой ControlNet вшит прямо в мозг, поглядите на Canny и определение edges!(Одна из картинок)

Точнее там библиотека openCV под капотом.

Зд модель она мне пока не сделала, но я с телефона не очень-то и старался.
Так, ещё 5 минут и спать.

P.S.

import numpy as np import cv2 import matplotlib.pyplot as plt # Convert images to grayscale front_gray = cv2.cvtColor(np.array(front_view), cv2.COLOR_RGB2GRAY) side_gray = cv2.cvtColor(np.array(side_view), cv2.COLOR_RGB2GRAY) top_gray = cv2.cvtColor(np.array(top_view), cv2.COLOR_RGB2GRAY) back_gray = cv2.cvtColor(np.array(back_view), cv2.COLOR_RGB2GRAY) # Detect edges using Canny edge detector edges_front = cv2.Canny(front_gray, 100, 200) edges_side = cv2.Canny(side_gray, 100, 200) edges_top = cv2.Canny(top_gray, 100, 200) edges_back = cv2.Canny(back_gray
🔥34👍5
Но тем не менее, первое, куда он лезет, это Бинг.
Это видно на выдаче.
👍39👎3
🔥18👍3
Говорят, завезли больше фотореализьму...
Штошь..
Попробуйте повторить промпт, удивитесь.
🔥23👍6👎2
Я понял, как произносить новую модель:
Джипити-Чо!
🔥114👍16👎3
Media is too big
VIEW IN TELEGRAM
GPT-4o поводырь

Посмотрите, прогрузите это видео.

Для слепых людей - это может быть другим уровнем жизни.

Особенно, когда появятся лёгкие умные очки, с которыми можно разговаривать и которые будут поводырем совершенно иного уровня.
А постоянный стриминг реальности в аудио-речь может заставить мозг пластично адаптироваться к новому сигналу и начать "видеть" мир. По другому, но видеть. Особенно для тех, кто потерял зрение уже будучи зрячим, имея картину мира сформированной.
👍88🔥46
Давайте немного подытожим вчерашнюю презентацию от OpenAI и наведем порядок в терминах и сроках.

Я рекомендую внимательно прочитать два недлинных документа, появившихся вчера:
https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
и
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/

Итак,
Если вы сразу бросились тестировать голосовые возможности в chatGPT, то погодите.
chatGPT отвечает пока вам старым способом. Переводит речь в текст и обратно. А не напрямую, как на демонстрациях.
(ChatGPT will continue to have support for voice via the pre-existing Voice Mode feature) initially.
В приложении(о нем ниже) тоже:
You can now have voice conversations with ChatGPT directly from your computer, starting with Voice Mode that has been available in ChatGPT at launch, with GPT-4o’s new audio and video capabilities coming in the future.

То есть вам отвечает новая умная модель, но по старой (медленной) схеме. Новая быстрая будет in the future. Да, и петь тоже потом.

Приложение для компа, со всеми этим плюшками с демонстрации уже готово, но только для Mac
Его начинают раскатывать на разные регионы и аккаунты. chatGPT вам сообщит.
Для Винды все плохо (и подло): We also plan to launch a Windows version later this year.

Лимит сообщений: "пользователи Plus смогут отправлять до 80 сообщений каждые 3 часа на GPT-4o и до 40 сообщений каждые 3 часа на GPT-4. Мы можем снизить лимит в часы пик, чтобы сохранить доступность GPT-4 и GPT-4o для наибольшего количества людей." Для бесплатных акков лимит может быть очень маленьким, особенно, если близлежащий к вам сервер перегружен. Буквально 2-4 сообщения иногда. Бесплатный сыр отключают при нагрузке в первую очередь, и переключают на 3.5.

Размер контекста модели GPT-4o - 128К. Это много. Очень много для 95 процентов пользователей. Это, грубо говоря, количество текста и сообщений из одного чата, которая она хранит в памяти, чтобы отвечать в соответствии с этой информацией, которую она держит "в мозгах".

Новая модель лучше понимает картинки: GPT-4o’s vision capabilities perform better than GPT-4 Turbo

Она в два разы быстрее (это видно в chatGPT): GPT-4o is 2x as fast as GPT-4 Turbo.

Лучше умеет в русский (да, она даже в рифму теперь умеет писать): GPT-4o has improved support for non-English languages over GPT-4 Turbo.

Для API гиков:
Pricing: GPT-4o is 50% cheaper than GPT-4 Turbo, coming in at $5/M input and $15/M output tokens).
Rate limits: GPT-4o’s rate limits are 5x higher than GPT-4 Turbo—up to 10 million tokens per minute.


Вся эта мульти-омни-модальность будет раскатываться постепенно. Типа из звука в звук, из картинок в картинки, разговор с видео. Думаю мы увидим обновленный DALL·E 3 или вообще иной способ генерации картинок. Надо подождать.

А пока gpt-4o уделывает остальные модели во всяческих тестах и доступна бесплатно в chatGPT.

Про бесплатность - следующий пост.
👍50👎1
Про бесплатный сыр доступ к gpt-4o

Пользователи бесплатного уровня по умолчанию будут переведены на GPT-4o с ограничением на количество сообщений, которые они могут отправить с помощью GPT-4o. См пост выше про лимиты.

Пользователи Free также получают ограниченный(вот тут нет информации про ограничения) доступ к сообщениям с использованием расширенных инструментов, таких как:
Data analysis
File Uploads
Browse
Discovering and using GPTs - джипитишки для всех, хороший ход.
Vision - очень круто.

Если раскрыть скобки то это:
Интеллект уровня GPT-4
Получение ответы, как от модели, так и из Интернета
Анализ данных и создание графиков и диаграмм
Загрузка картинок и обсуждение их с моделью.
Загрузка файлов для суммаризации и анализа
Работа с памятью (между чатами) - для европы недоступно.

И многое спрашивают, а почему? Если все это бесплатно, то на чем они будут зарабатывать или за какие космические пироги надо будет платить?

Почему? А потому что началась битва за данные. Источником которых являются пользователи, которые петабайтами грузят в chatGPT свои тексты, вирши, картинки, видео, всю эту свою цифровую жизнь. И теперь, открыв gpt-4o для всех, OpenAI получат больше картинок, пдф, csv, файлов и просто текстов. Во-первых, расширив юзер базу, во-вторых, расширив типы данных, которые бесплатные пользователи будут скармливать ИИ на обучение.

Клода открыли для Европы. gpt-4o открыли для бесплатных акков. Битва за данные пользователей началась!
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
👍48🔥14
Ну и последнее про бесплатный сыр.

Сэм Альтман вчера сделал пост в своем блоге. Довольно ровный, но там есть такой абзац.

Разговор с компьютером никогда не казался мне естественным, а теперь это так. По мере добавления (по желанию) персонализации, доступа к вашей информации, возможности совершать действия от вашего имени и т. д., я вижу захватывающее будущее, в котором мы сможем использовать компьютеры для гораздо большего, чем когда-либо прежде.

As we add (optional) personalization, access to your information, the ability to take actions on your behalf, and more, I can really see an exciting future where we are able to use computers to do much more than ever before.

Я мысленно заменил optional на hidden(скрытого) или даже на mandatory(обязательного) добавления персонализации, и понял, что уже поздно. Вы же понимаете, что все ваши ленты и реклама - персонализированы без всякого optional. Почему с ИИ будет по другому?

У нас просто будут иные стратегии поведения. Если будут вообще.
https://blog.samaltman.com/gpt-4o
👍44👎3