Так, похоже завтра весь день будем разбираться с тем, что на НЕ показали в презентации GPT-4o.
С картинками и 3Д в особенности.
И там похоже Клондайк.
С картинками и 3Д в особенности.
И там похоже Клондайк.
👍22🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Просят ее сгенерить 6 (консистентных) ракурсов одного и того же промпта.
A sea lion sculpture. On the circular base of the sculpture, the word "OpenAI" is etched out
А потом "а теперь давай 3д модель по 6ти картинкам".
A sea lion sculpture. On the circular base of the sculpture, the word "OpenAI" is etched out
А потом "а теперь давай 3д модель по 6ти картинкам".
👍28🔥15
Там по ходу свой ControlNet вшит прямо в мозг, поглядите на Canny и определение edges!(Одна из картинок)
Точнее там библиотека openCV под капотом.
Зд модель она мне пока не сделала, но я с телефона не очень-то и старался.
Так, ещё 5 минут и спать.
P.S.
import numpy as np import cv2 import matplotlib.pyplot as plt # Convert images to grayscale front_gray = cv2.cvtColor(np.array(front_view), cv2.COLOR_RGB2GRAY) side_gray = cv2.cvtColor(np.array(side_view), cv2.COLOR_RGB2GRAY) top_gray = cv2.cvtColor(np.array(top_view), cv2.COLOR_RGB2GRAY) back_gray = cv2.cvtColor(np.array(back_view), cv2.COLOR_RGB2GRAY) # Detect edges using Canny edge detector edges_front = cv2.Canny(front_gray, 100, 200) edges_side = cv2.Canny(side_gray, 100, 200) edges_top = cv2.Canny(top_gray, 100, 200) edges_back = cv2.Canny(back_gray
Точнее там библиотека openCV под капотом.
Зд модель она мне пока не сделала, но я с телефона не очень-то и старался.
Так, ещё 5 минут и спать.
P.S.
import numpy as np import cv2 import matplotlib.pyplot as plt # Convert images to grayscale front_gray = cv2.cvtColor(np.array(front_view), cv2.COLOR_RGB2GRAY) side_gray = cv2.cvtColor(np.array(side_view), cv2.COLOR_RGB2GRAY) top_gray = cv2.cvtColor(np.array(top_view), cv2.COLOR_RGB2GRAY) back_gray = cv2.cvtColor(np.array(back_view), cv2.COLOR_RGB2GRAY) # Detect edges using Canny edge detector edges_front = cv2.Canny(front_gray, 100, 200) edges_side = cv2.Canny(side_gray, 100, 200) edges_top = cv2.Canny(top_gray, 100, 200) edges_back = cv2.Canny(back_gray
🔥34👍5
Я понял, как произносить новую модель:
Джипити-Чо!
Джипити-Чо!
🔥114👍16👎3
Media is too big
VIEW IN TELEGRAM
GPT-4o поводырь
Посмотрите, прогрузите это видео.
Для слепых людей - это может быть другим уровнем жизни.
Особенно, когда появятся лёгкие умные очки, с которыми можно разговаривать и которые будут поводырем совершенно иного уровня.
А постоянный стриминг реальности в аудио-речь может заставить мозг пластично адаптироваться к новому сигналу и начать "видеть" мир. По другому, но видеть. Особенно для тех, кто потерял зрение уже будучи зрячим, имея картину мира сформированной.
Посмотрите, прогрузите это видео.
Для слепых людей - это может быть другим уровнем жизни.
Особенно, когда появятся лёгкие умные очки, с которыми можно разговаривать и которые будут поводырем совершенно иного уровня.
А постоянный стриминг реальности в аудио-речь может заставить мозг пластично адаптироваться к новому сигналу и начать "видеть" мир. По другому, но видеть. Особенно для тех, кто потерял зрение уже будучи зрячим, имея картину мира сформированной.
👍88🔥46
Давайте немного подытожим вчерашнюю презентацию от OpenAI и наведем порядок в терминах и сроках.
Я рекомендую внимательно прочитать два недлинных документа, появившихся вчера:
https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
и
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
Итак,
Если вы сразу бросились тестировать голосовые возможности в chatGPT, то погодите.
chatGPT отвечает пока вам старым способом. Переводит речь в текст и обратно. А не напрямую, как на демонстрациях.
(ChatGPT will continue to have support for voice via the pre-existing Voice Mode feature) initially.
В приложении(о нем ниже) тоже:
You can now have voice conversations with ChatGPT directly from your computer, starting with Voice Mode that has been available in ChatGPT at launch, with GPT-4o’s new audio and video capabilities coming in the future.
То есть вам отвечает новая умная модель, но по старой (медленной) схеме. Новая быстрая будет in the future. Да, и петь тоже потом.
Приложение для компа, со всеми этим плюшками с демонстрации уже готово, но только для Mac
Его начинают раскатывать на разные регионы и аккаунты. chatGPT вам сообщит.
Для Винды все плохо (и подло): We also plan to launch a Windows version later this year.
Лимит сообщений: "пользователи Plus смогут отправлять до 80 сообщений каждые 3 часа на GPT-4o и до 40 сообщений каждые 3 часа на GPT-4. Мы можем снизить лимит в часы пик, чтобы сохранить доступность GPT-4 и GPT-4o для наибольшего количества людей." Для бесплатных акков лимит может быть очень маленьким, особенно, если близлежащий к вам сервер перегружен. Буквально 2-4 сообщения иногда. Бесплатный сыр отключают при нагрузке в первую очередь, и переключают на 3.5.
Размер контекста модели GPT-4o - 128К. Это много. Очень много для 95 процентов пользователей. Это, грубо говоря, количество текста и сообщений из одного чата, которая она хранит в памяти, чтобы отвечать в соответствии с этой информацией, которую она держит "в мозгах".
Новая модель лучше понимает картинки: GPT-4o’s vision capabilities perform better than GPT-4 Turbo
Она в два разы быстрее (это видно в chatGPT): GPT-4o is 2x as fast as GPT-4 Turbo.
Лучше умеет в русский (да, она даже в рифму теперь умеет писать): GPT-4o has improved support for non-English languages over GPT-4 Turbo.
Для API гиков:
Pricing: GPT-4o is 50% cheaper than GPT-4 Turbo, coming in at $5/M input and $15/M output tokens).
Rate limits: GPT-4o’s rate limits are 5x higher than GPT-4 Turbo—up to 10 million tokens per minute.
Вся эта мульти-омни-модальность будет раскатываться постепенно. Типа из звука в звук, из картинок в картинки, разговор с видео. Думаю мы увидим обновленный DALL·E 3 или вообще иной способ генерации картинок. Надо подождать.
А пока gpt-4o уделывает остальные модели во всяческих тестах и доступна бесплатно в chatGPT.
Про бесплатность - следующий пост.
Я рекомендую внимательно прочитать два недлинных документа, появившихся вчера:
https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
и
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
Итак,
Если вы сразу бросились тестировать голосовые возможности в chatGPT, то погодите.
chatGPT отвечает пока вам старым способом. Переводит речь в текст и обратно. А не напрямую, как на демонстрациях.
(ChatGPT will continue to have support for voice via the pre-existing Voice Mode feature) initially.
В приложении(о нем ниже) тоже:
You can now have voice conversations with ChatGPT directly from your computer, starting with Voice Mode that has been available in ChatGPT at launch, with GPT-4o’s new audio and video capabilities coming in the future.
То есть вам отвечает новая умная модель, но по старой (медленной) схеме. Новая быстрая будет in the future. Да, и петь тоже потом.
Приложение для компа, со всеми этим плюшками с демонстрации уже готово, но только для Mac
Его начинают раскатывать на разные регионы и аккаунты. chatGPT вам сообщит.
Для Винды все плохо (и подло): We also plan to launch a Windows version later this year.
Лимит сообщений: "пользователи Plus смогут отправлять до 80 сообщений каждые 3 часа на GPT-4o и до 40 сообщений каждые 3 часа на GPT-4. Мы можем снизить лимит в часы пик, чтобы сохранить доступность GPT-4 и GPT-4o для наибольшего количества людей." Для бесплатных акков лимит может быть очень маленьким, особенно, если близлежащий к вам сервер перегружен. Буквально 2-4 сообщения иногда. Бесплатный сыр отключают при нагрузке в первую очередь, и переключают на 3.5.
Размер контекста модели GPT-4o - 128К. Это много. Очень много для 95 процентов пользователей. Это, грубо говоря, количество текста и сообщений из одного чата, которая она хранит в памяти, чтобы отвечать в соответствии с этой информацией, которую она держит "в мозгах".
Новая модель лучше понимает картинки: GPT-4o’s vision capabilities perform better than GPT-4 Turbo
Она в два разы быстрее (это видно в chatGPT): GPT-4o is 2x as fast as GPT-4 Turbo.
Лучше умеет в русский (да, она даже в рифму теперь умеет писать): GPT-4o has improved support for non-English languages over GPT-4 Turbo.
Для API гиков:
Pricing: GPT-4o is 50% cheaper than GPT-4 Turbo, coming in at $5/M input and $15/M output tokens).
Rate limits: GPT-4o’s rate limits are 5x higher than GPT-4 Turbo—up to 10 million tokens per minute.
Вся эта мульти-омни-модальность будет раскатываться постепенно. Типа из звука в звук, из картинок в картинки, разговор с видео. Думаю мы увидим обновленный DALL·E 3 или вообще иной способ генерации картинок. Надо подождать.
А пока gpt-4o уделывает остальные модели во всяческих тестах и доступна бесплатно в chatGPT.
Про бесплатность - следующий пост.
👍50👎1
Про бесплатный сыр доступ к gpt-4o
Пользователи бесплатного уровня по умолчанию будут переведены на GPT-4o с ограничением на количество сообщений, которые они могут отправить с помощью GPT-4o. См пост выше про лимиты.
Пользователи Free также получают ограниченный(вот тут нет информации про ограничения) доступ к сообщениям с использованием расширенных инструментов, таких как:
Data analysis
File Uploads
Browse
Discovering and using GPTs - джипитишки для всех, хороший ход.
Vision - очень круто.
Если раскрыть скобки то это:
Интеллект уровня GPT-4
Получение ответы, как от модели, так и из Интернета
Анализ данных и создание графиков и диаграмм
Загрузка картинок и обсуждение их с моделью.
Загрузка файлов для суммаризации и анализа
Работа с памятью (между чатами) - для европы недоступно.
И многое спрашивают, а почему? Если все это бесплатно, то на чем они будут зарабатывать или за какие космические пироги надо будет платить?
Почему? А потому что началась битва за данные. Источником которых являются пользователи, которые петабайтами грузят в chatGPT свои тексты, вирши, картинки, видео, всю эту свою цифровую жизнь. И теперь, открыв gpt-4o для всех, OpenAI получат больше картинок, пдф, csv, файлов и просто текстов. Во-первых, расширив юзер базу, во-вторых, расширив типы данных, которые бесплатные пользователи будут скармливать ИИ на обучение.
Клода открыли для Европы. gpt-4o открыли для бесплатных акков. Битва за данные пользователей началась!
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
Пользователи бесплатного уровня по умолчанию будут переведены на GPT-4o с ограничением на количество сообщений, которые они могут отправить с помощью GPT-4o. См пост выше про лимиты.
Пользователи Free также получают ограниченный(вот тут нет информации про ограничения) доступ к сообщениям с использованием расширенных инструментов, таких как:
Data analysis
File Uploads
Browse
Discovering and using GPTs - джипитишки для всех, хороший ход.
Vision - очень круто.
Если раскрыть скобки то это:
Интеллект уровня GPT-4
Получение ответы, как от модели, так и из Интернета
Анализ данных и создание графиков и диаграмм
Загрузка картинок и обсуждение их с моделью.
Загрузка файлов для суммаризации и анализа
Работа с памятью (между чатами) - для европы недоступно.
И многое спрашивают, а почему? Если все это бесплатно, то на чем они будут зарабатывать или за какие космические пироги надо будет платить?
Почему? А потому что началась битва за данные. Источником которых являются пользователи, которые петабайтами грузят в chatGPT свои тексты, вирши, картинки, видео, всю эту свою цифровую жизнь. И теперь, открыв gpt-4o для всех, OpenAI получат больше картинок, пдф, csv, файлов и просто текстов. Во-первых, расширив юзер базу, во-вторых, расширив типы данных, которые бесплатные пользователи будут скармливать ИИ на обучение.
Клода открыли для Европы. gpt-4o открыли для бесплатных акков. Битва за данные пользователей началась!
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
OpenAI
Introducing GPT-4o and more tools to ChatGPT free users
Introducing GPT-4o and more tools to ChatGPT free users
We are launching our newest flagship model and making more capabilities available for free in ChatGPT.
We are launching our newest flagship model and making more capabilities available for free in ChatGPT.
👍48🔥14
Ну и последнее про бесплатный сыр.
Сэм Альтман вчера сделал пост в своем блоге. Довольно ровный, но там есть такой абзац.
Разговор с компьютером никогда не казался мне естественным, а теперь это так. По мере добавления (по желанию) персонализации, доступа к вашей информации, возможности совершать действия от вашего имени и т. д., я вижу захватывающее будущее, в котором мы сможем использовать компьютеры для гораздо большего, чем когда-либо прежде.
As we add (optional) personalization, access to your information, the ability to take actions on your behalf, and more, I can really see an exciting future where we are able to use computers to do much more than ever before.
Я мысленно заменил optional на hidden(скрытого) или даже на mandatory(обязательного) добавления персонализации, и понял, что уже поздно. Вы же понимаете, что все ваши ленты и реклама - персонализированы без всякого optional. Почему с ИИ будет по другому?
У нас просто будут иные стратегии поведения. Если будут вообще.
https://blog.samaltman.com/gpt-4o
Сэм Альтман вчера сделал пост в своем блоге. Довольно ровный, но там есть такой абзац.
Разговор с компьютером никогда не казался мне естественным, а теперь это так. По мере добавления (по желанию) персонализации, доступа к вашей информации, возможности совершать действия от вашего имени и т. д., я вижу захватывающее будущее, в котором мы сможем использовать компьютеры для гораздо большего, чем когда-либо прежде.
As we add (optional) personalization, access to your information, the ability to take actions on your behalf, and more, I can really see an exciting future where we are able to use computers to do much more than ever before.
Я мысленно заменил optional на hidden(скрытого) или даже на mandatory(обязательного) добавления персонализации, и понял, что уже поздно. Вы же понимаете, что все ваши ленты и реклама - персонализированы без всякого optional. Почему с ИИ будет по другому?
У нас просто будут иные стратегии поведения. Если будут вообще.
https://blog.samaltman.com/gpt-4o
Sam Altman
GPT-4o
There are two things from our announcement today I wanted to highlight. First, a key part of our mission is to put very capable AI tools in the hands of people for free (or at a great price). I am...
👍44👎3