Forwarded from Сиолошная
Sam Altman departs the company
https://openai.com/blog/openai-announces-leadership-transition
Mr. Altman’s departure follows a deliberative review process by the board, which concluded that
he was not consistently candid in his communications with the board
, hindering its ability to exercise its responsibilities. The board no longer has confidence in his ability to continue leading OpenAI.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯61😁5😱2😢2❤1
🚀 Шокирующие Изменения в OpenAI: Взгляд Грега
🔍 Срочные новости! Грег и его команда в шоке и горе от решения, принятого сегодня советом директоров OpenAI.
🙏 Грег говорит что, хочет выразить благодарность невероятным людям из OpenAI, своим клиентам, инвесторам и всем, кто их поддерживает поддерживает.
🔎 Что мы знаем:
1. Сообщение для Сэма: Вчера вечером Сэм получил сообщение от Ильи с просьбой о встрече в пятницу в полдень. На встрече в Google Meet присутствовал весь совет, кроме Грега. Илья сообщил Сэму, что его увольняют, и новость скоро станет общедоступной.
2. Разговор Грега с Ильей: В 12:19 Грег получил сообщение от Ильи с просьбой о срочном разговоре. В 12:23 Илья отправил ему ссылку на Google Meet. Грегу сообщили, его исключают из совета (но Грег остается важной фигурой в компании и сохраняет свою должность), а также о том, что Сэм уволен. Примерно в то же время OpenAI опубликовала пост в блоге.
3. Остальное руководство: Насколько известно, руководство узнало об этом вскоре после, за исключением Миры, которая узнала накануне вечером.
Грег говорит что бы за них не переживали, впереди большие дела
Твит
🔍 Срочные новости! Грег и его команда в шоке и горе от решения, принятого сегодня советом директоров OpenAI.
🙏 Грег говорит что, хочет выразить благодарность невероятным людям из OpenAI, своим клиентам, инвесторам и всем, кто их поддерживает поддерживает.
🔎 Что мы знаем:
1. Сообщение для Сэма: Вчера вечером Сэм получил сообщение от Ильи с просьбой о встрече в пятницу в полдень. На встрече в Google Meet присутствовал весь совет, кроме Грега. Илья сообщил Сэму, что его увольняют, и новость скоро станет общедоступной.
2. Разговор Грега с Ильей: В 12:19 Грег получил сообщение от Ильи с просьбой о срочном разговоре. В 12:23 Илья отправил ему ссылку на Google Meet. Грегу сообщили, его исключают из совета (но Грег остается важной фигурой в компании и сохраняет свою должность), а также о том, что Сэм уволен. Примерно в то же время OpenAI опубликовала пост в блоге.
3. Остальное руководство: Насколько известно, руководство узнало об этом вскоре после, за исключением Миры, которая узнала накануне вечером.
Грег говорит что бы за них не переживали, впереди большие дела
Твит
😱21🤯3👍2🔥2❤1
AI для Всех
🚀 Шокирующие Изменения в OpenAI: Взгляд Грега 🔍 Срочные новости! Грег и его команда в шоке и горе от решения, принятого сегодня советом директоров OpenAI. 🙏 Грег говорит что, хочет выразить благодарность невероятным людям из OpenAI, своим клиентам, инвесторам…
То есть по сути science (Илья) and tech (Мира) блок свергнул бизнессовый блок (Сэм и Грег). AGI achieved internally?
👍23😁21
Vuink.com
Details emerge of surprise board coup that ousted CEO Sam Altman at OpenAI
On Friday, OpenAI fired CEO Sam Altman in a surprise move that led to the resignation of President Greg Brockman and three senior scientists. The move.
Свежие подробности о неожиданном перевороте в совете директоров OpenAI, который привёл к увольнению генерального директора Сэма Альтмана.
🤖 В пятницу OpenAI уволила генерального директора Сэма Альтмана, что стало сюрпризом и привело к отставке президента Грега Брокмана и трёх старших учёных. Это решение застало врасплох ключевого инвестора и миноритарного собственника Microsoft, вызвав, как сообщается, гнев генерального директора Сатьи Наделлы. Сообщается, что за кулисами всё это было организовано главным учёным Ильёй Суцкевером из-за опасений по поводу безопасности и скорости внедрения технологий OpenAI.
🌐 "Это было выполнением обязанностей совета в отношении миссии некоммерческой организации, которая заключается в том, чтобы OpenAI создала AGI, приносящую пользу всему человечеству", - сказал Суцкевер сотрудникам на срочном собрании в пятницу днём, как сообщает The Information.
🚀 С момента своего основания OpenAI стремится к разработке искусственного общего интеллекта (AGI), который является гипотетической технологией, способной выполнять любую интеллектуальную задачу, которую может выполнить человек, потенциально заменяя множество людей на их рабочих местах.
💡 Внутри OpenAI, по словам информированных источников, возникли разногласия относительно темпа, с которым Альтман настаивал на коммерциализации и росте компании, в то время как Суцкевер призывал замедлить процесс. Источники сообщили журналисту Каре Свишер, что мероприятие OpenAI's Dev Day, проведённое 6 ноября, с участием Сэма в роли ведущего на ключевой презентации, продвигающей продукты, похожие на потребительские, было "поворотным моментом Альтмана, который шёл слишком далеко и слишком быстро.
Другое дело, что этого джина назад в бутылку уже не загонишь, потребительские продукты в виде ассистентов опредленно никуда не денутся, даже если OpenAI запретит их с концами (еще есть Антропик, которые молчат, есть Llama и всякие Мистрали)
Ссылка
🤖 В пятницу OpenAI уволила генерального директора Сэма Альтмана, что стало сюрпризом и привело к отставке президента Грега Брокмана и трёх старших учёных. Это решение застало врасплох ключевого инвестора и миноритарного собственника Microsoft, вызвав, как сообщается, гнев генерального директора Сатьи Наделлы. Сообщается, что за кулисами всё это было организовано главным учёным Ильёй Суцкевером из-за опасений по поводу безопасности и скорости внедрения технологий OpenAI.
🌐 "Это было выполнением обязанностей совета в отношении миссии некоммерческой организации, которая заключается в том, чтобы OpenAI создала AGI, приносящую пользу всему человечеству", - сказал Суцкевер сотрудникам на срочном собрании в пятницу днём, как сообщает The Information.
🚀 С момента своего основания OpenAI стремится к разработке искусственного общего интеллекта (AGI), который является гипотетической технологией, способной выполнять любую интеллектуальную задачу, которую может выполнить человек, потенциально заменяя множество людей на их рабочих местах.
💡 Внутри OpenAI, по словам информированных источников, возникли разногласия относительно темпа, с которым Альтман настаивал на коммерциализации и росте компании, в то время как Суцкевер призывал замедлить процесс. Источники сообщили журналисту Каре Свишер, что мероприятие OpenAI's Dev Day, проведённое 6 ноября, с участием Сэма в роли ведущего на ключевой презентации, продвигающей продукты, похожие на потребительские, было "поворотным моментом Альтмана, который шёл слишком далеко и слишком быстро.
Другое дело, что этого джина назад в бутылку уже не загонишь, потребительские продукты в виде ассистентов опредленно никуда не денутся, даже если OpenAI запретит их с концами (еще есть Антропик, которые молчат, есть Llama и всякие Мистрали)
Ссылка
👍27🤯5😱2❤1
Новая эра AI-разработки с PartyRock от Amazon
Ещё не улеглись конфетти после запуска GPTs, а Amazon уже представляет PartyRock – новый уровень создания AI-приложений без кода!
PartyRock в сотрудничестве с Amazon Bedrock делает передовые AI-модели доступными для всех, открывая двери в мир инноваций и креатива.
Платформа позволяет легко создавать приложения без навыков программирования – идеально подходит как для профессионалов, так и для новичков.
PartyRock меняет правила игры, делая AI-разработку доступной, эффективной и творческой.
Попробуйте сами и присоединяйтесь к революции AI-разработки уже сегодня, потому что it’s happening.
Ещё не улеглись конфетти после запуска GPTs, а Amazon уже представляет PartyRock – новый уровень создания AI-приложений без кода!
PartyRock в сотрудничестве с Amazon Bedrock делает передовые AI-модели доступными для всех, открывая двери в мир инноваций и креатива.
Платформа позволяет легко создавать приложения без навыков программирования – идеально подходит как для профессионалов, так и для новичков.
PartyRock меняет правила игры, делая AI-разработку доступной, эффективной и творческой.
Попробуйте сами и присоединяйтесь к революции AI-разработки уже сегодня, потому что it’s happening.
🔥16❤2😱1🤩1
Катализаторы для производства кислорода из марсианских метеоритов
На Земле такая неразбериха, что временами хочется паковать чемоданы на Марс. Хорошо, что ученые разобрались с перспективой подышать. Используя... марсианские камни.
В Nature вышла публикация о роботизированном ИИ-химике для синтеза катализаторов кислородной эволюции (OER) из марсианских метеоритов. В соавторах физика, химия, нейросети и байесовская оптимизация.
Итак план такой:
1. Анализ марсианских руд: используем лазерную спектроскопию (LIBS) для определения состава пород.
2. Симуляции и расчеты: Используем молекулярную динамику (MD) и теорию функционала плотности (DFT) для оценки активности OER. Не, ну вдруг специалисты читают.
3. Несколько fully connected слоев: На 243 наборах экспериментальных данных и 29 902 результатах симуляции, обучили два персептрона для предсказания активности OER.
4. Байесовская оптимизация: Определяем оптимальный состав катализатора из 3,764,376 возможных формул.
Как POV система успешно синтезировала катализатор, поддерживающий OER с перенапряжением 445.1 мВ (это такой электрохимический эквивалент энергии активации) на протяжении более 550 000 секунд и прошла стресс-тест при температуре -37°С.
Открытие значительно ускоряет поиск подходящих синтетических соединений, по сравнению с традиционными методами (ака "проб и ошибок") и подтверждает возможность стабильно производить кислород в суровых условиях Марса.
Ура, теперь есть что положить в чемодан!
Правда, @karray говорит, что там ещё и с вайфаем проблемы🤔
💾 Git
📖Nature
На Земле такая неразбериха, что временами хочется паковать чемоданы на Марс. Хорошо, что ученые разобрались с перспективой подышать. Используя... марсианские камни.
В Nature вышла публикация о роботизированном ИИ-химике для синтеза катализаторов кислородной эволюции (OER) из марсианских метеоритов. В соавторах физика, химия, нейросети и байесовская оптимизация.
Итак план такой:
1. Анализ марсианских руд: используем лазерную спектроскопию (LIBS) для определения состава пород.
2. Симуляции и расчеты: Используем молекулярную динамику (MD) и теорию функционала плотности (DFT) для оценки активности OER. Не, ну вдруг специалисты читают.
3. Несколько fully connected слоев: На 243 наборах экспериментальных данных и 29 902 результатах симуляции, обучили два персептрона для предсказания активности OER.
4. Байесовская оптимизация: Определяем оптимальный состав катализатора из 3,764,376 возможных формул.
Как POV система успешно синтезировала катализатор, поддерживающий OER с перенапряжением 445.1 мВ (это такой электрохимический эквивалент энергии активации) на протяжении более 550 000 секунд и прошла стресс-тест при температуре -37°С.
Открытие значительно ускоряет поиск подходящих синтетических соединений, по сравнению с традиционными методами (ака "проб и ошибок") и подтверждает возможность стабильно производить кислород в суровых условиях Марса.
Ура, теперь есть что положить в чемодан!
Правда, @karray говорит, что там ещё и с вайфаем проблемы
📖Nature
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19🔥9😁4
Чувствуете насколько разверзлась пропасть между теми у кого есть ChatGPT+ и у кого нет?
Anonymous Poll
31%
Да
39%
Нет
16%
О чем речь вообще???
14%
Что происхоодит??? Ааааа???
Время Больших Волн - Время Больших Возможностей!
Друзья, мы живём в удивительное время, когда каждый день приносит нам новые вызовы и новые возможности. В этом смысле, жизнь стала похожа на серфинг. Как и в серфинге, чтобы поймать свою идеальную волну, нужно сначала приложить много усилий. 🏄♂️
Представьте: мы на доске, плывём на глубину, куда ведёт нас наша уверенность и стремление. Это наш путь к Silicon Valley, к месту, где рождаются великие идеи и большие деньги. Мы поворачиваемся спиной к глубине, готовясь к встрече с волной. И вот она приближается!
Теперь самое время расслабиться и чувствовать момент. Волна подхватывает нас, и мы начинаем грести, используя всю свою энергию и навыки.
Как кричал мой инструктор по серфингу: Paddle! Paddle! Paddle! Paddle!
Мне кажется что мы сейчас здесь, в эпицентре событий, готовы покорять новые высоты. Это наш момент! Большие волны приносят большие возможности. Наше дело грести! Волна уже тут.
Давайте вместе поймаем свою волну успеха!
Друзья, мы живём в удивительное время, когда каждый день приносит нам новые вызовы и новые возможности. В этом смысле, жизнь стала похожа на серфинг. Как и в серфинге, чтобы поймать свою идеальную волну, нужно сначала приложить много усилий. 🏄♂️
Представьте: мы на доске, плывём на глубину, куда ведёт нас наша уверенность и стремление. Это наш путь к Silicon Valley, к месту, где рождаются великие идеи и большие деньги. Мы поворачиваемся спиной к глубине, готовясь к встрече с волной. И вот она приближается!
Теперь самое время расслабиться и чувствовать момент. Волна подхватывает нас, и мы начинаем грести, используя всю свою энергию и навыки.
Как кричал мой инструктор по серфингу: Paddle! Paddle! Paddle! Paddle!
Мне кажется что мы сейчас здесь, в эпицентре событий, готовы покорять новые высоты. Это наш момент! Большие волны приносят большие возможности. Наше дело грести! Волна уже тут.
Давайте вместе поймаем свою волну успеха!
🔥21😁12❤5🎉2🤩2
GPT-4V и мультимодальное планирование задач позволяет роботам интерпретировать и копировать действия людей
Вы замечали, как учатся дети? Часто они могут повторить действие за своим взрослым с первого раза. Так сказать, zero-shot learning. Вчера мы проснулись в мире, где роботы тоже могут учиться, просто наблюдая за людьми, копируя наши движения и перенимая навыки, словно маленькие дети, исследующие мир. Все благодаря GPT-4V и новой технологии планирования задач.
В недавнем исследовании ученые из Microsoft представили систему, использующую GPT-4V(Vision) для анализа видео с демонтрациями различных действий для zero-shot обучения роботов, включая понимание возможностей объектов (affordances). С помощью GPT-4V система преобразует детали окружающей среды и действия в текст, после чего задействует планировщик задач на базе GPT-4. Затем CV алгоритмы еще раз анализируют видео с учетом плана с фокусом на взаимодействии рук и объектов, особенно моментах захвата и отпускания объектов. Такой пайплайн обеспечивает "понимание" контекста, физических возможностей и конечных целей, что крайне полезно для выполнения задач роботами.
Надеюсь, уже все знают "побочки" такого способа человеческого обучения - дети с намного большим приоритетом копируют поведение, чем следуют инструкциям. Кажется, нас ждет будущее с ругающимися матом, курящими роботами, впадающими в депрессивные эпизоды🤖
📕 Статья
🖥 Промпты (code coming soon)
Вы замечали, как учатся дети? Часто они могут повторить действие за своим взрослым с первого раза. Так сказать, zero-shot learning. Вчера мы проснулись в мире, где роботы тоже могут учиться, просто наблюдая за людьми, копируя наши движения и перенимая навыки, словно маленькие дети, исследующие мир. Все благодаря GPT-4V и новой технологии планирования задач.
В недавнем исследовании ученые из Microsoft представили систему, использующую GPT-4V(Vision) для анализа видео с демонтрациями различных действий для zero-shot обучения роботов, включая понимание возможностей объектов (affordances). С помощью GPT-4V система преобразует детали окружающей среды и действия в текст, после чего задействует планировщик задач на базе GPT-4. Затем CV алгоритмы еще раз анализируют видео с учетом плана с фокусом на взаимодействии рук и объектов, особенно моментах захвата и отпускания объектов. Такой пайплайн обеспечивает "понимание" контекста, физических возможностей и конечных целей, что крайне полезно для выполнения задач роботами.
Надеюсь, уже все знают "побочки" такого способа человеческого обучения - дети с намного большим приоритетом копируют поведение, чем следуют инструкциям. Кажется, нас ждет будущее с ругающимися матом, курящими роботами, впадающими в депрессивные эпизоды
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29😁11👍7🤯5❤3🎉1
Anthropic представляет Claude 2.1: Новый уровень AI для бизнеса
🔥 Claude 2.1 значительно улучшает работу с большими данными и уменьшает количество галлюцинаций.
Компания Anthropic (пока что главные конкуренты OpenAI) разработала обновлённую модель AI, Claude 2.1, которая превосходит предыдущие версии своей эффективностью и точностью.
Claude 2.1 вдвое увеличивает объём обрабатываемой информации – до 200 тысяч токенов. Также модель стала на 50% точнее, уменьшив количество ошибок и неверных утверждений. А еще так же как и ChatGPT, у Claude теперь есть доступ к внешним API (actions).
Эти улучшения делают Claude 2.1 отличным выбором для предприятий, стремящихся использовать AI для анализа больших объёмов данных и повышения эффективности своей работы.
Подробнее о модели
🔥 Claude 2.1 значительно улучшает работу с большими данными и уменьшает количество галлюцинаций.
Компания Anthropic (пока что главные конкуренты OpenAI) разработала обновлённую модель AI, Claude 2.1, которая превосходит предыдущие версии своей эффективностью и точностью.
Claude 2.1 вдвое увеличивает объём обрабатываемой информации – до 200 тысяч токенов. Также модель стала на 50% точнее, уменьшив количество ошибок и неверных утверждений. А еще так же как и ChatGPT, у Claude теперь есть доступ к внешним API (actions).
Эти улучшения делают Claude 2.1 отличным выбором для предприятий, стремящихся использовать AI для анализа больших объёмов данных и повышения эффективности своей работы.
Подробнее о модели
👍21🎉5❤1
Воркшоп про LLM Агентов
Не пропустите бесплатный воркшоп о LLM Агентах – одном из самых востребованных направлений в области больших языковых моделей! Эксперты-основатели LlamaIndex и TruEra расскажут, как разрабатывать, оценивать и улучшать LLM Агентов, чтобы вы могли быстро создавать мощные и эффективные решения для ваших проблем.
📚 На воркшопе вы узнаете:
• Как использовать фреймворк LlamaIndex для создания LLM Агента.
• Как оценить LLM Агента с помощью открытых инструментов наблюдения за LLM, таких как TruLens, тестируя эффективность, склонность к галлюцинациям и предвзятость.
• Как шаг за шагом добиться создания эффективного приложения, готового к внедрению в производство.
• Что делать для поддержания высокой производительности вашего агента после запуска.
🎥 Не можете присутствовать в реальном времени? Не беспокойтесь. Запись сессии будет отправлена всем зарегистрированным участникам.
🌟 Не упустите эту возможность! Присоединяйтесь к воршопу в 10 утра по тихоокеанскому времени во вторник, 5 декабря.
Регистрируйтесь сейчас!
Не пропустите бесплатный воркшоп о LLM Агентах – одном из самых востребованных направлений в области больших языковых моделей! Эксперты-основатели LlamaIndex и TruEra расскажут, как разрабатывать, оценивать и улучшать LLM Агентов, чтобы вы могли быстро создавать мощные и эффективные решения для ваших проблем.
📚 На воркшопе вы узнаете:
• Как использовать фреймворк LlamaIndex для создания LLM Агента.
• Как оценить LLM Агента с помощью открытых инструментов наблюдения за LLM, таких как TruLens, тестируя эффективность, склонность к галлюцинациям и предвзятость.
• Как шаг за шагом добиться создания эффективного приложения, готового к внедрению в производство.
• Что делать для поддержания высокой производительности вашего агента после запуска.
🎥 Не можете присутствовать в реальном времени? Не беспокойтесь. Запись сессии будет отправлена всем зарегистрированным участникам.
🌟 Не упустите эту возможность! Присоединяйтесь к воршопу в 10 утра по тихоокеанскому времени во вторник, 5 декабря.
Регистрируйтесь сейчас!
👍8🔥4❤1
Forwarded from Сиолошная
До слёз
Sama — CEO. При этом, не член совета директоров. То есть дальнейшую судьбу компании решают:
Bret Taylor, ex-CEO Salesforce и создатель Google Maps — станет председателем совета директоров.
Larry Summers, президент Harvard University с 2001 по 2006 — получит место за столом директоров.
Adam D'Angelo — сохранит своё место за столом директоров.
Что будет с Ilya Sutskever — пока не уточняется. Моё предположение что он останется в компании без права голоса в совете директоров.
Greg Brockman также возвращается в компанию.
Остальные детали появятся позже. Согласно источникам TheVerge, совет директоров будет расширен до 9 человек, а задача состава выше — определить, кто это будет.
Sama — CEO. При этом, не член совета директоров. То есть дальнейшую судьбу компании решают:
Bret Taylor, ex-CEO Salesforce и создатель Google Maps — станет председателем совета директоров.
Larry Summers, президент Harvard University с 2001 по 2006 — получит место за столом директоров.
Adam D'Angelo — сохранит своё место за столом директоров.
Что будет с Ilya Sutskever — пока не уточняется. Моё предположение что он останется в компании без права голоса в совете директоров.
Greg Brockman также возвращается в компанию.
Остальные детали появятся позже. Согласно источникам TheVerge, совет директоров будет расширен до 9 человек, а задача состава выше — определить, кто это будет.
❤14🤯7😁6
Дети vs ИИ: инновации, которые машины еще не освоили
Когда дело доходит до инноваций и творчества, дети, кажется, превосходят даже самые большие LLM+vision модели, несмотря на их впечатляющие способности к имитации и статистическому распознаванию закономерностей.
Исследователи из Berkley провели эксперименты с "имитационным" и "инновационным" компонентом и предложили любопытные соображения:
1. LLM – пока, скорее, культурные технологии
Как и более ранние аналоги: письмо, печать, интернет и даже сам язык, они кодифицируют, обобщают и организуют информацию, обеспечивая и облегчая ее передачу.
2. Развитие инновационных навыков зависит от баланса между двумя (противоречащими) когнитивными процессами: имитации и поиска истины.
В терминах ИИ полезно думать, что имитация - это интерполяционное обобщение, а поиск истины - обобщение за пределами распределения.
3. Способность использовать инструменты для решения задач (tool innovation) - маркер интеллекта
В эксперименте детям от 3 до 7 лет показывали, как нарисовать круг циркулем. А затем предложили выбрать между линейкой, плитой и чайником с круглым дном.
В "имитационной" части - чтобы был комплект к циркулю, т.е. задача выбрать схожий объект, линейку (дети=88.4%, GPT4=83,3%, Davinci=59,9%, Claude=69,9%, Flan=74,8%).
В "инновационной" части - чтобы нарисовать круг без циркуля. И тут обнаружилась разница. Дети выбирали функционально значимый объект, чайник (85.2%), а LLM - по-прежнему, линейку (GPT4=75,9%; Davinci=8,87%; Claude=58,2%; Flan=45,7%).
4. Экспериментальный поиск истины не работает без способности выводить причинно-следственные связи.
Вкратце, дети обошли ChatGPT, PaLM, LaMDA, Advantage Actor Critic и Proximal Policy Optimization Version 2.
В итоге, даже несмотря на успехи в клонировании действий, по мнению авторов статьи, для AGI уже недостаточно увеличивать объем данных и обучать с подкреплением, пора идти в психологию развития за механизмами человеческого обучения и разбираться, что является критически эффективным.
👼 Статья
Когда дело доходит до инноваций и творчества, дети, кажется, превосходят даже самые большие LLM+vision модели, несмотря на их впечатляющие способности к имитации и статистическому распознаванию закономерностей.
Исследователи из Berkley провели эксперименты с "имитационным" и "инновационным" компонентом и предложили любопытные соображения:
1. LLM – пока, скорее, культурные технологии
Как и более ранние аналоги: письмо, печать, интернет и даже сам язык, они кодифицируют, обобщают и организуют информацию, обеспечивая и облегчая ее передачу.
2. Развитие инновационных навыков зависит от баланса между двумя (противоречащими) когнитивными процессами: имитации и поиска истины.
В терминах ИИ полезно думать, что имитация - это интерполяционное обобщение, а поиск истины - обобщение за пределами распределения.
3. Способность использовать инструменты для решения задач (tool innovation) - маркер интеллекта
В эксперименте детям от 3 до 7 лет показывали, как нарисовать круг циркулем. А затем предложили выбрать между линейкой, плитой и чайником с круглым дном.
В "имитационной" части - чтобы был комплект к циркулю, т.е. задача выбрать схожий объект, линейку (дети=88.4%, GPT4=83,3%, Davinci=59,9%, Claude=69,9%, Flan=74,8%).
В "инновационной" части - чтобы нарисовать круг без циркуля. И тут обнаружилась разница. Дети выбирали функционально значимый объект, чайник (85.2%), а LLM - по-прежнему, линейку (GPT4=75,9%; Davinci=8,87%; Claude=58,2%; Flan=45,7%).
4. Экспериментальный поиск истины не работает без способности выводить причинно-следственные связи.
Вкратце, дети обошли ChatGPT, PaLM, LaMDA, Advantage Actor Critic и Proximal Policy Optimization Version 2.
В итоге, даже несмотря на успехи в клонировании действий, по мнению авторов статьи, для AGI уже недостаточно увеличивать объем данных и обучать с подкреплением, пора идти в психологию развития за механизмами человеческого обучения и разбираться, что является критически эффективным.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥7❤3
“Give People Things” Machine
Каждое обращение к ChatGPT — это не просто поболтать с прикольным ботом, это взаимодействие, в котором ты даришь искусственному интеллекту кусочек своего сознания, данные о своей личности.
Такое взаимодействие позволяет ChatGPT узнать про тебя что-то новое, что бы еще лучше заалайниться (to align with) с тобой. И в конечном счете идеально соответствовать твоему запросу. Ровно так как ты хотел.
С помощью ассистентов это делать стало проще, потому что теперь есть возможность общаться очень прицельно.
Попробуйте написать в GPT Builder:
Попросите его подгрузить всю документацию и продолжайте рассказывать ему ваше видение.
Следуя идеологии YCombinator “создавать то, что нужно людям”, Сэм стремится сделать ChatGPT ультимативным инструментом, способным удовлетворять любые запросы пользователя. А с помощью ассистентов мы все ему в этом поможем.
Цена не велика, всего 20$ за все услуги мира. Ультимативный SuperApp.
Так OpenAI (и другие LLM-провайдеры) получают уникальные данные, проводя через это взаимодействие неявное обучение с подкреплением (тот самый RLHF - Reinforcement Learning from Human Feedback ).
Следующий уровень: мы берём донельзя напичканный сенсорами VisionPro и начинаем алайнить на уровне биологической реакции.
И это не CyberPunk 2077, это San Francisco 2023.
Каждое обращение к ChatGPT — это не просто поболтать с прикольным ботом, это взаимодействие, в котором ты даришь искусственному интеллекту кусочек своего сознания, данные о своей личности.
Такое взаимодействие позволяет ChatGPT узнать про тебя что-то новое, что бы еще лучше заалайниться (to align with) с тобой. И в конечном счете идеально соответствовать твоему запросу. Ровно так как ты хотел.
С помощью ассистентов это делать стало проще, потому что теперь есть возможность общаться очень прицельно.
Попробуйте написать в GPT Builder:
assume a role of React.js expert from award winning webstudio, use knowledge and source code to build me a website
Попросите его подгрузить всю документацию и продолжайте рассказывать ему ваше видение.
Следуя идеологии YCombinator “создавать то, что нужно людям”, Сэм стремится сделать ChatGPT ультимативным инструментом, способным удовлетворять любые запросы пользователя. А с помощью ассистентов мы все ему в этом поможем.
Цена не велика, всего 20$ за все услуги мира. Ультимативный SuperApp.
Так OpenAI (и другие LLM-провайдеры) получают уникальные данные, проводя через это взаимодействие неявное обучение с подкреплением (тот самый RLHF - Reinforcement Learning from Human Feedback ).
Следующий уровень: мы берём донельзя напичканный сенсорами VisionPro и начинаем алайнить на уровне биологической реакции.
И это не CyberPunk 2077, это San Francisco 2023.
🤯20👍9😢2
GAIA: бенчмарк AI агентов, который поможет им стать лучше
GAIA - это новый бенчмарк для AI-ассистентов, предлагающий реальные задачи, которые выявляют пробелы в существующих технологиях AI.
Статья "GAIA: A Benchmark for General AI Assistants", написаная Грегуаром Миалоном и Яном ЛеКуном из Meta (FAIR), Клемантинои Фурье (clem) и Томасом Вольфом из HuggingFace, Крэйгом Свифтом из AutoGPT и Томасом Скиаломом из GenAI Meta представляет собой новаторский подход к оценке возможностей AI-ассистентов.
GAIA ориентирован на тестирование AI-ассистентов в условиях, максимально приближенных к реальным, требуя от них продемонстрировать способности к рассуждению, мультимодальности, веб-браузингу и владению инструментами. Статистика показывает, что, в то время как люди демонстрируют успех в 92% случаев, GPT-4 с подключенными плагинами достигает поставленной цели лишь в 15% случаев.
Бенчмарк включает в себя 466 вопросов, разделенных на три уровня сложности, каждый из которых предполагает использование различных инструментов и подходов к решению.
Несмотря на успехи современных языковых моделях GAIA выявляет значительные пробелы в их способностях к решению практических задач, подчеркивая необходимость дальнейшего развития и улучшения AI-ассистентов.
Авторы подчеркивают важность создания вопросов, не содержащих двусмысленности, и предлагают проведение оценок, включающих в себя как человеческую, так и модельную экспертизу для более точного анализа возможностей AI-систем.
😛 Статья
🥳 Лидерборд
GAIA - это новый бенчмарк для AI-ассистентов, предлагающий реальные задачи, которые выявляют пробелы в существующих технологиях AI.
Статья "GAIA: A Benchmark for General AI Assistants", написаная Грегуаром Миалоном и Яном ЛеКуном из Meta (FAIR), Клемантинои Фурье (clem) и Томасом Вольфом из HuggingFace, Крэйгом Свифтом из AutoGPT и Томасом Скиаломом из GenAI Meta представляет собой новаторский подход к оценке возможностей AI-ассистентов.
GAIA ориентирован на тестирование AI-ассистентов в условиях, максимально приближенных к реальным, требуя от них продемонстрировать способности к рассуждению, мультимодальности, веб-браузингу и владению инструментами. Статистика показывает, что, в то время как люди демонстрируют успех в 92% случаев, GPT-4 с подключенными плагинами достигает поставленной цели лишь в 15% случаев.
Бенчмарк включает в себя 466 вопросов, разделенных на три уровня сложности, каждый из которых предполагает использование различных инструментов и подходов к решению.
Несмотря на успехи современных языковых моделях GAIA выявляет значительные пробелы в их способностях к решению практических задач, подчеркивая необходимость дальнейшего развития и улучшения AI-ассистентов.
Авторы подчеркивают важность создания вопросов, не содержащих двусмысленности, и предлагают проведение оценок, включающих в себя как человеческую, так и модельную экспертизу для более точного анализа возможностей AI-систем.
😛 Статья
🥳 Лидерборд
❤13👍7🔥1