AI для Всех
14.9K subscribers
1.31K photos
178 videos
11 files
1.5K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
GPT-4V и мультимодальное планирование задач позволяет роботам интерпретировать и копировать действия людей

Вы замечали, как учатся дети? Часто они могут повторить действие за своим взрослым с первого раза. Так сказать, zero-shot learning. Вчера мы проснулись в мире, где роботы тоже могут учиться, просто наблюдая за людьми, копируя наши движения и перенимая навыки, словно маленькие дети, исследующие мир. Все благодаря GPT-4V и новой технологии планирования задач.

В недавнем исследовании ученые из Microsoft представили систему, использующую GPT-4V(Vision) для анализа видео с демонтрациями различных действий для zero-shot обучения роботов, включая понимание возможностей объектов (affordances). С помощью GPT-4V система преобразует детали окружающей среды и действия в текст, после чего задействует планировщик задач на базе GPT-4. Затем CV алгоритмы еще раз анализируют видео с учетом плана с фокусом на взаимодействии рук и объектов, особенно моментах захвата и отпускания объектов. Такой пайплайн обеспечивает "понимание" контекста, физических возможностей и конечных целей, что крайне полезно для выполнения задач роботами.

Надеюсь, уже все знают "побочки" такого способа человеческого обучения - дети с намного большим приоритетом копируют поведение, чем следуют инструкциям. Кажется, нас ждет будущее с ругающимися матом, курящими роботами, впадающими в депрессивные эпизоды🤖

📕 Статья
🖥 Промпты (code coming soon)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29😁11👍7🤯53🎉1
Пока в OpenAI происходит драма, подъехали релевантные мемы
😁29😢51🔥1
Anthropic представляет Claude 2.1: Новый уровень AI для бизнеса

🔥 Claude 2.1 значительно улучшает работу с большими данными и уменьшает количество галлюцинаций.

Компания Anthropic (пока что главные конкуренты OpenAI) разработала обновлённую модель AI, Claude 2.1, которая превосходит предыдущие версии своей эффективностью и точностью.

Claude 2.1 вдвое увеличивает объём обрабатываемой информации – до 200 тысяч токенов. Также модель стала на 50% точнее, уменьшив количество ошибок и неверных утверждений. А еще так же как и ChatGPT, у Claude теперь есть доступ к внешним API (actions).

Эти улучшения делают Claude 2.1 отличным выбором для предприятий, стремящихся использовать AI для анализа больших объёмов данных и повышения эффективности своей работы.

Подробнее о модели
👍21🎉51
Воркшоп про LLM Агентов

Не пропустите бесплатный воркшоп о LLM Агентах – одном из самых востребованных направлений в области больших языковых моделей! Эксперты-основатели LlamaIndex и TruEra расскажут, как разрабатывать, оценивать и улучшать LLM Агентов, чтобы вы могли быстро создавать мощные и эффективные решения для ваших проблем.

📚 На воркшопе вы узнаете:
• Как использовать фреймворк LlamaIndex для создания LLM Агента.
• Как оценить LLM Агента с помощью открытых инструментов наблюдения за LLM, таких как TruLens, тестируя эффективность, склонность к галлюцинациям и предвзятость.
• Как шаг за шагом добиться создания эффективного приложения, готового к внедрению в производство.
• Что делать для поддержания высокой производительности вашего агента после запуска.

🎥 Не можете присутствовать в реальном времени? Не беспокойтесь. Запись сессии будет отправлена всем зарегистрированным участникам.

🌟 Не упустите эту возможность! Присоединяйтесь к воршопу в 10 утра по тихоокеанскому времени во вторник, 5 декабря.

Регистрируйтесь сейчас!
👍8🔥41
Forwarded from Сиолошная
До слёз

Sama — CEO. При этом, не член совета директоров. То есть дальнейшую судьбу компании решают:

Bret Taylor, ex-CEO Salesforce и создатель Google Maps — станет председателем совета директоров.
Larry Summers, президент Harvard University с 2001 по 2006 — получит место за столом директоров.
Adam D'Angelo — сохранит своё место за столом директоров.

Что будет с Ilya Sutskever — пока не уточняется. Моё предположение что он останется в компании без права голоса в совете директоров.
Greg Brockman также возвращается в компанию.

Остальные детали появятся позже. Согласно источникам TheVerge, совет директоров будет расширен до 9 человек, а задача состава выше — определить, кто это будет.
14🤯7😁6
Дети vs ИИ: инновации, которые машины еще не освоили

Когда дело доходит до инноваций и творчества, дети, кажется, превосходят даже самые большие LLM+vision модели, несмотря на их впечатляющие способности к имитации и статистическому распознаванию закономерностей.

Исследователи из Berkley провели эксперименты с "имитационным" и "инновационным" компонентом и предложили любопытные соображения:

1. LLM – пока, скорее, культурные технологии
Как и более ранние аналоги: письмо, печать, интернет и даже сам язык​​​​, они кодифицируют, обобщают и организуют информацию, обеспечивая и облегчая ее передачу.

2. Развитие инновационных навыков зависит от баланса между двумя (противоречащими) когнитивными процессами: имитации и поиска истины.
В терминах ИИ полезно думать, что имитация - это интерполяционное обобщение, а поиск истины - обобщение за пределами распределения.

3. Способность использовать инструменты для решения задач (tool innovation) - маркер интеллекта
В эксперименте детям от 3 до 7 лет показывали, как нарисовать круг циркулем. А затем предложили выбрать между линейкой, плитой и чайником с круглым дном.
В "имитационной" части - чтобы был комплект к циркулю, т.е. задача выбрать схожий объект, линейку (дети=88.4%, GPT4=83,3%, Davinci=59,9%, Claude=69,9%, Flan=74,8%).
В "инновационной" части - чтобы нарисовать круг без циркуля. И тут обнаружилась разница. Дети выбирали функционально значимый объект, чайник (85.2%), а LLM - по-прежнему, линейку (GPT4=75,9%; Davinci=8,87%; Claude=58,2%; Flan=45,7%).

4. Экспериментальный поиск истины не работает без способности выводить причинно-следственные связи.
Вкратце, дети обошли ChatGPT, PaLM, LaMDA, Advantage Actor Critic и Proximal Policy Optimization Version 2.

В итоге, даже несмотря на успехи в клонировании действий, по мнению авторов статьи, для AGI уже недостаточно увеличивать объем данных и обучать с подкреплением, пора идти в психологию развития за механизмами человеческого обучения и разбираться, что является критически эффективным.

👼Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥73
Give People Things” Machine

Каждое обращение к ChatGPT — это не просто поболтать с прикольным ботом, это взаимодействие, в котором ты даришь искусственному интеллекту кусочек своего сознания, данные о своей личности.

Такое взаимодействие позволяет ChatGPT узнать про тебя что-то новое, что бы еще лучше заалайниться (to align with) с тобой. И в конечном счете идеально соответствовать твоему запросу. Ровно так как ты хотел.

С помощью ассистентов это делать стало проще, потому что теперь есть возможность общаться очень прицельно.

Попробуйте написать в GPT Builder:

assume a role of React.js expert from award winning webstudio, use knowledge and source code to build me a website

Попросите его подгрузить всю документацию и продолжайте рассказывать ему ваше видение.

Следуя идеологии YCombinator “создавать то, что нужно людям”, Сэм стремится сделать ChatGPT ультимативным инструментом, способным удовлетворять любые запросы пользователя. А с помощью ассистентов мы все ему в этом поможем.

Цена не велика, всего 20$ за все услуги мира. Ультимативный SuperApp.

Так OpenAI (и другие LLM-провайдеры) получают уникальные данные, проводя через это взаимодействие неявное обучение с подкреплением (тот самый RLHF - Reinforcement Learning from Human Feedback ).

Следующий уровень: мы берём донельзя напичканный сенсорами VisionPro и начинаем алайнить на уровне биологической реакции.

И это не CyberPunk 2077, это San Francisco 2023.
🤯20👍9😢2
GAIA: бенчмарк AI агентов, который поможет им стать лучше

GAIA - это новый бенчмарк для AI-ассистентов, предлагающий реальные задачи, которые выявляют пробелы в существующих технологиях AI.

Статья "GAIA: A Benchmark for General AI Assistants", написаная Грегуаром Миалоном и Яном ЛеКуном из Meta (FAIR), Клемантинои Фурье (clem) и Томасом Вольфом из HuggingFace, Крэйгом Свифтом из AutoGPT и Томасом Скиаломом из GenAI Meta представляет собой новаторский подход к оценке возможностей AI-ассистентов.

GAIA ориентирован на тестирование AI-ассистентов в условиях, максимально приближенных к реальным, требуя от них продемонстрировать способности к рассуждению, мультимодальности, веб-браузингу и владению инструментами. Статистика показывает, что, в то время как люди демонстрируют успех в 92% случаев, GPT-4 с подключенными плагинами достигает поставленной цели лишь в 15% случаев.

Бенчмарк включает в себя 466 вопросов, разделенных на три уровня сложности, каждый из которых предполагает использование различных инструментов и подходов к решению.

Несмотря на успехи современных языковых моделях GAIA выявляет значительные пробелы в их способностях к решению практических задач, подчеркивая необходимость дальнейшего развития и улучшения AI-ассистентов.

Авторы подчеркивают важность создания вопросов, не содержащих двусмысленности, и предлагают проведение оценок, включающих в себя как человеческую, так и модельную экспертизу для более точного анализа возможностей AI-систем.

😛 Статья
🥳 Лидерборд
13👍7🔥1
Forwarded from эйай ньюз
Там Карпатый опять отжигает. Он выпустил часовую лекцию «Интро в большие языковые модели».

Образовательный контент от Карпатого всегда топовый. Нужно смотреть! #ликбез

Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard

Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS

Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions

Слайды

@ai_newz
🔥494👍1
Channel name was changed to «AI for Science»
AI для Всех
Channel name was changed to «AI for Science»
Кажется название канала начало ограничивать его рост. Предлагайте в комментариях новые.
Дата-центры: скрытые энергогиганты.

В то время как общество все больше концентрируется на энергоэффективности, потребление энергии дата-центрами продолжает расти, скрывая за собой значительные цифры.

После 2020 года информация о потреблении энергии дата-центрами стала менее доступной, уступая место акцентам на их энергоэффективность. Однако последние данные говорят сами за себя: дата-центры потребляют огромное количество электроэнергии, которое можно сравнить с выработкой крупнейших электростанций.

По оценкам, в 2022 году дата-центры потребили от 240 до 340 тераватт-часов энергии, плюс от 260 до 360 TWh ушло на передачу данных. Это не учитывая от 100 до 150 TWh, потраченных на поддержку криптовалют.

Для сравнения: ГЭС Hoover Dam производит около 4 млрд кв/часов энергии в год, что сопоставимо с производством некоторых атомных станций.

Даже если 40% потребности дата-центров покрываются за счет возобновляемых источников, мы все равно сжигаем около 44 миллионов тонн нефти в год. Это подчеркивает важность перехода к более устойчивым моделям потребления и производства энергии, в том числе и в индустрии ИТ. Мы должны признать, что наша зависимость от технологий, таких как GPT, несет не только преимущества, но и значительные экологические издержки.

Ссылка
👍45🔥133😁3
ChatGPT: Ваш надежный помощник в жизни

За прошедший год ChatGPT стал настоящим изменителем жизней.

В обсуждении на Reddit пользователи делятся историями о том, как GPT-4 помог им в решении сложных задач. Один из родителей, например, использовал его для написания письма по поводу буллинга директору школы, что благоприятно повлияло на ситуацию их ребенка. Еще один пользователь смог улучшить электронное общение с бывшим супругом, уменьшив уровень конфликтов и стресса.

В общем, GPT-4 оказывает помощь в разных сферах жизни, выделяясь в шести ключевых аспектах:

Личностное развитие и обучение: Помогает в освоении сложных тем, улучшении навыков программирования и развитии профессиональных компетенций.

Межличностные отношения: Способствует улучшению общения с бывшими партнерами, помогает в разрешении конфликтов и снижении стресса.

Юридическая и деловая помощь: Поддержка в составлении юридических документов, ведении переговоров и решении спорных вопросов.

Поддержка ментального здоровья: Помогает в управлении тревогой, предоставляет эмоциональную поддержку и разрабатывает методы самопомощи.

Творчество и хобби: Поддерживает в написании книг, создании музыки и других творческих начинаниях.
Программирование и создание MVP: Оказывает помощь в программировании и разработке прототипов идей в короткие сроки.

Эти истории демонстрируют, что GPT-4 не просто облегчает повседневные задачи, но и способствует глубоким изменениям в жизни людей, помогая преодолеть личные и профессиональные трудности. Этот инструмент становится мощным союзником в преодолении препятствий, открывая новые горизонты для роста и развития.

Почитать весь тред

Расскажите как GPT помог вам в жизни?
👍106😁4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Рисуем вместе с нейронкой в реальном времени

Бывает, нужно быстро сделать зарисовку идеи или просто хочется порисовать. К несчастью, в художественом плане у меня руки-крюки и вместо красивостей, обычно получается абстрактный экспрессионизм. Сегодня я обнаружил рабочий workflow, благодаря которому скетч не стыдно будет показать кому угодно.

Есть такая опенсорсная рисовалка - tldraw, к ней есть плагин Draw-Fast. Этот плагин позволяет использовать все возможности tldraw для того, что бы в реальном времени управлять процессом генерации картинки, на обычном ноутбуке!

Процесс такой: клонируем репозиторий Draw-Fast и устанавливаем tldraw с этим плагином.

Затем в текстовом поле пишем какую каринку мы хотим получить (можно редактировать на ходу) и рисуем. Этот процесс создаёт уникальное ощущение совместного творчества, отличное от индивидуальной работы или использования Dall-E.


Еще более пошаговая инструкция для Mac/Linux:


# 1. Открываем терминал (Terminal)
# 2. Клонируем репозиторий:

git clone https://github.com/tldraw/draw-fast

# 3. Заходим в папку с приложением

cd draw-fast

# 4. Устанавливаем и запускаем приложение

npm install
npm run dev

# Если нет npm устанавливаем его

brew install npm

# 5. Переходим по ссылке из терминала

# http://localhost:3000

# 6. Играемся


Для запуска без установки - смотри сюда
🔥46👍95
AI для Всех
Рисуем вместе с нейронкой в реальном времени Бывает, нужно быстро сделать зарисовку идеи или просто хочется порисовать. К несчастью, в художественом плане у меня руки-крюки и вместо красивостей, обычно получается абстрактный экспрессионизм. Сегодня я обнаружил…
This media is not supported in your browser
VIEW IN TELEGRAM
Рисуем вместе с нейронкой - прямо в GitHub Codespaces

Бывает, нужно быстро сделать зарисовку идеи или просто хочется порисовать. К несчастью, в художественом плане у меня руки-крюки и вместо красивостей, обычно получается абстрактный экспрессионизм. Сегодня я обнаружил рабочий workflow, благодаря которому скетч не стыдно будет показать кому угодно.

Записал подробную инструкцию, как запустить рисовалку Draw-Fast на Github CodeSpaces. Кстати у них уже почти 500 звезд на гитхабе.

Открываем их гит, наводим на кнопку Code <> в правом верхнем углу и выбираем вкладку Codespaces.

Дальше создаем новый Space, копируем команды из верхнего окошка в нижнее (терминал) и нажимаем Open in Browser.

Ура - вы прекрасны и теперь можете насладиться процессом рисования вместе с нейросетью.

Для запуска локально - смотри сюда
👍19🔥83
Дорисовываем Draw Fast с помощью Dall-E:

Нарисовали картинку, которая очень понравилась, но качество хромает? Не беда - просто отправьте скриншот своего рисунка и текстового промпта (см в комменты для примеров) в Draw Fast and Enhance GPT (который я для вас побыстренькому сделал) и наслаждайтесь сумасшедшим качеством.

Присылайте в комменты!
🔥28🎉5🤩2👍1
Слияние человеческого восприятия с ИИ: на ощупь к сверхспособностям

Читая новости о расшифровке энцефалограмм или fMRI головного мозга с помощью DL алгоритмов, а также в ожидании фьюжн сенсорно-богатой инфо из VisionPro с GPT, не могу не думать о медицинских экспериментах.

В лихие 80е и 90е не только бегали абсолютно голые, но и проводили довольно радикальные эксперименты с мозгом. В одном из них, например, нервы из глаз (не человека) подключали к слуховой части коры головного мозга, и "слуховые" нейроны, к изумлению учёных, учились видеть.

Во-первых, это про гипотезу об универсальном алгоритме обработки информации. Attention is all you need?

Во-вторых, про возможности научить подобную систему чему угодно: хоть понимать речь, хоть различать запахи и вкусы. А как насчёт, видеть магнитные поля, как птицы? К слову, у нас тоже датчик есть.

Выглядит так, что человечество в шаге от создания систем, которые мы будем снабжать своей сенсорной информацией о мире, и получать интерпретацию с учётом накопленных знаний и всякие прикольные способности.

О последствиях сегодня думать не хочу. И так понедельник

🧠Примеры экспериментов: раз и два
🎸Soundtrack: "Plug in Baby" by Muse
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🤯74🔥1
Инсайды от CEO LlamaIndex и Weights & Biases

Я редко об этом пишу, но на самом деле довольно много времени провожу на разных ИИ тусовочках в Сан-Франциско и Кремниевой долине. Вчера я побывал на мероприятии, организованном Wing.vc, куда собрались основатели компаний и эксперты в области ИИ. Самым ярким моментом стaла дискуссионная панель с лидерами LlamaIndex и Weights & Biases.

Lucas (СEO Weights & Biases) рассказывал, как еще несколько лет назад им вообще не рекомендовали произносить слова "машинное обучение" в своих питчах, и посмеялся над тем, как все изменилось сейчас. В этом году им пришлось сменить стратегию - если раньше, при создании новых продуктов они ориентировались на практиков машинного обучения в целом, то теперь, они считают, что имеет смысл выбирать более узкую специализацию в области ИИ и делать инструменты конкретно для этой ниши. Такое изменение стратегии было реакцией на рыночные тренды и реальные потребности специалистов.

Jerry (CEO LlamaIndex) рассказал об эволюции своего проекта - от небольшого аккаунта в Твиттере до разработки полноценного ИИ-продукта с миллионом пользователей. Он подчеркнул важность интуитивных инструментов и абстракций для упрощения работы с ИИ, а также отметил роль сообщества и обратной связи в развитии и адаптации продукта. Мне запомнилась одна его цитата:

Ну вот если зайти на HackerNews, то там нас не очень любят - мол, я могу то же самое собрать на коленке за полдня. Конечно, собрать-то ты можешь, но если дать разработчикам удобную абстракцию - они всегда будут ей пользоваться, потому что у них всегда найдется, что еще написать за эти полдня.

Оба спикера поделились мыслями о важности гибкости в выборе стратегий и подходов в динамично меняющемся мире ИИ. По итогам дискуссии они пришли к выводу, что адаптация к новым технологиям и потребностям пользователей - залог успешного развития продуктов в области ИИ.

Уроки от LlamaIndex и Weights & Biases - это ценные идеи для всех, кто стремится к успеху в этой динамичной индустрии.
👍25🔥105
This media is not supported in your browser
VIEW IN TELEGRAM
Рисуем вместе с нейросетью бесплатно и без регистрации

На днях рассказывал про ребят из TLDraw, которые выложили в опенсорс свою рисовалку вместе с нейросетью. И вот она уже онлайн! Прямо сейчас для того что бы ей пользоваться не нужна никакая регистрация. Просто заходите на сайт и рисуете!

drawfast.tldraw.com

(Видео не ускорено! Реальное время)

Ну а если хочется улучшить свое творение - просто скиньте скриншот в специально-обученную версию Dall-E
🔥25😱3