Отличные новости для маководов
Apple Research выпустили собственную библиотеку MLX а-ля PyTorch. Она оптимизирована для Apple Silicon, то есть ноутбуков с чипами M-серии. В комплекте модели Llama, LoRA, Stable Diffusion и Whisper, а также хорошая документация и примеры.
😻 #news
Apple Research выпустили собственную библиотеку MLX а-ля PyTorch. Она оптимизирована для Apple Silicon, то есть ноутбуков с чипами M-серии. В комплекте модели Llama, LoRA, Stable Diffusion и Whisper, а также хорошая документация и примеры.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯56👍26👨💻7👏2🤩2❤1
Ой кто это
Сэм Альтман стал CEO года. Ну а как иначе? Кто еще может похвастаться таким скандальным увольнением и таким легендарным возвращением? Кто еще смог бы поднять OpenAI на такие высоты?
😻 #news
Сэм Альтман стал CEO года. Ну а как иначе? Кто еще может похвастаться таким скандальным увольнением и таким легендарным возвращением? Кто еще смог бы поднять OpenAI на такие высоты?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤57😐10👍9😎3🥰2
Google анонсировала конкурента GPT-4 – Gemini
Модель представлена в трех версиях: Gemini Nano, Gemini Pro и Gemini Ultra. Последняя, говорят, на тестах превосходит GPT-4. Все модели мультимодальные, и Gemini Pro уже доступна в чат-боте Bard.
Для доступа нужно подключиться к VPN с локацией в США, сменить в настройках Google аккаунта язык на английский и перейти по ссылке.
И это не все. На базе Gemini вышел AlphaCode2. При оценке на платформе Codeforces AlphaCode2 решает 43% задач за 10 попыток.
Планы компании впечатляют: они планируют внедрять модели в поиск, запустить Bard Advance и уже сейчас интегрируют версию Nano в смартфоны.
Новая эра?
😻 #news
Модель представлена в трех версиях: Gemini Nano, Gemini Pro и Gemini Ultra. Последняя, говорят, на тестах превосходит GPT-4. Все модели мультимодальные, и Gemini Pro уже доступна в чат-боте Bard.
Для доступа нужно подключиться к VPN с локацией в США, сменить в настройках Google аккаунта язык на английский и перейти по ссылке.
И это не все. На базе Gemini вышел AlphaCode2. При оценке на платформе Codeforces AlphaCode2 решает 43% задач за 10 попыток.
Планы компании впечатляют: они планируют внедрять модели в поиск, запустить Bard Advance и уже сейчас интегрируют версию Nano в смартфоны.
Новая эра?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩35🤔10❤9👍6🎉3🔥2🙈1
Увеличение производительности чат-бота с 27% до 98% с помощью одной фразы
Таких результатов добились Anthropic со своим Claude 2.1. Они заметили, что в условиях, когда пользователь подает на вход большой контекст (~200К токенов) чат-бот начинает отвечать неохотно, хотя способен на качественный выхлоп.
Решилась проблема добавлением всего одного предложения в начало ответа бота: "Here is the most relevant sentence in the context:". Так модель сначала фокусируется на поиске релевантных предложений в контексте, что затем помогает ей ответить точнее.
Ох уж этот промпт-инжинеринг
😻 #news
Таких результатов добились Anthropic со своим Claude 2.1. Они заметили, что в условиях, когда пользователь подает на вход большой контекст (~200К токенов) чат-бот начинает отвечать неохотно, хотя способен на качественный выхлоп.
Решилась проблема добавлением всего одного предложения в начало ответа бота: "Here is the most relevant sentence in the context:". Так модель сначала фокусируется на поиске релевантных предложений в контексте, что затем помогает ей ответить точнее.
Ох уж этот промпт-инжинеринг
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥10🤓7❤5✍2
Почему не надо бояться восстания машин?
Авито помог провести мастер-класс по этике искусственного интеллекта для студентов «НЕЙМАРК.Школы цифровой этики» в нижегородском IT-кампусе. Вместе с руководителем департамента правового сопровождения продуктов, технологий и данных Авито Татьяной Войтас ребята не только изучили основы этики, но и проработали проблемные области, которые могут возникнуть у людей при использовании интеллектуальных голосовых помощников. Студенты отметили важность конфиденциальности данных, которые сообщает человек, необходимости разрабатывать речевые ML-модели с учетом разных акцентов или дефектов речи.
Вопросы этики – одни из важнейших в отрасли искусственного интеллекта. Они не статичны – вместе со стремительным развитием технологий постоянного обновления требуют и этические нормы. Крупные компании понимают проблематику этики ИИ и делятся своим опытом с будущими айтишниками. Как раз это и позволяет не бояться, что какой-нибудь киношный фантастический сценарий вдруг воплотится в реальности, и ИИ поработит мир.
😻 #news
Авито помог провести мастер-класс по этике искусственного интеллекта для студентов «НЕЙМАРК.Школы цифровой этики» в нижегородском IT-кампусе. Вместе с руководителем департамента правового сопровождения продуктов, технологий и данных Авито Татьяной Войтас ребята не только изучили основы этики, но и проработали проблемные области, которые могут возникнуть у людей при использовании интеллектуальных голосовых помощников. Студенты отметили важность конфиденциальности данных, которые сообщает человек, необходимости разрабатывать речевые ML-модели с учетом разных акцентов или дефектов речи.
Вопросы этики – одни из важнейших в отрасли искусственного интеллекта. Они не статичны – вместе со стремительным развитием технологий постоянного обновления требуют и этические нормы. Крупные компании понимают проблематику этики ИИ и делятся своим опытом с будущими айтишниками. Как раз это и позволяет не бояться, что какой-нибудь киношный фантастический сценарий вдруг воплотится в реальности, и ИИ поработит мир.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍100🤓13🔥11🤔4🌭1
Media is too big
VIEW IN TELEGRAM
Демо-видео с возможностями Gemini оказалось смонтированным
Это значит, что оно ускорено и обрезано, и не показывает реальных возможностей модели. Компания признала это, но оправдалась тем, что сделано это было для краткости, и чтобы вдохновить разработчиков.
Наши инсайдеры нашли бэкстейдж того, как Гугл снимал свое демо 👆
😻 #news
Это значит, что оно ускорено и обрезано, и не показывает реальных возможностей модели. Компания признала это, но оправдалась тем, что сделано это было для краткости, и чтобы вдохновить разработчиков.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46👍14🔥8❤2🤯2🌚2
Больше не словно птица в небесах – ЕС согласовал новый радикальный законопроект про регулирование ИИ
Он будет действовать в 27 странах и коснется даже гигантов вроде Google, Microsoft и OpenAI. Все компании, занимающиеся ИИ, должны будут раскрывать, как работают модели под капотом, маркировать генерации и прочее. Кара за нарушение предусмотрена: до 7% от глобального оборота. Правда, многие аспекты закона заработают лишь через 12-24 мес – это огромный срок для развития ИИ.
А это точно спасет нас от восстания машин?
😻 #news
Он будет действовать в 27 странах и коснется даже гигантов вроде Google, Microsoft и OpenAI. Все компании, занимающиеся ИИ, должны будут раскрывать, как работают модели под капотом, маркировать генерации и прочее. Кара за нарушение предусмотрена: до 7% от глобального оборота. Правда, многие аспекты закона заработают лишь через 12-24 мес – это огромный срок для развития ИИ.
А это точно спасет нас от восстания машин?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓25👍10🔥9😁6🤔4❤2🗿2
Историческая новость – вышла новая опенсурсная LLM Mistral
– Вышла в трех вариантах: mistral-tiny, mistral-small, mistral-medium
– Качество >= LLama2, GPT 3.5. При этом на инференсе в 6 раз быстрее Ламы.
– Бесплатная и открытая
– Умеет на английском, французском, итальянском, немецком и испанском
– Контекст - 32К токенов
– Уже добавили в HuggingFace:
😻 #news
– Вышла в трех вариантах: mistral-tiny, mistral-small, mistral-medium
– Качество >= LLama2, GPT 3.5. При этом на инференсе в 6 раз быстрее Ламы.
– Бесплатная и открытая
– Умеет на английском, французском, итальянском, немецком и испанском
– Контекст - 32К токенов
– Уже добавили в HuggingFace:
model = AutoModelForCausalLM.from_pretrained("mistralai/Mixtral-8x7B-v0.1")Юзер-гайды | Блогпост | Регистрация для раннего доступа
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38🔥14❤8🤔1
Новая LLM Mixtral-8x-7B произвела фурор и ввела в моду Mixture of Expert
Эта архитектура отличается тем, что использует нескольких "экспертов" (каждый из которых представляет из себя нейросеть) для решения разных задач. От ансамблей она отличается тем, что эксперты не объединяются, то есть в решении участвует только один.
Какой токен какому эксперту отправить решает так называемый роутер – это тоже обучаемая сеть. В общем, вот вам список литературы, который поможет быстро разобраться (и не отстать от тренда):
❤️ Отличный разбор на HuggingFace
❤️ Ёмкий видео-разбор архитектуры от Trelis Research
❤️ Первая статья по применению MoE в NLP (в авторах Джефф Дин и Джеффри Хинтон)
❤️ Про MoE для LLM
Кстати, по слухам, GPT-4 тоже представляет из себя MoE.
😻 #advice #news
Эта архитектура отличается тем, что использует нескольких "экспертов" (каждый из которых представляет из себя нейросеть) для решения разных задач. От ансамблей она отличается тем, что эксперты не объединяются, то есть в решении участвует только один.
Какой токен какому эксперту отправить решает так называемый роутер – это тоже обучаемая сеть. В общем, вот вам список литературы, который поможет быстро разобраться (и не отстать от тренда):
Кстати, по слухам, GPT-4 тоже представляет из себя MoE.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35😁1