Forwarded from эйай ньюз
Аннотированный код
Наткнулся на классный сайт, где собран код некоторых популярных моделей (или их частей), например Stable Diffusion, GPT, Switch Tranformer, MPL-Mixer и др. Весь цимес в том, что каждая строка кода задокументирована, и показаны соответствующие математические формулы.
Будет полезно тем, кто любит начининать изучать модели сразу с кода. Как раз занятие на воскресенье.
На скринах - код DDIM и Adam.
https://nn.labml.ai/
@ai_newz
Наткнулся на классный сайт, где собран код некоторых популярных моделей (или их частей), например Stable Diffusion, GPT, Switch Tranformer, MPL-Mixer и др. Весь цимес в том, что каждая строка кода задокументирована, и показаны соответствующие математические формулы.
Будет полезно тем, кто любит начининать изучать модели сразу с кода. Как раз занятие на воскресенье.
На скринах - код DDIM и Adam.
https://nn.labml.ai/
@ai_newz
🔥51🤩3👍2
Forwarded from Лекторий
17.08 Лекторий о том, как мы воспринимаем реальность.
Вы когда-нибудь задумывались, почему мы видим мир именно таким, каким видим? Почему то, что кажется реальностью одному человеку, может совершенно по-разному восприниматься другим?
На лектории "Взгляд изнутри" мы попытаемся заглянуть в самые глубины человеческого сознания и разобраться, как устроено наше восприятие реальности, от чего оно зависит и как его можно расширить.
Своими взглядами поделятся:
🔆 Станислав Лео – Экзистенциальный и психоделический психотерапевт, предприниматель создатель бота «Эпикур»
🔆 Саша Березович – Психотерапевтка, СДВГ-информированная специалистка и авторка канала «Саша об СДВГ»
🔆 Захар Коган – Аналитик и исследователь, автор BOI DIARIES
🔆 Екатерина Прасова – Соосновательница ArtNeuroVerse Biennale и мама художницы с аутизмом
📍 Almacén Gallery HaPninim 1, Tel Aviv
🕦 17 августа, в 19:00
💰 Стоимость билета: 80 шек
ПОСЛЕДНИЕ Билеты: https://get-in.com/lectorium
Вы когда-нибудь задумывались, почему мы видим мир именно таким, каким видим? Почему то, что кажется реальностью одному человеку, может совершенно по-разному восприниматься другим?
На лектории "Взгляд изнутри" мы попытаемся заглянуть в самые глубины человеческого сознания и разобраться, как устроено наше восприятие реальности, от чего оно зависит и как его можно расширить.
Своими взглядами поделятся:
🔆 Станислав Лео – Экзистенциальный и психоделический психотерапевт, предприниматель создатель бота «Эпикур»
🔆 Саша Березович – Психотерапевтка, СДВГ-информированная специалистка и авторка канала «Саша об СДВГ»
🔆 Захар Коган – Аналитик и исследователь, автор BOI DIARIES
🔆 Екатерина Прасова – Соосновательница ArtNeuroVerse Biennale и мама художницы с аутизмом
📍 Almacén Gallery HaPninim 1, Tel Aviv
🕦 17 августа, в 19:00
💰 Стоимость билета: 80 шек
ПОСЛЕДНИЕ Билеты: https://get-in.com/lectorium
🔥4👍2😁2🤯1😢1
🔬 Искусственный интеллект помогает создать лучшие батареи!
7 лет назад начался проект, в котором ИИ играл ключевую роль. Исследователи из Стенфорда разработали алгоритмы машинного обучения для отбора материалов, которые могли бы стать основой более стабильных и долговечных батарей.
🤖 С помощью ИИ из более чем 12 000 известных литийсодержащих материалов было отобрано 21 перспективное соединение. Машинное обучение предсказало, что LBS (не путать с LK99) может обладать электрохимическими свойствами, превосходящими существующие материалы.
⚡️ LBS оказался самым стабильным серосодержащим литий-ионным электролитом, который может удерживать высокие уровни заряда без разрушения.
🔋 Это открытие не только подтвердило эффективность скрининга на основе машинного обучения, но и ускорило процесс открытия полезных соединений, который без ИИ мог бы занять гораздо больше времени.
🧪 Теперь команда планирует дальнейшее улучшение LBS и исследование новых материалов для более безопасных твердотельных батарей.
Статья
Блог-пост
7 лет назад начался проект, в котором ИИ играл ключевую роль. Исследователи из Стенфорда разработали алгоритмы машинного обучения для отбора материалов, которые могли бы стать основой более стабильных и долговечных батарей.
🤖 С помощью ИИ из более чем 12 000 известных литийсодержащих материалов было отобрано 21 перспективное соединение. Машинное обучение предсказало, что LBS (не путать с LK99) может обладать электрохимическими свойствами, превосходящими существующие материалы.
⚡️ LBS оказался самым стабильным серосодержащим литий-ионным электролитом, который может удерживать высокие уровни заряда без разрушения.
🔋 Это открытие не только подтвердило эффективность скрининга на основе машинного обучения, но и ускорило процесс открытия полезных соединений, который без ИИ мог бы занять гораздо больше времени.
🧪 Теперь команда планирует дальнейшее улучшение LBS и исследование новых материалов для более безопасных твердотельных батарей.
Статья
Блог-пост
👍18🔥12🤯4
Forwarded from Институт AIRI
⚡️Самый долгожданный пост этого лета!
Записи лекций и семинаров летней школы по искусственному интеллекту «Лето с AIRI» с ведущими учеными из научно-исследовательских организаций и ВУЗов выложены на YouTube-канал.
🖇 Сохраняйте ссылку на плейлист
В этом году на Школе было много направлений: от обучения с подкреплением, робототехники, 3D компьютерного зрения до детектирования и диагностики аномалий в промышленности.
Институт AIRI
Записи лекций и семинаров летней школы по искусственному интеллекту «Лето с AIRI» с ведущими учеными из научно-исследовательских организаций и ВУЗов выложены на YouTube-канал.
🖇 Сохраняйте ссылку на плейлист
В этом году на Школе было много направлений: от обучения с подкреплением, робототехники, 3D компьютерного зрения до детектирования и диагностики аномалий в промышленности.
Институт AIRI
🔥13🤯6👍2❤1😱1
Бесплатный курс: «ИИ для педагогов»
В этом году ChatGPT прогремел на весь мир, и особенно жаркие дебаты разгорелись на почве того, как ИИ изменит образование. Кто-то кричит - запретить, кто-то придумывает креативные задания на совместное творчество. Большинству же педагогов - пофиг, потому что ничего не понятно. Новый курс "AI 101 для Учителей" предлагает учителям заглянуть в будущее педагогики с позиций ИИ.
ИИ - это инструмент, и как любой инструмент, он требует понимания. Для эффективного применения в классной комнате учителям важно освоить основы технологии, понять её возможности и ограничения. В курсе особое внимание уделяют и этическим аспектам: вопросам ответственности и предвзятости (баесов).
Курс, разработанный совместно с такими авторитетами как Code.org, ETS, ISTE и Khan Academy, предлагает ресурсы и экспертные мнения, чтобы помочь педагогам не просто познакомиться, но и адаптировать ИИ для своих нужд в образовании.
Сайт курса
В этом году ChatGPT прогремел на весь мир, и особенно жаркие дебаты разгорелись на почве того, как ИИ изменит образование. Кто-то кричит - запретить, кто-то придумывает креативные задания на совместное творчество. Большинству же педагогов - пофиг, потому что ничего не понятно. Новый курс "AI 101 для Учителей" предлагает учителям заглянуть в будущее педагогики с позиций ИИ.
ИИ - это инструмент, и как любой инструмент, он требует понимания. Для эффективного применения в классной комнате учителям важно освоить основы технологии, понять её возможности и ограничения. В курсе особое внимание уделяют и этическим аспектам: вопросам ответственности и предвзятости (баесов).
Курс, разработанный совместно с такими авторитетами как Code.org, ETS, ISTE и Khan Academy, предлагает ресурсы и экспертные мнения, чтобы помочь педагогам не просто познакомиться, но и адаптировать ИИ для своих нужд в образовании.
Сайт курса
👍2🔥2🤯2
🖥️ LLaMa.cpp: начало эпохи персональных ИИ ассистентов!
Кто бы мог подумать, что огромные языковые модели LLM однажды будут работать на обычных MacBook? llama.cpp демонстрирует, что это уже реальность.
LLaMa это новейшая языковая модель от компании Мета. Открытая архитектура LLaMa позволяет широкому кругу пользователей, включая исследователей, бизнес и стартапы, максимально реализовать возможности AI. LLaMa.cpp — это ультралегкая реализация LLaMa на C++, которая реально заводится на ноутбуке.
Оказалось, что все дело в скорости памяти. Даже несмотря на меньший объем вычислительных ресурсов, MacBook M2 по скорости памяти может сравниться с мощными серверами (если данных мало: batch_size=1, то есть модель за раз говорит только с одним человеком). Однако, на больших объемах данных (batch_size=160+) мощь больших серверов остается непревзойденной (когда модель должна параллельно разговаривать с несколькими людьми).
Вывод: Мы на пороге новой эры, когда каждый сможет иметь свою персональную модель LLM прямо у себя дома и работать с ней офлайн.
🤓 Статья
🤩 твит Карпати
Кто бы мог подумать, что огромные языковые модели LLM однажды будут работать на обычных MacBook? llama.cpp демонстрирует, что это уже реальность.
LLaMa это новейшая языковая модель от компании Мета. Открытая архитектура LLaMa позволяет широкому кругу пользователей, включая исследователей, бизнес и стартапы, максимально реализовать возможности AI. LLaMa.cpp — это ультралегкая реализация LLaMa на C++, которая реально заводится на ноутбуке.
Оказалось, что все дело в скорости памяти. Даже несмотря на меньший объем вычислительных ресурсов, MacBook M2 по скорости памяти может сравниться с мощными серверами (если данных мало: batch_size=1, то есть модель за раз говорит только с одним человеком). Однако, на больших объемах данных (batch_size=160+) мощь больших серверов остается непревзойденной (когда модель должна параллельно разговаривать с несколькими людьми).
Вывод: Мы на пороге новой эры, когда каждый сможет иметь свою персональную модель LLM прямо у себя дома и работать с ней офлайн.
🤓 Статья
🤩 твит Карпати
🔥43❤9👍9
Бесплатный курс по семантическому поиску
Хотите углубить свои знания в мире больших языковых моделей? DeepLearning.AI выпустили новый короткий курс "Large Language Models with Semantic Search".
На этом курсе вы научитесь приспосабливать большие языковые модели для поиска информации на сайтах с обширным количеством контента. Вместо традиционного поиска по ключевым словам, представьте возможность задавать вопросы человеческим языком и получать на них максимально релевантные ответы.
Два профессионала в области машинного обучения, Jay Alammar (это который Illustrated Transformer) и Luis Serrano из Cohere, расскажут:
- Как работает основной поиск по ключевым словам.
- Как улучшить результаты поиска с помощью новых методов.
- И, самое главное, как интегрировать эти методы в ваш собственный веб-сайт.
Почему это важно? Представьте, что ваш сайт или приложение может понимать запросы пользователей на новом уровне, предоставляя им именно то, что они ищут. Это может радикально улучшить их опыт и, как следствие, увеличить время, которое они проводят на вашем ресурсе.
Курс подойдет всем, кто уже знаком с Python и хочет расширить свои горизонты.
Самое лучшее? Запись на курс сейчас бесплатна! (пока они тестируют площадку)
🤓 Курс
Хотите углубить свои знания в мире больших языковых моделей? DeepLearning.AI выпустили новый короткий курс "Large Language Models with Semantic Search".
На этом курсе вы научитесь приспосабливать большие языковые модели для поиска информации на сайтах с обширным количеством контента. Вместо традиционного поиска по ключевым словам, представьте возможность задавать вопросы человеческим языком и получать на них максимально релевантные ответы.
Два профессионала в области машинного обучения, Jay Alammar (это который Illustrated Transformer) и Luis Serrano из Cohere, расскажут:
- Как работает основной поиск по ключевым словам.
- Как улучшить результаты поиска с помощью новых методов.
- И, самое главное, как интегрировать эти методы в ваш собственный веб-сайт.
Почему это важно? Представьте, что ваш сайт или приложение может понимать запросы пользователей на новом уровне, предоставляя им именно то, что они ищут. Это может радикально улучшить их опыт и, как следствие, увеличить время, которое они проводят на вашем ресурсе.
Курс подойдет всем, кто уже знаком с Python и хочет расширить свои горизонты.
Самое лучшее? Запись на курс сейчас бесплатна! (пока они тестируют площадку)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12😱4👍3
ИИ образование для сотрудников Конгресса
Искусственный интеллект (ИИ) произвел настоящую революцию в нашем мире. За этой революцией подтягиваются изменения в экономике и обществе. Соответственно, регулирование ИИ становится все более и более необходимым (для того что бы гарантировать, что технология используется ответственно и безопасно).
Но есть нюанс, большинство законотворцев вообще не понимают что такое ИИ и как он работает.
Конгресс США стоит на переднем крае принятия решений, которые будут формировать будущее ИИ. Но как они могут регулировать то в чем вообще не разбираются?
Именно поэтому Стенфордский Институт Человекоцентричного ИИ (Stanford HAI) решил взять инициативу в свои руки. Они провели трехдневный интенсив для сотрудников Конгресса.
С 7 по 9 августа на кампусе Stanford, 28 сотрудников из обеих палат Конгресса собрались, чтобы узнать о потенциале ИИ у ведущих академиков и понять, как регулировать эту новую технологию.
Большой вопрос конечно, сколько экспертности можно приобрести за 3 дня, но лучше хоть так, чем никак.
🙃 Новость
На фото Кандализа Райз (бывшая глава ГосДепа) и Фей-Фей Ли (мама ImageNet) о чем то увлеченно беседуют.
Искусственный интеллект (ИИ) произвел настоящую революцию в нашем мире. За этой революцией подтягиваются изменения в экономике и обществе. Соответственно, регулирование ИИ становится все более и более необходимым (для того что бы гарантировать, что технология используется ответственно и безопасно).
Но есть нюанс, большинство законотворцев вообще не понимают что такое ИИ и как он работает.
Конгресс США стоит на переднем крае принятия решений, которые будут формировать будущее ИИ. Но как они могут регулировать то в чем вообще не разбираются?
Именно поэтому Стенфордский Институт Человекоцентричного ИИ (Stanford HAI) решил взять инициативу в свои руки. Они провели трехдневный интенсив для сотрудников Конгресса.
С 7 по 9 августа на кампусе Stanford, 28 сотрудников из обеих палат Конгресса собрались, чтобы узнать о потенциале ИИ у ведущих академиков и понять, как регулировать эту новую технологию.
Большой вопрос конечно, сколько экспертности можно приобрести за 3 дня, но лучше хоть так, чем никак.
На фото Кандализа Райз (бывшая глава ГосДепа) и Фей-Фей Ли (мама ImageNet) о чем то увлеченно беседуют.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13😁6❤5🔥1🤯1
Неочевидное общее между марсианской грязью и карбонизированными чернилами на древних папирусах
Весной мы писали о соревновании Vesuvius Challenge по восстановлению из пепла (в буквальном смысле) библиотеки когда-то роскошной виллы Люция Пизона, тестя Юлия Цезаря. Вилла находилась в Геркулануме, а город, равно как и Помпеи, прекратил существование во время извержения Везувия осенью 79 года.
С момента объявления соревнования призовой фонд увеличился до $1 млн, оказалось, что "stack more layers" не оч работает, а человеческие глаза и мозги по-прежнему незаменимые части ИИ.
Напомним, что ценность собрания свитков в том, содержание библиотеки вполне может изменить историю. Например, есть хорошие шансы найти подробное описание римской истории в конце царствования Тиберия, в то самое время, когда, как предполагается, жил Иисус.
В 2015 году рентгеновские снимки свертков научились виртуально разворачивать (Seales et. al). В 2023 крайне любопытная мысль пришла от одного из участников соревнования.
Кейси Хэндмер, отрудник НАСА, автор книг по индустриализации Марса и основатель Teraform Industries уже 8 лет смотрит на поверхность Марса, где одна из самых информативных частей - текстура потрескавшейся грязи.
Отдельные $100к соревнования посвящены задаче детекции чернил на изображении, изобилующем артефактами, следами изломов, органики и волокон.
Угадайте, на что по предположению Кейси похожи чернила? Ага, на потрескавшуюся и отслаивающуюся грязь.
Он набросал в mathematica алгос для проверки гипотезы, и похоже, что для решения задачи поиска текста нужно хорошенько препоцессить датасет неDL методами, чтобы нейронки искали действительно релевантные символы. Причем, очень нелишним было бы добавить LLM, натренинную на древне-греческих текстах, чтобы создать распределение вероятностей для следующего символа и полирнуть байесовским тестом для видимых фрагментов чернил, чтобы обновить вероятность.
Обожаю, когда экспертность в одной области позволяет сдвинуть границу знаний в совершенно другой науке.
@GingerSpacetail
Весной мы писали о соревновании Vesuvius Challenge по восстановлению из пепла (в буквальном смысле) библиотеки когда-то роскошной виллы Люция Пизона, тестя Юлия Цезаря. Вилла находилась в Геркулануме, а город, равно как и Помпеи, прекратил существование во время извержения Везувия осенью 79 года.
С момента объявления соревнования призовой фонд увеличился до $1 млн, оказалось, что "stack more layers" не оч работает, а человеческие глаза и мозги по-прежнему незаменимые части ИИ.
Напомним, что ценность собрания свитков в том, содержание библиотеки вполне может изменить историю. Например, есть хорошие шансы найти подробное описание римской истории в конце царствования Тиберия, в то самое время, когда, как предполагается, жил Иисус.
В 2015 году рентгеновские снимки свертков научились виртуально разворачивать (Seales et. al). В 2023 крайне любопытная мысль пришла от одного из участников соревнования.
Кейси Хэндмер, отрудник НАСА, автор книг по индустриализации Марса и основатель Teraform Industries уже 8 лет смотрит на поверхность Марса, где одна из самых информативных частей - текстура потрескавшейся грязи.
Отдельные $100к соревнования посвящены задаче детекции чернил на изображении, изобилующем артефактами, следами изломов, органики и волокон.
Угадайте, на что по предположению Кейси похожи чернила? Ага, на потрескавшуюся и отслаивающуюся грязь.
Он набросал в mathematica алгос для проверки гипотезы, и похоже, что для решения задачи поиска текста нужно хорошенько препоцессить датасет неDL методами, чтобы нейронки искали действительно релевантные символы. Причем, очень нелишним было бы добавить LLM, натренинную на древне-греческих текстах, чтобы создать распределение вероятностей для следующего символа и полирнуть байесовским тестом для видимых фрагментов чернил, чтобы обновить вероятность.
Обожаю, когда экспертность в одной области позволяет сдвинуть границу знаний в совершенно другой науке.
@GingerSpacetail
🔥43👍8❤6
Media is too big
VIEW IN TELEGRAM
Чтобы оказаться в фильме "Она" вам всего лишь нужно... Arduino, GPT4 и Whisper
Техно-оптимист Джастин Алви (ex @CovarianAI) cделал на основе Google Nest Mini ту самую виртуальную помощницу и поделился с нами репо.
Ура! Теперь мы тоже можем ревновать к Алану Уотсу. Кстати, в 2023 его голос можно достоверно клонировать (что и сделал Алви). Надеюсь, Спайку Джонзу уже передали, что эту сцену придется переснять.
🟥Код
@GingerSpacetail
Техно-оптимист Джастин Алви (ex @CovarianAI) cделал на основе Google Nest Mini ту самую виртуальную помощницу и поделился с нами репо.
Ура! Теперь мы тоже можем ревновать к Алану Уотсу. Кстати, в 2023 его голос можно достоверно клонировать (что и сделал Алви). Надеюсь, Спайку Джонзу уже передали, что эту сцену придется переснять.
🟥Код
@GingerSpacetail
🔥28👍6❤2
Magic AI: Добро пожаловать в первый "Даталолом"!
Эра ИИ требует данных! В Magic AI это осознают и готовы платить за ваши данные. Получите $100 за каждый GiB!
Имеете лишний даталолом объемом 10 TiB? Обещают перевести $1,000,000! Особенно, говорят, что ценят данные из мира программирования и науки.
Поделитесь своим "цифровым металлоломом" с Magic AI и, возможно, войдите в историю ИИ!
🤑 Продать данные
Эра ИИ требует данных! В Magic AI это осознают и готовы платить за ваши данные. Получите $100 за каждый GiB!
Имеете лишний даталолом объемом 10 TiB? Обещают перевести $1,000,000! Особенно, говорят, что ценят данные из мира программирования и науки.
Поделитесь своим "цифровым металлоломом" с Magic AI и, возможно, войдите в историю ИИ!
🤑 Продать данные
🤯18❤4🔥3
Квантизация датасетов
Новая статья предлагает интересный подход к сжатию обучающих данных для нейросетей.
Исследователи из ByteDance (которой принадлежит ТикТок) и Национального университета Сингапура разработали метод Dataset Quantization (DQ), позволяющий существенно уменьшить размер тренировочного набора данных без потерь в качестве обучения.
DQ работает следующим образом:
1. Весь набор данных делится на непересекающиеся патчи.
2. Из каждого патча равномерно отбирается небольшое количество сэмплов.
3. Выбранные сэмплы объединяются в сжатый набор данных для обучения.
Преимущества:
- Позволяет сэкономить до 40% данных без потери качества модели.
- Вроде бы работает для любых архитектур нейросетей. (проверяли только на тексте и картинках)
Эксперименты показали, что модели, обученные на сжатых DQ-данных, хорошо работают на практических задачах, вроде распознавания объектов.
Метод поможет ускорить и удешевить обучение нейросетей при сохранении качества. Это важно для развития ИИ и машинного обучения.
😎 Статья
🤩 Код
Новая статья предлагает интересный подход к сжатию обучающих данных для нейросетей.
Исследователи из ByteDance (которой принадлежит ТикТок) и Национального университета Сингапура разработали метод Dataset Quantization (DQ), позволяющий существенно уменьшить размер тренировочного набора данных без потерь в качестве обучения.
DQ работает следующим образом:
1. Весь набор данных делится на непересекающиеся патчи.
2. Из каждого патча равномерно отбирается небольшое количество сэмплов.
3. Выбранные сэмплы объединяются в сжатый набор данных для обучения.
Преимущества:
- Позволяет сэкономить до 40% данных без потери качества модели.
- Вроде бы работает для любых архитектур нейросетей. (проверяли только на тексте и картинках)
Эксперименты показали, что модели, обученные на сжатых DQ-данных, хорошо работают на практических задачах, вроде распознавания объектов.
Метод поможет ускорить и удешевить обучение нейросетей при сохранении качества. Это важно для развития ИИ и машинного обучения.
😎 Статья
🤩 Код
👍38❤6🔥2
Бесплатный курс по файнтюнингу LLM
OpenAI только вчера представили инструменты для файнтюнинга GPT, а DeepLearning.AI уже ловко подхватили этот тренд и опубликовали краткий курс "Файнтюнинг больших языковых моделей"!
Ведущая курса - Шарон Чжоу, основатель и CEO Lamini. Курс предназначен для оттачивания навыков в файнтюнинге, что позволит использовать GPT на полную!
Вас ждут:
• Разбор кейсов, где файнтюнинг даст максимальный эффект.
• Подготовка данных для файнтюнинга.
• Тренировка и оценка вашей модели.
Знание Python и PyTorch - обязательно. Жаждете узнать больше о файнтюнинге?
😎 Регистрируйтесь
OpenAI только вчера представили инструменты для файнтюнинга GPT, а DeepLearning.AI уже ловко подхватили этот тренд и опубликовали краткий курс "Файнтюнинг больших языковых моделей"!
Ведущая курса - Шарон Чжоу, основатель и CEO Lamini. Курс предназначен для оттачивания навыков в файнтюнинге, что позволит использовать GPT на полную!
Вас ждут:
• Разбор кейсов, где файнтюнинг даст максимальный эффект.
• Подготовка данных для файнтюнинга.
• Тренировка и оценка вашей модели.
Знание Python и PyTorch - обязательно. Жаждете узнать больше о файнтюнинге?
😎 Регистрируйтесь
🔥12👍3❤2
Forwarded from DLStories
В продолжение к посту выше: эта история мне напомнила еще один недавний случай, где метрика сыграла большую роль. Не так давно в Твиттере/Реддите стали появляться сообщения, что ChatGPT что-то "сильно отупела". Конкретно, в задачах, где нужно генерировать код, стала выдавать невалидный код. Который тупо не запускается. Потом еще ребята из Стенфорда выпустили статью, где основательно сравнили перформанс ChatGPT и GPT-4 в марте и июне 2023 года. Эти сравнения были очень выразительными: в марте где-то 50% кода, выданного ChatGPT, было корректным, а в июне этот показатель стал 10%. Вот твит с парой таких картинок.
Это навело какую-то шумиху, я даже в нескольких чатах видела обсуждение (ну и правда, было интересно, что такое случилось). Ну а что же там произошло на самом деле: оказывается, снова дело было в метрике. В том, как авторы статьи измеряли "корректность" кода, выданного ChatGPT. Измерялась она, похоже, так: берем код, который выдает модель, запускаем. Запустилось — хорошо, не запустилось — плохо. И с мартовской версией ChatGPT большинство кода работало, с июньской версией перестало. В чем же дело?
А дело в том, что OpenAI поменяла вид, в котором ChatGPT выдает код. Теперь весь код в выводе обрамляется кавычками, и рядом еще ставится приписка, какой язык программирования используется. И именно это нововведение сломало прямой запуск кода в выводе ChatGPT. Т.е. модель продолжила выдавать правильный код, но запуск этого кода стал ломаться из-за добавленных кавычек.
Вот такая история. Подробнее про нее и другие аспекты этой статьи можно почитать в Сиолошной. Это еще один повод, чтобы чуть исследовать удивительные открытия, перед тем как писать "this is huge"(сори, у меня немного аллергия на посты, которые начинаются с таких фраз)
Это навело какую-то шумиху, я даже в нескольких чатах видела обсуждение (ну и правда, было интересно, что такое случилось). Ну а что же там произошло на самом деле: оказывается, снова дело было в метрике. В том, как авторы статьи измеряли "корректность" кода, выданного ChatGPT. Измерялась она, похоже, так: берем код, который выдает модель, запускаем. Запустилось — хорошо, не запустилось — плохо. И с мартовской версией ChatGPT большинство кода работало, с июньской версией перестало. В чем же дело?
А дело в том, что OpenAI поменяла вид, в котором ChatGPT выдает код. Теперь весь код в выводе обрамляется кавычками, и рядом еще ставится приписка, какой язык программирования используется. И именно это нововведение сломало прямой запуск кода в выводе ChatGPT. Т.е. модель продолжила выдавать правильный код, но запуск этого кода стал ломаться из-за добавленных кавычек.
Вот такая история. Подробнее про нее и другие аспекты этой статьи можно почитать в Сиолошной. Это еще один повод, чтобы чуть исследовать удивительные открытия, перед тем как писать "this is huge"
👍19😁5😱2😢1
Бифотонная цифровая голография - быстрый и точный метод квантовой томографии
Представьте, что можно было бы восстановить изображение объекта по фотонам, которые никогда с этим объектом не взаимодействовали. Например, сделать рентгеновский снимок по пучку фотонов, который не проходил сквозь тело пациента. Нет, никто не сошел с ума. Это ghost imaging. Просто в квантовой физике так звучит примерно все. Дело в запутанных частицах, демонстрирующих сильные нелокальные корреляции.
Сложность воплощения этой (и любой другой) квантовой технологии в определении волновой функции, которая описывает чистое квантовое состояние системы, т.е. всю информацию о ней. Это процесс называется томографией квантового состояния. Свежая публикация в Nature Photonics как раз про новейший метод квантовой томографии - бифотонную цифровую голографию (пока) двух запутанных фотонов.
До этого открытия волновую функцию пытались реконструировать методом проекционной томографии. Проекционной как в любом томографе - видим "тени" объекта на разные "стены" и по ним пытаемся понять (спасибо Родону), как выглядит этот объект.
Квантовое состояние с т.зр математики - вектор в гильбертовом пространстве многочисленных степеней свобод, и это слишком многомерный объект, чтобы справиться с задачей проектным способом (занимает дни измерений и вычислений для двух частиц).
А голография основана на интерферограмме - изображении, полученном путем интерференции рассеянного объектом света с референсом.
Ученым из Университета Оттавы и Римского университета Ла Сапиенца удалось получить довольно высокую точность реконструкции - 87% и сделать процесс более эффективным (на 3 порядка быстрее).
Это гиганский шаг для многочастичной квантовой механики (чтобы квантовые компьютеры когда-нибудь покинули лаборатории), многомерных квантовых коммуникаций (к которым мы готовимся, переходя на новые стандарты пост-квантовой криптографии), и заканчивая quantum sensing, как минимум, для улучшения промышленной и медицинской визуализации.
🪩 Статья
@GingerSpacetail
Представьте, что можно было бы восстановить изображение объекта по фотонам, которые никогда с этим объектом не взаимодействовали. Например, сделать рентгеновский снимок по пучку фотонов, который не проходил сквозь тело пациента. Нет, никто не сошел с ума. Это ghost imaging. Просто в квантовой физике так звучит примерно все. Дело в запутанных частицах, демонстрирующих сильные нелокальные корреляции.
Сложность воплощения этой (и любой другой) квантовой технологии в определении волновой функции, которая описывает чистое квантовое состояние системы, т.е. всю информацию о ней. Это процесс называется томографией квантового состояния. Свежая публикация в Nature Photonics как раз про новейший метод квантовой томографии - бифотонную цифровую голографию (пока) двух запутанных фотонов.
До этого открытия волновую функцию пытались реконструировать методом проекционной томографии. Проекционной как в любом томографе - видим "тени" объекта на разные "стены" и по ним пытаемся понять (спасибо Родону), как выглядит этот объект.
Квантовое состояние с т.зр математики - вектор в гильбертовом пространстве многочисленных степеней свобод, и это слишком многомерный объект, чтобы справиться с задачей проектным способом (занимает дни измерений и вычислений для двух частиц).
А голография основана на интерферограмме - изображении, полученном путем интерференции рассеянного объектом света с референсом.
Ученым из Университета Оттавы и Римского университета Ла Сапиенца удалось получить довольно высокую точность реконструкции - 87% и сделать процесс более эффективным (на 3 порядка быстрее).
Это гиганский шаг для многочастичной квантовой механики (чтобы квантовые компьютеры когда-нибудь покинули лаборатории), многомерных квантовых коммуникаций (к которым мы готовимся, переходя на новые стандарты пост-квантовой криптографии), и заканчивая quantum sensing, как минимум, для улучшения промышленной и медицинской визуализации.
@GingerSpacetail
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👍8🤯2❤1
Code Llama – еще один шажок к ИИ программистам
Meta сегодня представила Code Llama, модель, которая обещает стать новым словом в мире программирования. Она была создана для того, чтобы ускорить и упростить процесс разработки для программистов и помочь новичкам.
- Открытая и бесплатная модель, основанная на платформе Llama 2.
- Три версии: основная, для Python и с акцентом на исполнение инструкций.
- В тестах превзошла другие известные LLM.
Meta надеется, что их новый инструмент даст толчок к инновациям в сфере программирования и поможет всему сообществу разработчиков.
🐙 Код
🤩 Веса
🤓 Статья
🙃 Блог-пост
Meta сегодня представила Code Llama, модель, которая обещает стать новым словом в мире программирования. Она была создана для того, чтобы ускорить и упростить процесс разработки для программистов и помочь новичкам.
- Открытая и бесплатная модель, основанная на платформе Llama 2.
- Три версии: основная, для Python и с акцентом на исполнение инструкций.
- В тестах превзошла другие известные LLM.
Meta надеется, что их новый инструмент даст толчок к инновациям в сфере программирования и поможет всему сообществу разработчиков.
🐙 Код
🤩 Веса
🤓 Статья
🙃 Блог-пост
🔥40👍12❤5
3х мерные функции Гаусса для быстрого синтеза фотореалистичных 3D сцен
Друзья, сегодня я расскажу про интересную научную работу по компьютерному зрению и графике. В ней предлагается новый подход к быстрому синтезу 3х мерных фотореалистичных сцен по набору фотографий.
Одно из популярных направлений - фотограмметрия, где по множеству фотографий восстанавливается 3D структура сцены, а затем на ее основе синтезируются новые ракурсы. Недавно появился прорывной метод NeRF, моделирующий сцену непрерывным нейросетевым полем.
Однако существующие подходы либо требуют огромных вычислительных ресурсов, либо дают изображения не очень высокого качества.
В основе нового метода, который моментально захватил сердца и умы исследователей лежит представление сцены с помощью 3D функций Гаусса. Это такие объемные "комочки", форма которых задается уравнением Гаусса (колоколообразная кривая).
Каждая такая функция (или как их еще называют сплайн) описывается центром, формой и интенсивностью. Чтобы синтезировать новый ракурс, достаточно спроецировать эти функции на плоскость изображения и сложить их интенсивности.
Первичная структура сцены получается с помощью метода Structure from Motion (SfM), который анализирует множество фото и определяет положение камер и выдает облако точек сцены.
На основе этих данных строится начальное представление сцены, которое затем оптимизируется, чтобы синтезированные изображения максимально походили на исходные фото.
В итоге получается компактное и эффективное описание сцены, позволяющее делать фотореалистичный 3D рендеринг с скоростью 30-300 FPS!
Такой подход может найти применение не только в компьютерных играх и метаверсе, но и в науке для визуализации сложных 3D данных, например, при моделировании молекул или астрофизических объектов.
👀 Видео
Подпишись на @nn_for_science
Друзья, сегодня я расскажу про интересную научную работу по компьютерному зрению и графике. В ней предлагается новый подход к быстрому синтезу 3х мерных фотореалистичных сцен по набору фотографий.
Одно из популярных направлений - фотограмметрия, где по множеству фотографий восстанавливается 3D структура сцены, а затем на ее основе синтезируются новые ракурсы. Недавно появился прорывной метод NeRF, моделирующий сцену непрерывным нейросетевым полем.
Однако существующие подходы либо требуют огромных вычислительных ресурсов, либо дают изображения не очень высокого качества.
В основе нового метода, который моментально захватил сердца и умы исследователей лежит представление сцены с помощью 3D функций Гаусса. Это такие объемные "комочки", форма которых задается уравнением Гаусса (колоколообразная кривая).
Каждая такая функция (или как их еще называют сплайн) описывается центром, формой и интенсивностью. Чтобы синтезировать новый ракурс, достаточно спроецировать эти функции на плоскость изображения и сложить их интенсивности.
Первичная структура сцены получается с помощью метода Structure from Motion (SfM), который анализирует множество фото и определяет положение камер и выдает облако точек сцены.
На основе этих данных строится начальное представление сцены, которое затем оптимизируется, чтобы синтезированные изображения максимально походили на исходные фото.
В итоге получается компактное и эффективное описание сцены, позволяющее делать фотореалистичный 3D рендеринг с скоростью 30-300 FPS!
Такой подход может найти применение не только в компьютерных играх и метаверсе, но и в науке для визуализации сложных 3D данных, например, при моделировании молекул или астрофизических объектов.
Подпишись на @nn_for_science
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
3D Gaussian Splatting for Real-Time Radiance Field Rendering
SIGGRAPH 2023
(ACM Transactions on Graphics)
----------------------------------------------------
https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
Radiance Field methods have recently revolutionized novel-view synthesis of scenes captured with multiple…
(ACM Transactions on Graphics)
----------------------------------------------------
https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
Radiance Field methods have recently revolutionized novel-view synthesis of scenes captured with multiple…
🔥26❤5👍3🤩1
🌾 Как современные технологии помогают классифицировать урожай
Вы когда-нибудь задумывались, как ученые и фермеры определяют различные виды культур на огромных площадях земли? Используя последние достижения в области спутниковой съемки, исследователи создали уникальный датасет, который помогает различать разнообразные культуры по всем Соединенным Штатам.
Используя изображения от спутников Landsat и Sentinel, ученые смогли собрать данные о различных культурах за 2022 год. Эти изображения не просто фотографии – они содержат информацию о растениях в разных спектрах света (видимый и инфракрасный), что позволяет точно классифицировать типы растений.
Датасет включает в себя «патчи» - небольшие участки земли размером 224 x 224 пикселя. Каждый такой "патч" содержит информацию о растительности в трех различных временных точках в течение сезона роста. Так, ученые могут отслеживать изменения на полях в разное время года.
Основная цель датасета - обучение компьютерных моделей, что бы они могли различать и классифицировать разные типы растений. Это может помочь в сельском хозяйстве, экологии и многих других областях.
💡 Как это было сделано?
Исследователи отобрали 5,000 "патчей" из данных USDA, а затем выбрали наилучшие изображения без облаков. Эти изображения были проанализированы, скомбинированы и отсортированы, чтобы создать окончательный датасет из 3,854 "патчей".
🤩 Датасет
Подпишись на @nn_for_science
Вы когда-нибудь задумывались, как ученые и фермеры определяют различные виды культур на огромных площадях земли? Используя последние достижения в области спутниковой съемки, исследователи создали уникальный датасет, который помогает различать разнообразные культуры по всем Соединенным Штатам.
Используя изображения от спутников Landsat и Sentinel, ученые смогли собрать данные о различных культурах за 2022 год. Эти изображения не просто фотографии – они содержат информацию о растениях в разных спектрах света (видимый и инфракрасный), что позволяет точно классифицировать типы растений.
Датасет включает в себя «патчи» - небольшие участки земли размером 224 x 224 пикселя. Каждый такой "патч" содержит информацию о растительности в трех различных временных точках в течение сезона роста. Так, ученые могут отслеживать изменения на полях в разное время года.
Основная цель датасета - обучение компьютерных моделей, что бы они могли различать и классифицировать разные типы растений. Это может помочь в сельском хозяйстве, экологии и многих других областях.
💡 Как это было сделано?
Исследователи отобрали 5,000 "патчей" из данных USDA, а затем выбрали наилучшие изображения без облаков. Эти изображения были проанализированы, скомбинированы и отсортированы, чтобы создать окончательный датасет из 3,854 "патчей".
🤩 Датасет
Подпишись на @nn_for_science
🔥20👍14❤6😢1