Data Secrets
77.4K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Исследователи из Оксфорда придумали, как детектить галлюцинации в LM

Идея проста и изящна: давайте заставим LLM выплевывать не один, а несколько ответов, затем откластеризуем их по истинности (то есть если фраза A подразумевает, что верна фраза B, значит они в одном кластере), а потом посчитаем семантическую энтропию.

Дело в том, что правильные ответы будут похожи, а галлюцинации - нет. Получается, если энтропия высокая, значит моделька подвирает и придумывает, а если низкая, значит говорит уверенно и в ее словах нет противоречий. Самое интересное тут, что использовать метод можно не только на инференсе, но не непосредственно во время alignment'а.

Похожую идею, кстати, использовали в недалеком прошлом авторы статьи “More Agents Is All You Need”. Там окончательный ответ формировался с помощью мнения большинства по ответам нескольких агентов.

Возвращаясь к оксфорской статье, ее результаты очень многообещающие: в 79% случаев метод смог верно задетектить галлюцинации. Тем не менее, реальное его внедрение в LLM обойдется дорого, так что метод вряд ли подойдет для бизнеса.
👍71🔥16103🤔3
Жестоко, но факт 🤷‍♀️

Динозавры, не сумевшие адаптироваться, вымерли.

То же самое произойдет с дата сайентистами, которые считают, что обучения моделей внутри Jupyter блокнотов достаточно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95🗿34😁26🫡8👍54💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Прочувствовали?
82🤯6214😐8🤪8😁64🗿4🐳3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Мира Мурати из OpenAI опять выдала базу

«Некоторые творческие профессии, возможно, исчезнут из-за ИИ, но, возможно, их вообще не должно было существовать»


Как вам такой safe AGI?
😁186🗿40👍2014🤨11🤯73💅2
Forwarded from XOR
⚡️ Инженеры из Стэнфордского университета разработали человекоподобного робота HumanPlus, а исходный код опубликовали на GitHub.

Робот может научиться музицировать, боксировать, играть в пинг-понг просто следя за человеческими действиями. Для обучения ему нужно около 40 часов.

За координацию движений отвечает нейросеть. Она же помогает роботу обучаться в реальном времени.

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👾46🔥16👍113😁1🤯1🗿1
Ведущие технологические компании считают одной из самых больших проблем ИИ — неумение шутить.

⚪️Исследователи из DeepMind попросили 20 комиков поделиться своим опытом использования ведущих чат-ботов для написания шуток. Опрошенные сказали, что считают ИИ безвкусным, неоригинальным и чрезмерно политкорректным.

⚪️DeepMind не единственные думают о чувстве юмора ИИ. xAI Илона Маска позиционирует Grok как более смешную альтернативу конкурирующим ИИ.

⚪️На неделе Anthropic выпустила новую модель Claude 3.5 Sonnet, которая, по их словам, значительно лучше понимает юмор.

Мы решили проверить и попросили ChatGPT и Claude написать шутку про Сэма Альтмана. Итог: стендаперы пока могут спать спокойно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3886👍3💘2
В Европе открылся новый университет, полностью посвященный ИИ-образованию

ELLIS Institute в Тюбингене (Германия) теперь планирует стать всемирным центром новаторских фундаментальных исследований в области ИИ.

На открытии вчера было много звездных гостей, в том числе Ян Лекун. Он выступил с небольшой вступительной речью, резюмируем:

«Если вы студент или академический исследователь и хотите добиться прогресса в области искусственного интеллекта человеческого уровня, НЕ РАБОТАЙТЕ НАД LLM.

LLM — это уход с траектории.
Тысячи инженеров работают над LLM, используя огромные вычислительные ресурсы. Единственный способ внести свой вклад в этой области — это проанализировать существующие LLM и показать их возможности и ограничения.

Но гораздо интереснее и эффективнее придумывать новые идеи и новые архитектуры и показывать, что они могут работать даже при решении небольших задач.»


Собираем вещи в Германию?
😁102🔥6238👍266🐳5
Не забываем классику
😁22317🔥9🎉53🌚1
Дата центры в совокупности потребляют больше энергии, чем Италия, Испания, и даже Австралия.

Это выяснили аналитики из Bloomberg в новой статье на тему потребление энергии системами ИИ.

Как всегда, Bloomberg отличается интересными сравнениями и яркими графиками. Отличное чтиво на воскресенье.
64🤯44😁8👍6
Просто стимул выпустить GPT-5
😁116🔥117👍4
Data Secrets
Сыр часто достается второй мышке или как Apple собирается стать монополистом ИИ Скотт Гэллоуэй, профессор маркетинга в NYU, на днях в своем блоге разобрал стратегию Apple, с которой они собираются захватить ИИ рынок. Да-да, вы не ослышались, Apple, у которых…
🚀 Apple уже не остановить. По данным источников, кроме заключения сделки с OpenAI, они также обсуждают партнерство с Google Gemini, Perplexity и Meta для внедрения ИИ-функций в свои устройства.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥57😁22🫡14👍32
Мира Мурати в интервью Dartmouth Engineering:

«GPT3 – это интеллект малыша. GPT-4 соответствует знаниям старшеклассника. А GPT-5 будет иметь уровень PhD»


Как думаете, значит ли это, что GPT-5 тоже потребуется 5 лет, чтобы написать документ, который никто никогда не будет читать?
😁274🔥17🌚13👍65👨‍💻3🐳1💋1
История про то, как два 18-летних школьника привлекли $500 000 на разработку своего AI-стартапа

Несколько недель назад Кристофер Фицджеральд и Николас Ван Лэндшут закончили среднюю школу. Но сейчас, вместо того, чтобы наслаждаться каникулами и собирать вещи в колледж, они сидят и работают над своим AI-стартапом APIGen.

Идея создать его пришла к школьникам всего пару месяцев назад, и за это время они успели изучить рынок, сделать питчдеку и почти закончить MVP. Продукт нацелен на авто-генерацию API для бизнес-процессов и IoT устройств.

Со слов инвесторов, которые дали подросткам $500 тысяч:

«Мы пошли на встречу к этим детям, думая, что просто собираемся дать какие-то отеческие советы и поделиться опытом. А после двух часов их презентации мы вышли, думая, что это была лучшая презентация, которую мы слышали за последние пять лет.»


И кстати, 500к – это только под пресид раунд. Бету обещают выкатить в этом месяце. Удачи пожелаем?
👍20624193😁3🤯3🐳1🙈1
⚡️ Тем временем Андрей Карпаты готовит новый курс по LLM

Он уже сделал его анонс и показал учебную программу. В репозитории, где появится курс, самих лекций пока нет, лежит только ридми с темами. Тем не менее, репа уже набрала 5.5к звезд.

Программа действительно выглядит огненно: вся база современных LLM от attention до мультимодальности. Оцените сами ⬆️

А вот, кстати, список других полезных лекций Карпаты, которые стоит посмотреть.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12731👍1851
POV: ты попал в гости к Андрею Карпаты
🔥158😁65👍108👻6🤨3😍2🗿2👌1🌭1
Наткнулись на интересное исследование о способностях GPT-4 рассуждать на тему этики

Этика подразумевает в данном случае ответы на такие вопросы как "что такое добро и зло?", "что важнее, долг или счастье?" или решение таких загадок, как проблема вагона.

Сюрприз: люди оценивают этические рассуждения GPT выше, чем ответы известного эксперта по этике. Респонденты говорили, что они "более морально правильные, заслуживающие доверия, продуманные и точные".

Интересно также, что опрошенные часто догадывались, что им показывают ответы ИИ, но все равно голосовали за них. Более того, исследователи даже предположили, что безжизненность ответов GPT стала одним из факторов "выигрыша". Это в каком-то смысле логично: ведь проще верить в таких вопросах тому, у кого, как тебе кажется, нет эмоций, и кто не подвержен человеческому фактору.

Кстати, оказывается, для этики есть даже специальная модификация теста Тьюринга: Comparative Moral Turing Test. Знали?
55👍14🔥8🤓5😁3
Data Secrets
⚡️ Anthropic опять завозят революцию: бесплатный Claude 3.5 Sonnet уровня GPT-4o Вы только гляньте на бенчмарки: все, кроме 4o далеко позади, но и 4o отстает на большинстве тестов, в том числе в понимании изображений и графиков. По сравнению с прошлой моделью…
Завезли результаты с арены!

Claude 3.5 Sonnet с небольшой разницей вырвался на 1 место и обогнал GPT-4o на Coding лидерборде. В общем зачете на первом месте все еще OpenAI, Sonnet второй.

Организаторы обещают, что скоро обновится еще и вижн лидерборд. Ставим ставки, коллеги.
57👍14
Apple (как всегда по-тихому) выложила в опенсорс фундаментальную модель для изображений. 4М умеет:

➡️генерировать картинки
➡️создавать подписи
➡️сегментировать, обнаруживать объекты и вот это все
➡️строить карты глубины
➡️обрабатывать изображения по промпту

И много чего другого. Все в одном модальном окне, да еще и под лицензией Apache 2.0.

Статья | Код | Демо
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7110👍5👀1