Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
На CVPR* 2024 наградили победителей в номинации Лучшая статья. Обновляем свой ридинг-бэклог:

1) Rich Human Feedback for Text-to-Image Generation. Ученые вдохновились RLHF для LLM, и продвинуто адаптировали метод под генерацию картинок. На куче отзывов людей они обучили мультимодальный трансформер давать фидбэк на генерации и тем самым улучшать их.

2) Generative Image Dynamics. Работа про моделирование естественной колебательной динамики объектов, таких как покачивание листьев на ветру или горение свечи. Интересно тем, что это не просто генерация видео, а прогнозирование спектрального объема и воссоздание пространства траекторий.

3) pixelSplat: 3D Gaussian Splats from Image Pairs for Scalable Generalizable 3D Reconstruction. Модель, которую научили воссоздавать 3D-поля (проще говоря, понимать глубину фото) по паре изображений.

4) EventPS: Real-Time Photometric Stereo Using an Event Camera. Продвинутый метод оценки нормалей поверхности изображения для генерации облаков точек или 3D моделей.

*CVPR – конференция по компьютерному зрению и распознаванию образов, одна из самых крупных ML-конференций в мире
🔥3513👍882🤯1
CEO Hugging Face рассказал, что каждую неделю получает около 10 предложений от фаундеров, которые хотят продать свои стартапы

Он утверждает, что количество таких предложений резко увеличилось за год. Причин этому может быть две причины:

1) Возможно, дело в самом Hugging Face. За последний год компания сильно выросла, привлекла $235 млн инвестиций и добралась до оценки в $4.5 млрд. К тому же, у них куча ресурсов, поэтому HF теперь выглядит на рынке как очень перспективный потенциальный покупатель.

2) А возможно, рост HF не главная причина, и на ИИ-рынке просто началась консолидация. Cтартапам все труднее выжить в такой высоконкурентной среде. Даже у не слишком мелких игроков, таких так StabilityAI, и то проблемы. А большим компаниям действительно выгодно поглощать стартапы, при чем иногда даже просто ради кадров, а не ради технологии. Регуляризация тоже начинает делать свое дело.

Кстати, на какие-то покупки HF все-таки соглашается. На прошлой неделе они купили Argilla за $10 млн, но по словам оунеров, сделка готовилась уже давно, и HF сами вышли на стартап.
36👍16🔥6🤝1
⚡️ Anthropic опять завозят революцию: бесплатный Claude 3.5 Sonnet уровня GPT-4o

Вы только гляньте на бенчмарки: все, кроме 4o далеко позади, но и 4o отстает на большинстве тестов, в том числе в понимании изображений и графиков. По сравнению с прошлой моделью особенно скакнули способности в кодинге и продвинутом ризонинге. Контекст 200к токенов.

Еще появилась интересная функция Artifacts: по сути, это дополнительные всплывающие интерактивные окна, например для демо.

При всем при этом работает новая версия в 2 раза быстрее Claude 3, и дешевле предшественницы в 5 раз!

Моделька доступна абсолютно бесплатно. Радуемся и ждем обновление арены.
Please open Telegram to view this post
VIEW IN TELEGRAM
59🔥22👍121
Сегодня как-то так
😁13733🔥1131
Исследователи из Оксфорда придумали, как детектить галлюцинации в LM

Идея проста и изящна: давайте заставим LLM выплевывать не один, а несколько ответов, затем откластеризуем их по истинности (то есть если фраза A подразумевает, что верна фраза B, значит они в одном кластере), а потом посчитаем семантическую энтропию.

Дело в том, что правильные ответы будут похожи, а галлюцинации - нет. Получается, если энтропия высокая, значит моделька подвирает и придумывает, а если низкая, значит говорит уверенно и в ее словах нет противоречий. Самое интересное тут, что использовать метод можно не только на инференсе, но не непосредственно во время alignment'а.

Похожую идею, кстати, использовали в недалеком прошлом авторы статьи “More Agents Is All You Need”. Там окончательный ответ формировался с помощью мнения большинства по ответам нескольких агентов.

Возвращаясь к оксфорской статье, ее результаты очень многообещающие: в 79% случаев метод смог верно задетектить галлюцинации. Тем не менее, реальное его внедрение в LLM обойдется дорого, так что метод вряд ли подойдет для бизнеса.
👍71🔥16103🤔3
Жестоко, но факт 🤷‍♀️

Динозавры, не сумевшие адаптироваться, вымерли.

То же самое произойдет с дата сайентистами, которые считают, что обучения моделей внутри Jupyter блокнотов достаточно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95🗿34😁26🫡8👍54💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Прочувствовали?
82🤯6214😐8🤪8😁64🗿4🐳3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Мира Мурати из OpenAI опять выдала базу

«Некоторые творческие профессии, возможно, исчезнут из-за ИИ, но, возможно, их вообще не должно было существовать»


Как вам такой safe AGI?
😁186🗿40👍2014🤨11🤯73💅2
Forwarded from XOR
⚡️ Инженеры из Стэнфордского университета разработали человекоподобного робота HumanPlus, а исходный код опубликовали на GitHub.

Робот может научиться музицировать, боксировать, играть в пинг-понг просто следя за человеческими действиями. Для обучения ему нужно около 40 часов.

За координацию движений отвечает нейросеть. Она же помогает роботу обучаться в реальном времени.

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👾46🔥16👍113😁1🤯1🗿1
Ведущие технологические компании считают одной из самых больших проблем ИИ — неумение шутить.

⚪️Исследователи из DeepMind попросили 20 комиков поделиться своим опытом использования ведущих чат-ботов для написания шуток. Опрошенные сказали, что считают ИИ безвкусным, неоригинальным и чрезмерно политкорректным.

⚪️DeepMind не единственные думают о чувстве юмора ИИ. xAI Илона Маска позиционирует Grok как более смешную альтернативу конкурирующим ИИ.

⚪️На неделе Anthropic выпустила новую модель Claude 3.5 Sonnet, которая, по их словам, значительно лучше понимает юмор.

Мы решили проверить и попросили ChatGPT и Claude написать шутку про Сэма Альтмана. Итог: стендаперы пока могут спать спокойно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3886👍3💘2
В Европе открылся новый университет, полностью посвященный ИИ-образованию

ELLIS Institute в Тюбингене (Германия) теперь планирует стать всемирным центром новаторских фундаментальных исследований в области ИИ.

На открытии вчера было много звездных гостей, в том числе Ян Лекун. Он выступил с небольшой вступительной речью, резюмируем:

«Если вы студент или академический исследователь и хотите добиться прогресса в области искусственного интеллекта человеческого уровня, НЕ РАБОТАЙТЕ НАД LLM.

LLM — это уход с траектории.
Тысячи инженеров работают над LLM, используя огромные вычислительные ресурсы. Единственный способ внести свой вклад в этой области — это проанализировать существующие LLM и показать их возможности и ограничения.

Но гораздо интереснее и эффективнее придумывать новые идеи и новые архитектуры и показывать, что они могут работать даже при решении небольших задач.»


Собираем вещи в Германию?
😁102🔥6238👍266🐳5
Не забываем классику
😁22317🔥9🎉53🌚1
Дата центры в совокупности потребляют больше энергии, чем Италия, Испания, и даже Австралия.

Это выяснили аналитики из Bloomberg в новой статье на тему потребление энергии системами ИИ.

Как всегда, Bloomberg отличается интересными сравнениями и яркими графиками. Отличное чтиво на воскресенье.
64🤯44😁8👍6
Просто стимул выпустить GPT-5
😁116🔥117👍4
Data Secrets
Сыр часто достается второй мышке или как Apple собирается стать монополистом ИИ Скотт Гэллоуэй, профессор маркетинга в NYU, на днях в своем блоге разобрал стратегию Apple, с которой они собираются захватить ИИ рынок. Да-да, вы не ослышались, Apple, у которых…
🚀 Apple уже не остановить. По данным источников, кроме заключения сделки с OpenAI, они также обсуждают партнерство с Google Gemini, Perplexity и Meta для внедрения ИИ-функций в свои устройства.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥57😁22🫡14👍32