Data Secrets

⚡️ Pop Smoke записал трек про Data Engineering. Ну, или почти

А с Гуфом будет, интересно?

Please open Telegram to view this post

❤39😁20🔥16😐3

8.23K views11:20

OpenAI, возможно, запустила в Твиттер свою модель под видом живого человека, чтобы разжигать хайп вокруг своих новостей Аккаунт называется @iruletheworldmo и пользователи уже давно подозревают, что с ним что-то неладное. Смотрите: ⚪️ Аккаунт всегда почти…

Strawberry выйдет завтра?

Там опять тот самый аккаунт (бот OpenAI?) в твиттере вкидывает анонсы анонсов. В этот раз он написал:

«attention isn't all you need
new architecture announcement
august 13th @ 10am pt
the singularity begins»

… и приложил к этому ссылку на репозиторий, в котором только ридми файл с тем же текстом и .py файл вот с таким кодом 👆

В общем, завтра в 20:00 по мск остаемся начеку

Please open Telegram to view this post

VIEW IN TELEGRAM

🤯59😁12❤9👍4🙈1

8.71K views13:35

Data Secrets

А Илон Маск то у нас, оказывается, трушный любитель рока

Кому такую же?

100😁2213👏6🫡4❤2⚡2🗿1

8.42K views16:14

Data Secrets

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

POV: лосс твоей модели, когда переборщил с learning rate

Да, мы тоже не смогли пройти мимо олимпиадных мемов

🔥75😁42❤88👍2❤‍🔥1

8.68K views17:54

Data Secrets

Один из многочисленных групповых исков художников, поданных на Stability, Runway и DeviantArt, будет рассмотрен в суде

Раньше ни один такой иск так и не доходил до судебного процесса: все отклонилось на этапе рассмотрения. Но теперь…

Теперь у компаний будут неприятности. Даже если они выиграют, суд – это дорого, долго и крайне вредно для репутации. А у того же Stability, кажется, и так проблем хватает

🤯32👍10🙈7❤2😁2🤨2

8.33K views06:46

Data Secrets

Один из многочисленных групповых исков художников, поданных на Stability, Runway и DeviantArt, будет рассмотрен в суде Раньше ни один такой иск так и не доходил до судебного процесса: все отклонилось на этапе рассмотрения. Но теперь… Теперь у компаний…

А тем временем бывшие сотрудники Stability (судя по всему вовремя ушедшие из компании) основали собственный стартап/лабораторию и сделали модель, которая порвала рейтинг text2image

🔥60👍11❤7👏4😁2🤯2

8.02K views09:04

Data Secrets

Японская лаборатория Sakana AI выкатила AI-ресерчера из коробки

Это агент, который обучен проходить весь "человеческий" цикл написания научной работы: генерация и скоринг идей, эксперименты (включая код, графики, проверку гипотез) и написание статьи, причем при этом есть отдельная моделька, которая высутупает в роли "ревьюера №2" и критикует текст папиры.

На картинке – пример такой работы про гроккинг. Кроме этого кейса, агент тестировался на разработке статьи про диффузионки и NLP. Некоторые из статей эксперты признали подходящими для уровня ведущих конференций.

Авторы утверждают, что цена реализации идеи – 15 долларов. Они верят, что такой агент может ускорить прогресс и умножить научные знания человечества. Кажется, так же начинался какой-то роман-утопия, но все равно интересно взглянуть, что из этого выйдет.

Тех.репорт | Открытый код проекта

🔥78👍16🤔10❤5🤯4🗿3😎3😁2

9.98K views11:04

Data Secrets

Тем временем от глаз сообщества не ускользнула гениальность подписей нового AI Scientist'а в одной из его статей 😬

Please open Telegram to view this post

VIEW IN TELEGRAM

😁83🤯10👍5🆒3🤔1

7.6K views12:29

Занимательный отрывок из стэнфордской лекции известного экономиста Эрика Бриньолфсона

"За всю историю машины нисколько не уменьшили ценность человеческого труда. Наоборот, за последние пару сотен лет они увеличили его значимость в 50 раз, усилив и дополнив производительность человека. Человек с машиной способен выполнять больше работы, которая и оплачивается выше."

Злободневно.

👍106❤16☃7🔥6🤪2🤔1

7.73K views14:00

Data Secrets

Почему image2image модели исторически называются фильтрами?

Что вообще такое «фильтр»? Как мы фильтруем картинки и какой лосс при этом оптимизируем? Объясняем логику, которая стояла у истоков диффузионных моделей, на пальцах и формулах.

❤54👍16🔥9🤯3🤔2🦄22😎1

8.57K views16:10

Data Secrets

Strawberry выйдет завтра? Там опять тот самый аккаунт (бот OpenAI?) в твиттере вкидывает анонсы анонсов. В этот раз он написал: «attention isn't all you need new architecture announcement august 13th @ 10am pt the singularity begins» … и приложил к этому…

Новинка от OpenAI случилась, но не та, которую все ждали

Вместо хайповой 🍓 они выпустили… бенчмарк. Тоже хорошее дело, конечно, но все-таки не моделька.

Бенчмарк представляет из себя обновленную версию SWE-bench – самого популярного теста для оценки способностей к программированию. Выяснилось, что он содержит много нерешаемых или неоднозначных задач и, как следствие, недооценивает модели. Это исправили с помощью простой краудсорсинговой кампании.

Случилось все, кстати, как и обещал тот загадочный аккаунт, в 20:00 по мск. Теперь он обещает, что Strawberry выйдет в четверг, а новый банчмарк призван продемонстрировать, насколько она мощная 🙄

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3025😁13👍6

9.12K views07:32

Data Secrets

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Р – разочарование

😁63💯15🍓9❤5🔥2🤨2🫡2🤝1

8.61K views09:13

Data Secrets

⚡️

Вышел Grok 2

Без лишнего шума (в отличие от некоторых) на горизонте появилась новая LLM от Маска. Оказывается, модель тестировалась на Арене под названием sus-column-r, а теперь делит 3 место с ранней версией GPT-4o. Вместе с большой моделью вышел Grok 2 mini.

Со слов Илона, это только цветочки, а ягодки будут, когда на том самом гигантском кластере доучится Grok 3.

P. S. Модель уже доступна премиум юзерам в X, в API обещают завезти в конце месяца.

Please open Telegram to view this post

VIEW IN TELEGRAM

69❤10🔥5

8.7K views11:15

Data Secrets

😭

Bad news: с 9 сентября в России перестанет работать BigQuery от Google

Об отключении платформы для обработки данных сообщила российская компания Softline. Плюс, пользователям уже начали поступать уведомления об отключении.

При этом Google Workspace и Google Cloud продолжат работать.

Please open Telegram to view this post

VIEW IN TELEGRAM

665🔥19👍8❤4

10.6K views14:33

Data Secrets

А теперь к хорошим новостям: Anthropic добавляют Prompt caching в API

Это штука, которая позволяет кешировать промпты, которые используются часто, а не кормить их модели заново при каждом запросе. Другими словами, райская фича для разработчиков 🕺

Теперь для длинных контекстов цену можно снизить до 90% и на 85% ускорить инференс. Причем кешировать можно целую книгу или огромную кодовую базу, например (см. кейсы в картинке).

Пока фича будет в бете, подробности о ценах и документация тут.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍38❤11🔥11

9.18K views16:50

Data Secrets

Анекдот дня: ученые не могут забронировать жилье на NeurlPS 2024 из-за Тейлор Свифт

Дело в том, что конференция проходит в Ванкувере с 9 по 15 декабря. И примерно в эти же даты в городе выступает Тейлор Свифт.

Итог – самый дешевый отель стоит 650$ за ночь 😰

Please open Telegram to view this post

VIEW IN TELEGRAM

😁134🙈39💅10🫡6🎉3🤓3❤2👀2👍1

10.1K views05:39

About

Blog

Apps

Platform