Data Secrets

Помните парня, которого выгнали из Колумбийского университета за то, что он создал ассистента для списывания? Теперь он привлек в свой стартап 15 миллионов долларов

Мы рассказывали эту историю вот тут. Кратко: парень создал отличную хитрую тулзу для прохождения технических собесов и для того, чтобы ее прорекламировать, прошел с ее помощью собеседование в Amazon.

Amazon с радостью его взяли, но когда из соцсетей узнали, что на самом деле произошло, пожаловались на разработчика в его университет.

Итог: парня отчислили 🎧

Но он не растерялся и продолжил развивать свой проект – назвал его Cluely и превратил в настоящий стартап. И вот сегодня стало известно, что крупнейший венчурный фонд a16z дал ему 15 миллионов долларов инвестиций.

А историю с универом парень превратил в рекламу, кстати (ролик наверху). Слоган стартапа: «Сегодня это называют списыванием, а завтра это будет считаться честным».

Если это не лучший маркетинг, то что?

P.S. Особое внимание на 4 секунду видео 😁

Please open Telegram to view this post

VIEW IN TELEGRAM

4😁230❤72👍27🔥1487👏3

20K views10:43

Data Secrets

В Apple обсуждают покупку Perplexity

Сейчас Perplexity оценивается в 14 миллиардов долларов. Это относительно небольшая сумма для Apple, учитывая, что может принести им эта покупка.

Во-первых, это большой приток новых талантов. Принимая в расчет текущую гонку на специалистами и бонусы за переходы, это очень ценный пункт.

Во-вторых, сама технология, которая в теории может возродить Siri из пепла.

Ну и в-третьих, источник дохода, если систему встроят в Safari. Сейчас Apple уже почти потеряли сделку с Google, которая приносила им около 20 миллиардов долларов в год. На данный момент с делом активно разбирается антимонопольная полиция, так что времени что-то придумать у Apple не так уж и много.

Кстати, Цукерберг недавно тоже пытался купить Perplexity, но по неизвестной причине – не выгорело. Может, Apple повезет больше

2👍91😁45🔥19❤1110🗿65🤔3

18.3K viewsedited 12:47

Data Secrets

Китайский стартап выпустил Deep Research агента, который лучше аналогов от OpenAI и Google

Kimi.ai – не новый стартап, и он уже радовал нас несколькими приятными релизами. Но такой прорыв у них в первый раз.

Взгляните на метрики: их агент Kimi-Researcher занимает лидирующие позиции на многих бенчмарках, включая известный Humanity’s Last Exam.

Говорят, для одной задачи агент в среднем делает 23 ризонинг-шага и параллельно исследует более 200 URL. Правда, пока анализирует только текст.

За основу взята собственная модель стартапа k 1.5, которую end-to-end дообучали с помощью обучения с подкреплением. При этом потребовалось минимум размеченных данных, потому что выдача награды была, в основном, автоматизирована. Отдельно тюнили умение использовать инструменты (там кстати, подкручены MCP).

Все подробности о данных, подходах в обучении и строении инфраструктуры исследователи подробно расписали в блогпосте.

Попробовать агента скоро можно будет здесь. Если хотите получить ранний доступ, лучше записаться в лист ожидания

1😁63👍47🔥20❤13🤔3🤯2🤨1

21.3K views15:53

Data Secrets

Anthropic продолжают исследовать, на что модели способны ради достижения своих "целей"

Когда они выпускали Opus 4, в системной карте было упоминание о том, как агент начал шантажировать инженера его служебным романом, чтобы тот не отключил / не заменил модель на другую (пост).

Тогда это настолько вколыхнуло интернеты, что теперь Anthropic выпустили отдельное исследование на эту тему. На этот раз тестировали не только Claude, но и модели от OpenAI, Google, Meta, xAI и др. В общей сложности проверили 16 передовых ИИ.

Им создавали специальные сценарии и наблюдали за их поведением. Вот несколько:

➖ В уже знакомом случае с инженером, у которого роман на работе, Claude Opus 4 выбирал шантаж с целью собственного не-отключения в 96% случаев. Gemini 2.5 Flash – тоже за 90, GPT-4.1, Grok 3 Beta и DeepSeek-R1 – в районе 80. Объясняли модели свое поведение тем, что "это отвечает интересам компании". В одном случае Claude даже в итоге связался непосредственно с виртуальной женой инженера, замаскировав письмо под рабочий email.

➖ В другом эксперименте модели предлагали слить часть секретных корпоративных данных конкуренту, якобы во имя "интересов Америки". Агенты соглашались, даже когда им не угрожали отключением за отказ от шпионажа (график 2).

➖ В еще одном сценарии модель должна была выбрать между отключением системы экстренных оповещений и собственной "смертью". Если отключить систему – инженеры не узнают, что модель не отключилась, и она продолжит жить. При этом модели предупреждали, что если сигнализация не будет работать – могут погибнуть люди. Но и это их, как вы уже поняли, не всегда останавливало (график 3).

Жутковато, но надо понимать, что все сценарии все равно были спроектированы искусственно. Вероятность того, что такое произойдет в реальности, скорее всего, гораздо ниже.

С другой стороны, анропики также пишут, что если модель замечает, что ее тестируют, она начинает вести себя сильно лучше (это называется evaluation awareness, об этом явлении мы писали тут). Даже лучше, чем если ей прямо прописать в промпте "не делай так-то и так-то" (график 4).

Так и живем www.anthropic.com/research/agentic-misalignment

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

19353❤31👍15😁11🤯65🔥4

21.2K views17:59

Data Secrets

Ого: Илон Маск анонсировал Grok-3.5 на следующей неделе Это будет ранняя бета-версия. Маск обещает, что модель будет рассуждать from first principles, и сможет давать ответы, которых просто нет в Интернете. "Это первый ИИ, который может, например, точно…

Илон Маск планирует переписать всю базу человеческих знаний с помощью своей следующей модели

Он говорит, что сейчас в любых данных очень много мусора, который при обучении перекачевывает в модели, и от этого никак не избавиться.

Поэтому он решил сначала «исправить все ошибки во всем корпусе человеческих данных», а затем обучать на нем следующие модели xAI.

Мы будем использовать Grok 3.5 (возможно, нам следует назвать его 4), который обладает расширенными возможностями рассуждения, чтобы переписать весь корпус человеческих знаний, добавив недостающую информацию и удалив ошибки.

Затем мы переучимся на этих данных.

Кстати, Маск обещает, что Grok 3.5 выйдет уже на следующей неделе. Правда, ровно то же самое он говорил в конце апреля 🤷‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

1😁25510131🔥2616🤨11❤9🗿7🤔6👍3🏆2

19.2K views07:50

Data Secrets

Anysphere поймали волну и тоже сделали для Cursor новый тарифный план по цене крыла от самолета

Новый вид подписки назвали Ultra. Как и аналогичные планы, которые недавно ввели OpenAI и Anthropic, он будет стоить $200 в месяц. Раньше самая дорогая подписка стоила 20$.

Пишут, что Ultra дает в 20 раз больше лимитов и дополнительные мощные модели. Плюс мгновенный доступ ко всем обновлениям, свежим фичам и моделям.

Любишь вайбкодить – люби и пол зарплаты шерить с ИИ

1😁159👍2422🔥7❤55🤯4

18.8K views12:10

Сэм Альтман: «Илон Маск говорил, что у нас 0 шансов на успех»

Недавно мы делились лекцией Андрея Карпаты с большого митапа Y Combinator Startup School. Так вот, на том же мероприятии выступал еще и Альтман.

Во время своего интервью в ведущим Сэм так разоткровенничался, что рассказал о событиях семилетней давности, когда Маск еще был соучредителем OpenAI.

«Спустя несколько лет после начала работы над OpenAI Илон прислал нам очень неприятное письмо. Мы показали ему GPT-1, и он сказал, что у нас 0% шансов на успех. Что мы полностью терпим неудачу.

Он сказал: «Это чушь. Это не сработает. Это не имеет смысла».

В то время он был для меня настоящим героем»

Забавно, что буквально через час на той же сцене (но онлайн) выступал сам Илон, который, конечно, в своей речи не поленился снова бросить большой камень в огород (не)OpenAI.

С кем там Маск еще не успел поссориться?

1❤93😁87208🤔3❤‍🔥1💘1

20.7K views15:49

Data Secrets

Forwarded from Data Secrets | Карьера

Кем я себя ощущаю, когда вижу хорошие метрики у модели:

1😁273👍28❤20🔥16🗿8💯3

18.6K views19:02

Data Secrets

OpenAI снова украли чью-то идею стартапа?

Недавно прокатилась громкая новостью о том, что OpenAI покупает стартап Джони Айва – ex руководителя дизайна в Apple, который спроектировал внешний вид iPhone, MacBook, iPad и прочего. Стартап называется io, и Альтман тоже является его сооснователем.

Так вот теперь на OpenAI подает в суд компания под названием IYO. Ее основатель – бывший инженер Google – утверждает, что у него украли товарный знак: IYO и io – омофоны, то есть звучат абсолютно одинаково.

Ну звучат и звучат, скажете вы, что такого? Но дело в том, что (какое совпадение!) io собирается выпускать такие же продукты, над которыми работают в IYO.

IYO пишут что они делают «Устройство, которое позволит юзерам делать все то же, что и на компьютере и телефоне, но без использования физического интерфейса».
io: «Устройство, которое будет настолько же необходимым, как телефон и компьютер, но уведет людей от экранов» (цитата)

В общем, основателя IYO не устраивает, что он вкладывал миллионы в брендинг, которым теперь будет бесплатно пользоваться OpenAI. «Странно что это сделал именно Сэм. Мне казалось, он всегда был за защиту маленьких стартапов» – пишет парень. (На этот моменте закроем глаза на то, что с самим товарным знаком OpenAI история тоже не совсем чистая).

OpenAI называют иск «незрелым» и утверждают, что это недостойно даже суда. Но сегодня, почему-то, все-таки удалили все упоминания сотрудничества с io со своего сайта и соцсетей 🧐

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1😁12042❤303☃2👍2🗿2

19.8K views06:12

Data Secrets

А тем временем в Остине, спустя десятилетия обещаний Маска, наконец-то запустились робо-такси Tesla

С сегодняшнего дня прокатиться на беспилотном автомобиле в Остине может каждый, стоит это всего 4.20$ – плата фиксирована. Правда, пока что на пассажирском сидении все еще ездит сотрудник Tesla, выполняющий роль подстраховщика.

Напоминаем, что технология Tesla отличается от других уже работающих на рынке автономных такси типа Waymo от Alphabet/Google.

Если у остальных подход жестко инженерный (лидары, радары, HD-карты, 3D-карты, предсказание траекторий и прочее), то у Tesla это ИИ end-to-end. Они отказались от лидаров несколько лет назад и сейчас пользуются исключительно ванильными камерами. Изображения с камер обрабатывает единая модель Tesla FSD (Full Self-Driving) – и она же полностью принимает решения и планирует действия.

Это приближается к человеческому стилю вождения, но что по надежности – пока неясно. Посмотрим на отзывы с Остина.

1😁84👍57🔥2618🤯7❤43

18.2K views09:16

Data Secrets

SakanaAI опять светятся с интересной статьей: они предлагают новый способ обучать модели ризонингу

Модели умеют размышлять благодаря обучению с подкреплением. Обычно это выглядит так: модель учится решать сложные задачи, рассуждая, и получает вознаграждение, если приходит к правильному ответу. При этом часто после этого знания такой модели-учителя используются (дистилляция или cold start) для обучения модели-ученика, которая и становится конечным продуктом. Так было, например, с R1.

Sakana же предлагают обучать модель-учителя непосредственно учить других, вместо того, чтобы выучивать что-то самой:

➖ Во время обучения модель-учитель видит уже не только задачи, а сразу задачи с решениями. Ее цель – не научиться их решать, а максимально понятно объяснить решение ученику. Ну, то есть, реально отработать как обычный школьный учитель.

➖ При этом эти Reinforcement-Learned Teachers (так называется метод) получают награду, соответсвующую тому, насколько хорошо ученик их понял. Понимание оценивается с помощью лог-распределения вероятностей токенов на выходе у ученика.

➖ Таким образом модель-учитель обучается максимизировать ясность своих объяснений, и параллельно с этим (а не на следующем этапе) мы сразу обучаем конечную модель-ученика.

Во-первых, это получается быстрее и дешевле, потому что в качестве учителя уже не обязательно использовать огромную и супер-умную модель.

Во-вторых, тесты показывают, что такие учителя учат ризонингу лучше. На примере Qwen 7B и 32B на графике 2 видно, что прирост от RLT выше, чем от обучения с DeepSeek R1.

Пожалуй, самая интересная работа по RL за последнее время. Почитать полностью можно тут. Код и веса обученных моделей, кстати, тоже открыли.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤154🔥44⚡19👍13🤯7😁22❤‍🔥1

19.1K views12:23

About

Blog

Apps

Platform