Градиент обреченный

Интересный доклад идет на GigaConf. Костя рассказывает про агентов и MCP сервера.

👉 https://gigaconf.ru/program (Зал GenAI)

❤12👍9👾3👀1

3.4K viewsSergei Averkiev, 14:04

Градиент обреченный

Так, пойдемте тестить. 1000 запросов в день бесплатно, 1M контекст с 2.5 Pro.

Смотрим, как работает с большими проектами, как ищет нужный код, для чего она лучше остальных и вообще какие фишки есть.

👉 Пост | GitHub

🔥27🤯8❤4🎉3⚡1😁1

4.32K viewsSergei Averkiev, 16:22

Градиент обреченный

🔺 LLM-митап в Питере

Тут со мной поделились ссылкой на митап в Питере. Выглядит прикольно, решил поддержать ребят информационно.

Бросается в глаза выступление господина Сергея Николенко, автора первой книжки про машинное обучение, которую я прочитал («Глубокое обучение. Погружение в мир нейронных сетей»). Будет еще несколько докладов про LLM в математике.

Проходит все в баре неподалеку от Исаакиевского ❤️

🔸 Обещают развлечения:

• Квиз против LLM от Сергея Николенко
• LLM math frontier: где граница рассуждающих возможностей?
• VibeCoding: творческое программирование!
• AI Safety Challenge: сможете ли вы обойти защиту модели?

🔸 5 июля (сб) в 17:00

👉 https://xn--r1a.website/csspace/94

Please open Telegram to view this post

VIEW IN TELEGRAM

CS Space

Митап: LLM в математике и алгоритмах ⤵️

Развитие и внедрение рассуждающих языковых моделей всё больше влияет на фундаментальные области науки, образования и индустрии. Мы приглашаем исследователей, математиков и алгоритмистов, интересующихся, как LLM справляются…

❤15👍4✍1👀1

4.07K viewsSergei Averkiev, edited 07:15

Градиент обреченный

#gemini_cli

Накидал простой MCP сервер и прописал его в settings.json gemini cli.

Теперь он умеет ходить по проекту, рисовать по нему постеры, комиксы и т.д. и вставлять их readme.

❤17🤯8🔥63🤔1

4.31K viewsSergei Averkiev, 11:38

Градиент обреченный

true story

🤣83💯10🤷‍♂1❤1😁1🤝1

4.22K viewsSergei Averkiev, 07:52

Градиент обреченный

Forwarded from Вселенная Плюс

ПРЕМЬЕРА НОВОГО ВЫПУСКА НА КАНАЛЕ «ВСЕЛЕННАЯ ПЛЮС».

Искусственный интеллект решает задачи лучше или хуже мозга?
Способен ли он думать, как мы?
И возможно ли восстание нейросетей?

Обсуждают физик Алексей Семихатов, астроном Владимир Сурдин и специалист в области машинного обучения и директор по развитию технологий ИИ в Сбере Сергей Марков.

Ставьте лайк под видео (если Вы за людей) или дизлайк (если Вы за машины) и смотрите:

https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg

YouTube

МОЗГ ПРОТИВ НЕЙРОСЕТЕЙ. КТО УМНЕЕ? Семихатов, Сурдин, Марков

Поступай в магистратуру в Центральном университете — https://l.tbank.ru/vselennayajun

Искусственный интеллект решает задачи лучше или хуже мозга? Способен ли он думать как мы? И возможно ли восстание нейросетей? Обсуждают физик Алексей Семихатов, астроном…

🔥21👍6💯32😁1🐳1🗿1

3.48K viewsSergei Averkiev, 18:28

Градиент обреченный

Forwarded from ̶с̶а̶м̶̶о̶изолента мёбиуса

Мы тут обновили датасет FLORES+ до версии 3.0, вмёржив ряд правок, накопившихся за последние месяцы:

1) Добавили ладинский язык, на котором говорят в районе Доломитовых Альп. Он выглядит похоже на итальянский с лёгким вайбом французского и немецкого, и там есть буквы öëü 🙃
2) Обновили орфографию для чувашского и даргинского (там прежде было много случаев использования латинских букв, например, Ă и I, вместо похоже выглядящих кириллических Ӑ и Ӏ*).
3) Обновили номера предложений для аранского диалекта (это вариант окситанского языка, на котором говорят в одной долине в Пиренеях); прежде они неправильно сопоставлялись с предложениями на других языках.

С ладинским, в датасете теперь 222 различных вариаций языков, и можно оценивать качество перевода с любого на любой**!

Ну и да, мы всё ещё предлагаем добавлять новые языки и отправлять статью про это на нашу shared task.

А ещё мы завели substack, поэтому, если вы хотите получать новости о FLORES и других мультиязычных датасетах на электронную почту (на английском), то подписывайтесь на https://openlanguagedata.substack.com 😎

* Для тех, кто не знаком с северокавказскими языками: буква Ӏ обозначает горловой звук (разный в разных языках) и носит официальное название CYRILLIC LETTER PALOCHKA.
** Ну, почти. Датасет состоит из двух сплитов, dev и devtest, и небольшое число языков есть только в одном из сплитов. Но большая часть - в обоих.

🔥12❤5👍2🤝1

3.3K viewsSergei Averkiev, 10:17

Градиент обреченный

Прочитал тут, что Anthropic для обучения своих моделей заморочился и скупил миллионы бумажных книг, порезал их на страницы, отсканил, а потом уничтожил.

С купленной тобой бумажной книгой можно делать все, что угодно, в том числе и модели обучать, так что типа все законно.

https://www.reddit.com/r/singularity/comments/1ljs8np/anthropic_purchased_millions_of_physical_print/

From the singularity community on Reddit: Anthropic purchased millions of physical print books to digitally scan them for Claude

Explore this post and more from the singularity community

🤯34🆒7😱3✍2❤2

4.78K viewsSergei Averkiev, 10:28

Градиент обреченный

Заметил, что с использованием агентов в разработке у меня появляется отторжение к ручному выполнению простых муторных задач, которые я раньше просто брал и делал.

То ли я обленился, то ли тупею, то ли всего понемножку.

//Пишу этот пост пока курсор прокидывает поля с бэкенда на фронтенд.

💯57😁15❤13👍4🤝3

4.49K viewsSergei Averkiev, 07:53

Градиент обреченный

🔺 Появилась тут идея по разработке агента для перевода (пока переводил статью про Cursor). Основная боль, которая была, это дословный перевод, перевод и удаление малоосмысленных оборотов/восклицаний/повторений, которые в английском варианте выглядят вполне органично, исправление стиля для аудитории Хабра. Подумал над этим подумал и посоветовался с профессиональным переводчиком (Настя, спасибо 🤗). Надумал что-то такое:

1. Агент-аналитик. Делает предпереводческий анализ — собирает инфу о контексте (кто автор, когда текст был написан, кто целевая аудитория), анализирует инструкции заказчика и коммуникативную задачу. Кроме как в ТЗ, тут, наверное, можно поискать сопутствующую информацию через Perplexity, если это статья с какого-то ресурса или у автора есть другие статьи.

2. Агент-лексикограф. Выявляет потенциальные переводческие трудности — грамматические, фонетические и культурные. Ищет релевантные параллельные тексты в БД (тут подключаем хранилище с выровненными статьями, например, техническими, в которых адекватно переведены термины). БД делаем и пополняем сами, либо подключаем что-то существующее.

3. На основе работы этих агентов получаем переводческое задание с глоссарием и стилистическим рукодовством. Тут пользователь должен его отсмотреть и одобрить/поправить.

4. Агент-переводчик. Использует задание и найденные готовые соответствия из предоставленного контекста. Если соответствий нет, то должен провести переводческие трансформации (По Комиссарову, как меня научили, они могут быть лексические: транслитерация, калькирование и др.; грамматические и комплексные). Вот тут их надо как-то выявить и обновить глоссарий. Возможно, сделать это на 2 этапе.

5. Агент-рецензент. Оценивает качество перевода на основе, как меня, опять же, научили, существующей теории — репрезентативности или эквивалентности. У обоих есть разбиение по критериям, которые можно попробовать описать формально. Им же можно и просто оценивать готовые переводы. На основе оценки и рекомендаций пользователь делает какие-либо выводы, может скорректировать задание и переперевести или сразу взяться за редактуру.

👉 Думаю, такой инструмент мог бы облегчить жизнь работающим с переводом людям. Есть идеи по поводу такого или, может, кто-то такое уже сделал?

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Как Cursor устроен изнутри. Часть 1

Вторая часть статьи . Всего за год нагрузка на Cursor выросла в 100 раз: более 1 млн запросов в секунду и миллиарды автодополнений кода каждый день. Подробный разбор архитектуры — вместе с...