Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Генерация комментариев к коммитам от Андрея Карпаты

Еще один крутой пет-проект этих выходных. Андрей увидел в Твиттере мем и решил, что надо бы исправлять ситуацию: сел и написал утилиту, которая с помощью gpt4o-mini сама посмотрит на ваш diff и сгенерирует git commit message.

Простой функционал позволит в случае чего перегенерировать или изменить сообщение. И все в одном файле .sh!

Учимся у Андрея правильно реагировать на мемы
❤‍🔥107🤗27😁13🔥12👍82🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Он готовился писать промпты
142😁39👍13💯3
Data Secrets
😭 Bad news: с 9 сентября в России перестанет работать BigQuery от Google Об отключении платформы для обработки данных сообщила российская компания Softline. Плюс, пользователям уже начали поступать уведомления об отключении. При этом Google Workspace и…
Там Hugging Face только что выпустили набор Deep Learning Containers для билда ИИ-моделей в Google Cloud

В образах уже настроены конфиги + не будет проблем с зависимостями + все контейнеры оптимизированы под окружения в зависимости от задач: под GPU для обучения, под CPU/GPU для инференса и даже для получения эмбеддингов.

Уже есть куча кейс-примеров в репозитории. А все доступные контейнеры лежат тут. Все опенсорс, и разработчики обещают активно поддерживать и развивать проект.

Напоминаем, что Google Cloud в России продолжает работать и отключать его не собираются, так что налетайте 🐳
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48🐳14🤗114🎄11
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Илон Маск выкладывает в Твиттере видео с того самого суперкластера Cortex, на котором обещает обучить «самый мощный ИИ в мире» АКА Grok-3. Кластер находится в штаб-квартире Tesla в Остине.

Как вам?
148🤯37👍1612🔥9
КолЛеГи, мы?
😁17026💯5💘2
This media is not supported in your browser
VIEW IN TELEGRAM
Дональд Трамп: «Никто не знает об ИИ больше, чем Илон Маск, и я был бы открыт для консультаций Илона по вопросам ИИ, если бы был президентом»

Кстати, Илон тоже поддержал новый Калифорнийский проект по регуляции ИИ (как и Виталик Бутерин).

Альтман курит в сторонке
😁6647🤯102🤨2👍1
Data Secrets
Тем временем противостояние века продолжается. Да, эта война растянулась на 4 дня, и еще не закончилась. Апогеем стало заявление Илона Маска о том, что в его self-driving Tesla не используются CNN (которые изобрел Лекун) 🤡 Соболезнования команде Tesla,…
Давайте также вспомним, что Илон Маск AKA лучший знаток ИИ по мнению Трампа – это тот человек, который думает, что в его self-driving автомобилях Tesla не используются CNN

P.S. Спасибо нашим комментаторам за напоминание
6😁11915👍7🤯2💘2
Anthropic пару недель назад незаметно выложили на GitHub интерактивный учебник по промптингу в виде ipynb ноутбуков

Особенно полезно для разрабов, которые работают с API LLM: курс разбит на 9 глав с теорией, примерами, упражнениями и ответами на них. Поможет освоить базовые техники, познакомит с такими фичами, как Prompt caching и отдельно научит оптимизировать ответы для кодинга.

Кстати, вот вам интересный факт
: Anthropic – единственная компания, которая опубликовала в общий доступ свои системные промпты (то есть те промпты с базовыми настройками, которые зашиваются разработчиками в модель как дефолтные). Посмотреть на них можно тут.
👍56🔥2015
Data Secrets
А вы тоже часто видите новости про «в ходе опроса айтишников выяснилось, что каждый третий…», но сами никогда в таких опросах не участвовали? 😑 Если да, этот пост для вас. Наши друзья из Центра научной коммуникации ИТМО проводят анализ профессионального…
Результаты исследования ML-сообщества от VK и ИТМО

Помните, мы просили вас поучаствовать в исследовании о состоянии индустрии, лидерах рынка и в целом ML-карьере в России? Так вот теперь мы делимся с вами его результатами!

Откуда ML-щики (то есть вы) берут информацию и какие источники любят? Как выбирают компанию для работы? Кем себя видят в будущем?

Все самые интересные и неожиданные результаты – в карточках. Спойлер: мы попали в топ-4 самых любимых ML-каналов 😊
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
52🔥22🤯7👍4👌2🍾1
⚡️ Зацените: за последние 18 месяцев стоимость за 2М токенов (input+output) упала в 240 раз! В начале 23 года она равнялась 180 долларам, а сейчас в среднем приближается к 75 центам.
Please open Telegram to view this post
VIEW IN TELEGRAM
50🔥72👍76🤪1
Ничего необычного, просто Linkedin резюме Дженсена Хуанга, который сначала 5 лет работал посудомойщиком и официантом в закусочной, а потом…
🔥1584715😁6👍4🙈2
У Google три новые экспериментальные модели!

В компании представили:

➡️новую уменьшенную Gemini 1.5 Flash-8B
➡️более мощную Gemini 1.5 Pro
➡️и улучшенную Gemini 1.5 Flash

Все модели уже появились на Арене. Новый Gemini-1.5-Flash совершил огромный скачок с 23-го на 6-е место! Gemini-1.5-Pro ​​тоже не отстает и демонстрирует мощные улучшения в коде и математике. А новая мини-модель Gemini-1.5 Flash- 8b превосходит gemma-2-9b и догоняет llama-3-70b.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2412
This media is not supported in your browser
VIEW IN TELEGRAM
Почувствовали энергию AGI, исходящую от этого видео? 🤣

А серьезно, почему модели настолько трудно просто переписать слово? Ответ: все из-за токенизации. По этой же причине, например, GPT не может разобрать, сколько букв r в слове strawberry и очень плохо считает.

Полное объяснения того, почему так происходит и какие еще проблемы порождает токенизация можно найти в этом нашем посте.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁63🔥12