Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Разработчик написал самую быструю библиотеку для преобразования xlsx в csv

Дело было так: понадобилось человеку поработать с excel файлами в Polars (pandas оказался слишком медленным). Вот только Polars умеет читать только csv. Что делать? Написать самому, конечно.

Результаты: либа парня оказалась в 33 раза быстрее, чем xlsx и xlsx2csv. Установить можно отсюда, но пока только под линукс.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38🔥74🌚3😁2
Когда размер (усреднения) имеет значение

Все мы знаем классические метрики классификации вроде recall и f1. Но, если вы зайдете в sklearn, то увидите какие-то странные их вариации: f1-macro, f1-micro, f1-weighted… Знаете ли вы, чем они отличаются? Сейчас разберемся.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥94
Tinder для айтишников прямо в telegram

Мы тут нашей дружной командой сделали telegram-бота для нетворкинга. IDEально подойдет, если:

Хочешь найти крутые знакомства в сфере IT
Ищешь работу: выставляй анкету и получай офферы
Ищешь ментора или партнеров в стартап

Поддержите нас реакцией! А еще ждем от вас фидбэк: @CodeMatesBot
29👍2
Подборка хакатонов и ML-соревнований на ноябрь–декабрь

🌟Всероссийский хакатон по биометрии. Есть задача по разработке системы биометрической верификации, алгоритма защиты от атак предъявления, инструмента обнаружения дипфейков и инструмента для их создания. Призовой фонд: 1 000 000 ₽. Регистрация до 6 ноября.

🌟Турникеты 2.0 от ODS. Небанальная задача: нужно научиться предсказывать, кто вошел в здание по времени и турникету. Регистрация до 15 ноября.

🌟Data Wagon. Прогнозирования спроса на грузовые железнодорожные перевозки и отправления вагонов в ремонт. Призовой фонд: 900 000 ₽. Регистрация до 6 ноября.

🌟AgroCode Data Sience Cup 2023. Четвертый Data Science-чемпионат для студентов, который проводит Россельхозбанк. Призовой фонд: 450 000 ₽. Регистрация до 16 ноября.

🌟Bauman Code Games. Чемпионат по спортивному программированию от МГТУ им. Н.Э. Баумана. 5 часов, 12 задач, максимально эффективный по времени алгоритм. Регистрация до 10 ноября.

🌟HSE Sber ML Hack. Задача от экспертов Сбера, мастер-классы и пицца. Регистрация до 5 ноября.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍195😐1
Решаем проблемы мудрецов

Завтра нас ждет еще один выходной, поэтому сегодня задача простая, нужно только немного пораскинуть мозгами:

Мудрецам А и В выдали по натуральному числу и сказали, что эти числа различаются на 1. "Я не знаю, знаешь ли ты мое число", сказал А, обращаясь к В.
Какое число у А?


Ваши варианты – в комментарии

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🗿1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁105
Разбор вчерашней логической задачки про мудрецов

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥63🗿3
Отец искусственного интеллекта

Совсем недавно исполнилось 96 лет со дня рождения Джона МакКарти. Он был великим математиком, новатором и одним из первых задумался об искусственном интеллекте. Сегодня мы предлагаем нашим подписчикам вдохновиться его незаурядной историей.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥137🤯2
Вчера прошел DevDay от OpenAI

Было представлено много чего нового и интересного. Рассказыем вкратце:

🌟Главным обновлением стала новая модель GPT-4 Turbo. Ее контекст увеличили в 16 раз, теперь он составляет 128К токенов (более 300 страниц книги). Ее можно попросить написать ответ в JSON и указать random seed, чтобы генерация была воспроизводимой. А еще, если раньше модель "знала" все только до 2021 года, то теперь ориентируется аж до апреля 2023.

🌟Обновления в API. Для GPT-4 там появится файнтюнинг. GPT-4 Turbo будет принимать картинки. Завезут DALLE-3 с text-to-speech. Повысили лимиты токенов в минуту. Пообещали программу b2b дообучения моделей под задачу заказчика.

🌟Приятное снижение цен. На GPT-4 Turbo цена уменьшена в 3 раза. На GPT-3.5 прайс тоже понизили.

🌟Разработали новый дизайн и переработали UI. А еще выходит GPT-Store, где можно будет после модерации разместить свою модель.

🌟Выпускают еще одну новую SOTA модель для распознавания голоса whisper v3. В ней будет еще больше языков.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍83😨2