DATApedia | Data science
3.29K subscribers
195 photos
91 videos
2 files
833 links
Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи.

Сотрудничество: @Seyfme
Download Telegram
DataHub: как делиться структурированными данными и получать за них донаты?

В этой статье основатель платформы DataHub рассказывает о том, как создать FREE и SPONSORED репозитории данных, а так же в чем их отличия.

Перейти к статье | DATApedia
👍4🔥2
Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

ChatGPT генерирует разнообразный и привлекательный для человека текст. Но что делает текст «хорошим»? В этой статье разобран алгоритм, который позволяет согласовать модель машинного обучения со сложными человеческими ценностями.

Перейти к статье | DATApedia | #DS_AI
🤩6🔥2
​​EasyPortrait — портретная сегментация и анализ лиц

В данной статье рассказывается о новом наборе данных EasyPortrait, описан процесс его создания от идеи до разметки, и представлены обученные на нем нейронные сети.

Перейти к статье | DATApedia | #DS_AI
👍1
​​DataHub: веб-песочница для тех, кто изучает SQL

В этой статье показывается на что способен веб-редактор MySQL хранилища и почему это отличный инструмент для работы тем, кто изучает SQL.

Перейти к статье | DATApedia
👍2
😁12👏2
Самостоятельное обучение стало проще с Notion AI. Онлайн школы скоро вымрут? Пример SQL курса

В этой статье показано на простом примере как новичку в IT сфере упростить себе путь осваивания хард скиллов и не платить онлайн школам много денег.

Перейти к статье | DATApedia | #DS_AI
4
​​Лучшие ИИ-инструменты для аннотирования видео в 2023 году

В статье рассматриваются некоторые из лучших инструментов аннотирования видео на основе ИИ.

Перейти к статье | DATApedia | #DS_AI
👍2
Алоха, коллеги! Запускаем рубрику #fromInterviewWithLove!

Сегодня будет дана задача по SQL для начинающих специалистов.

Задача: В базе данных хранятся данные о продажах продуктов в разных магазинах. Необходимо вывести список магазинов, в которых были проданы все виды товаров. Таблица sales содержит следующие поля:
- id - уникальный идентификатор продажи;
- store - название магазина;
- product - название продукта.


Решение SQL запросом:
SELECT store
FROM sales
GROUP BY store
HAVING COUNT(DISTINCT product) = (SELECT COUNT(DISTINCT product) FROM sales);

Данный запрос группирует данные по названию магазина и находит количество уникальных продуктов, проданных в каждом магазине. Затем он сравнивает это количество с общим числом уникальных продуктов в таблице sales. Если количество уникальных продуктов в магазине равно общему количеству уникальных продуктов в таблице, значит все продукты были проданы в данном магазине. Результат запроса - список магазинов, в которых были проданы все виды товаров.


SQLpedia
👍64🔥3😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Любой важный созвон на удаленке проходит именно так
😁26🔥3🥰2
Массивный курс по управлению данными и обзор новинок от NVIDIA. Дайджест полезных текстов про ML и дата-аналитику

В этой статье — смесь фундаментальных трудов и более «популярных» статей на тему ML, искусственного интеллекта и дата-аналитики. Думаю каждый найдет здесь для себя что-то интересное.

Перейти к статье | DATApedia
3👍3
​​Как мы разрабатывали алгоритм для анализа уникальных посетителей

В этой статье рассказано о решении для анализа уникальных посетителей. Описаны недостатки существующих на рынке решений и рассказано, почему надо остановиться именно на видеоаналитике

Перейти к статье | DATApedia
5
😁21
​​Как структурировать проекты машинного обучения с помощью GitHub и VS Code: полная инструкция с настройками и шаблонами

Статья о том, как организовать файлы в проектах машинного обучения, используя VS Code.

Перейти к статье | DATApedia
👍1
​​Откуда Карты знают, когда приедет автобус

В этой статье рассказывается что у «Транспорта» под капотом, какие алгоритмы отвечают за то, чтобы автобусы появлялись на карте, двигались по ней плавно и реалистично, а прогноз был максимально точным.

Перейти к статье | DATApedia
👍6🔥4
​​PromptGPT: оптимизируем промт для GPT-4

Автор статьи написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный. В этой статье автор сначала расскажет как этот тул работает, а потом покажет процесс оптимизации промта

Перейти к статье | DATApedia | #DS_AI
😁6👍3
​​Тварь дрожащая или право имею: как мы лепили виртуального юриста из русскоязычных нейросетей

В статье рассказывается об опыте обучения русскоязычных и зарубежных моделей нейросетей российскому законодательству.

Перейти к статье | DATApedia | #DS_AI
1👍1
🔥13😁12
​​Как построить систему геоаналитики с применением ML

В этой статье рассмотриавются примеры работы сервисов геоаналитики VK Predict. Выясняется, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Перейти к статье | DATApedia
👍2
​​Бустим топ: внедрение ML в ранжирование каталога

В этой статье расскажут, почему задача ранжирования каталога важна для бизнеса, как была построена систему ранжирования каталога на основе ML и переход на нее с эвристик.

Перейти к статье | DATApedia
👍4
​​Особенности прогнозирования продаж и оттока в условиях неопределенности

В этом посте автор опишет свой опыт построения модели прогнозирования продаж конвергентных продуктов (2019-2021), а также прогнозирования оттока мобильных абонентов в 2022 году. Расскажет, как работала модель в относительно стабильный период до 2020-го года, и какие корректировки пришлось внести впоследствии.

Перейти к статье | DATApedia
👍2
​​Slovo и русский жестовый язык

В этой статье рассказывается о непростой задаче распознавания русского жестового языка (РЖЯ) для слабослышащих. Также затронуты основные особенности РЖЯ, и проблемы и сложности самого языка, и процесс его сбора и разметки.

Перейти к статье | DATApedia | #DS_AI
👍3