🎥 How to encode categorical features for GBDT | Ryuji Sakata | Kaggle Days
👁 1 раз ⏳ 1668 сек.
👁 1 раз ⏳ 1668 сек.
Kaggle Days Tokyo took place on December 11-12, 2019 at Mori Tower, Roppongi Hills, Tokyo.
This was the 6th edition of our signature two-day event featuring Master and Grandmaster speakers, and a live, all-day Kaggle Competition.
This edition was sponsored by Google Cloud (GCP), Data Science Dojo, and DeNA.
Kaggle Days is produced by LogicAI and Kaggle.
About LogicAI:
LogicAI is a boutique Data Science consultancy company owned by Kaggle fans and Grandmasters. As a global company, they do custom end-to-Vk
How to encode categorical features for GBDT | Ryuji Sakata | Kaggle Days
Kaggle Days Tokyo took place on December 11-12, 2019 at Mori Tower, Roppongi Hills, Tokyo.
This was the 6th edition of our signature two-day event featuring Master and Grandmaster speakers, and a live, all-day Kaggle Competition.
This edition was sponsored…
This was the 6th edition of our signature two-day event featuring Master and Grandmaster speakers, and a live, all-day Kaggle Competition.
This edition was sponsored…
🎥 Knowledge Distillation for BERT
👁 2 раз ⏳ 3857 сек.
👁 2 раз ⏳ 3857 сек.
Современные языковые модели становятся всё глубже и сложнее, в них насчитываются миллионы параметров (BERT — 340, GPT-2 — 1500, ELMo — 94), что плохо сказывается на времени и стоимости обучения, а также на внедрение их в смартфоны, edge-устройства и т.п. Поэтому возникают задачи по оптимизации таких моделей, с целью более широкого их применения. С другой стороны, есть работы, которые утверждают, что BERT содержит излишне много параметров, а значит его можно уменьшить без потери качества.
На этом семинаре мVk
Knowledge Distillation for BERT
Современные языковые модели становятся всё глубже и сложнее, в них насчитываются миллионы параметров (BERT — 340, GPT-2 — 1500, ELMo — 94), что плохо сказывается на времени и стоимости обучения, а также на внедрение их в смартфоны, edge-устройства и т.п.…
10 Best and Free Machine Learning Courses, Online
https://www.kdnuggets.com/2019/12/best-free-machine-learning-courses-online.html
🔗 10 Best and Free Machine Learning Courses, Online - KDnuggets
Getting ready to leap into the world of Data Science? Consider these top machine learning courses curated by experts to help you learn and thrive in this exciting field.
https://www.kdnuggets.com/2019/12/best-free-machine-learning-courses-online.html
🔗 10 Best and Free Machine Learning Courses, Online - KDnuggets
Getting ready to leap into the world of Data Science? Consider these top machine learning courses curated by experts to help you learn and thrive in this exciting field.
KDnuggets
10 Best and Free Machine Learning Courses, Online
Getting ready to leap into the world of Data Science? Consider these top machine learning courses curated by experts to help you learn and thrive in this exciting field.
Опенсорс приключения киберэлектроника
С 2018 я работаю над пет проектом, системой распознания нервных импульсов.
Началось все с того, что в 2017 я чуть не лишился руки. Несколько месяцев было неясно, с каким количеством рук я выйду из ситуации. В итоге получилось две. В результате этого нелегкого процесса бесконечных операций, я, будучи программистом и вообще человеком любопытствующим, сильно увлекся темой протезов, а именно управления ими. Так как рынок протезов очень мал, развивается он слабо относительно ПК или смартфонов. Особенно плохо дело с протезами руки, которые фактически не позволяют выполнять сложные манипуляции, даже если имеют пять пальцев и напоминают руку терминатора.
Я подумал, могу ли я что-то сделать для ускорения прогресса подобных систем…
🔗 Опенсорс приключения киберэлектроника
С 2018 я работаю над пет проектом, системой распознания нервных импульсов. Началось все с того, что в 2017 я чуть не лишился руки. Несколько месяцев было неясно...
С 2018 я работаю над пет проектом, системой распознания нервных импульсов.
Началось все с того, что в 2017 я чуть не лишился руки. Несколько месяцев было неясно, с каким количеством рук я выйду из ситуации. В итоге получилось две. В результате этого нелегкого процесса бесконечных операций, я, будучи программистом и вообще человеком любопытствующим, сильно увлекся темой протезов, а именно управления ими. Так как рынок протезов очень мал, развивается он слабо относительно ПК или смартфонов. Особенно плохо дело с протезами руки, которые фактически не позволяют выполнять сложные манипуляции, даже если имеют пять пальцев и напоминают руку терминатора.
Я подумал, могу ли я что-то сделать для ускорения прогресса подобных систем…
🔗 Опенсорс приключения киберэлектроника
С 2018 я работаю над пет проектом, системой распознания нервных импульсов. Началось все с того, что в 2017 я чуть не лишился руки. Несколько месяцев было неясно...
Хабр
Опенсорс приключения киберэлектроника
С 2018 я работаю над пет проектом, системой распознания нервных импульсов. Началось все с того, что в 2017 я чуть не лишился руки. Несколько месяцев было неясно, с каким количеством рук я выйду из...
Hydra — A fresh look at configuration for machine learning projects
🔗 Hydra — A fresh look at configuration for machine learning projects
This post is authored by Omry Yadan, Software Engineer at Facebook AI who created Hydra.
🔗 Hydra — A fresh look at configuration for machine learning projects
This post is authored by Omry Yadan, Software Engineer at Facebook AI who created Hydra.
Medium
Hydra — A fresh look at configuration for machine learning projects
This post is authored by Omry Yadan, Software Engineer at Facebook AI who created Hydra.
Туториал по Uplift моделированию. Часть 2
В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали особенности сбора данных для обучения модели и несколько базовых алгоритмов. Однако эти подходы не позволяли оптимизировать uplift напрямую. Поэтому в этой части разберем более сложные, но не менее интересные подходы.
🔗 Туториал по Uplift моделированию. Часть 2
В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали...
В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали особенности сбора данных для обучения модели и несколько базовых алгоритмов. Однако эти подходы не позволяли оптимизировать uplift напрямую. Поэтому в этой части разберем более сложные, но не менее интересные подходы.
🔗 Туториал по Uplift моделированию. Часть 2
В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали...
Хабр
Туториал по Uplift моделированию. Часть 2
В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали особенности сбора данных для обучения...
Sharing data visualisations in VirtualBox to keep IT departments happy
🔗 Sharing data visualisations in VirtualBox to keep IT departments happy
How to share a Jupyter presentation as a standalone VirtualBox image when your client isn’t able to work with containers or the cloud
🔗 Sharing data visualisations in VirtualBox to keep IT departments happy
How to share a Jupyter presentation as a standalone VirtualBox image when your client isn’t able to work with containers or the cloud
Medium
Sharing data visualisations in VirtualBox to keep IT departments happy
How to share a Jupyter presentation as a standalone VirtualBox image when your client isn’t able to work with containers or the cloud
Simulating Breaking Bread And Dynamic Fractures 🍞
🔗 Simulating Breaking Bread And Dynamic Fractures 🍞
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers 📝 The paper "CD-MPM: Continuum Damage Material Point Methods for Dynamic Fracture Animation" and its source code is available here: - https://www.seas.upenn.edu/~cffjiang/research/wolper2019fracture/wolper2019fracture.pdf - https://github.com/squarefk/ziran2019 ❤️ Watch these videos in early access on our Patreon page or join us here on YouTube: - https://www.patreon.com/TwoMinutePapers - https://www.youtube.com/chan
🔗 Simulating Breaking Bread And Dynamic Fractures 🍞
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers 📝 The paper "CD-MPM: Continuum Damage Material Point Methods for Dynamic Fracture Animation" and its source code is available here: - https://www.seas.upenn.edu/~cffjiang/research/wolper2019fracture/wolper2019fracture.pdf - https://github.com/squarefk/ziran2019 ❤️ Watch these videos in early access on our Patreon page or join us here on YouTube: - https://www.patreon.com/TwoMinutePapers - https://www.youtube.com/chan
YouTube
Simulating Breaking Bread 🍞
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "CD-MPM: Continuum Damage Material Point Methods for Dynamic Fracture Animation" and its source code is available here:
- https://www.seas.upenn.edu/~cf…
📝 The paper "CD-MPM: Continuum Damage Material Point Methods for Dynamic Fracture Animation" and its source code is available here:
- https://www.seas.upenn.edu/~cf…
🎥 RAPIDS: ускоряем Pandas и scikit-learn на GPU, Павел Клеменков
👁 2 раз ⏳ 2079 сек.
👁 2 раз ⏳ 2079 сек.
Все мы знаем, что наш любимый Pandas исключительно однопоточный, а модели из scikit-learn часто учатся не очень быстро даже в несколько процессов. Поэтому в докладе я расскажу о проекте RAPIDS - наборе библиотек для анализа данных и построения предиктивных моделей с использованием NVIDIA GPU. В докладе я предложу подискутировать о том, что закон Мура больше не выполняется, рассмотрю принципы работы архитектуры CUDA. Разберу библиотеки cuDF и cuML, а также постараюсь предельно честно рассказать о том, ждатьVk
RAPIDS: ускоряем Pandas и scikit-learn на GPU, Павел Клеменков
Все мы знаем, что наш любимый Pandas исключительно однопоточный, а модели из scikit-learn часто учатся не очень быстро даже в несколько процессов. Поэтому в докладе я расскажу о проекте RAPIDS - наборе библиотек для анализа данных и построения предиктивных…
Understanding Latent Space in Machine Learning
🔗 Understanding Latent Space in Machine Learning
Learn a fundamental, yet often ‘hidden,’ concept of deep learning
🔗 Understanding Latent Space in Machine Learning
Learn a fundamental, yet often ‘hidden,’ concept of deep learning
Medium
Understanding Latent Space in Machine Learning
Learn a fundamental, yet often ‘hidden,’ concept of deep learning
Cyber Security + AI: defined, explained and explored
🔗 Cyber Security + AI: defined, explained and explored
What’s lacking and what’s ahead.
🔗 Cyber Security + AI: defined, explained and explored
What’s lacking and what’s ahead.
Medium
CyberSecurity + AI: defined, explained and explored
What’s lacking and what’s ahead.
Building an End-to-End Defect Classifier Application for Printed Circuit Boards
🔗 Building an End-to-End Defect Classifier Application for Printed Circuit Boards
Detecting, Extracting and Classifying Circuit Board Defects using Image Processing and Deep Learning
🔗 Building an End-to-End Defect Classifier Application for Printed Circuit Boards
Detecting, Extracting and Classifying Circuit Board Defects using Image Processing and Deep Learning
Medium
Building an End-to-End Defect Classifier Application for Printed Circuit Boards
Detecting, Extracting and Classifying Circuit Board Defects using Image Processing and Deep Learning
Игра настоящих программистов!
https://cloud.mail.ru/public/2EX5/5ku2GDdah
🔗 Папка из Облака Mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
https://cloud.mail.ru/public/2EX5/5ku2GDdah
🔗 Папка из Облака Mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
Облако Mail.ru
Папка из Облака Mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
How to Configure XGBoost for Imbalanced Classification
🔗 How to Configure XGBoost for Imbalanced Classification
The XGBoost algorithm is effective for a wide range of regression and classification predictive modeling problems. It is an efficient implementation of the stochastic gradient boosting algorithm and offers a range of hyperparameters that give fine-grained control over the model training procedure. Although the algorithm performs well in general, even on imbalanced classification datasets, it …
🔗 How to Configure XGBoost for Imbalanced Classification
The XGBoost algorithm is effective for a wide range of regression and classification predictive modeling problems. It is an efficient implementation of the stochastic gradient boosting algorithm and offers a range of hyperparameters that give fine-grained control over the model training procedure. Although the algorithm performs well in general, even on imbalanced classification datasets, it …
Torch-Struct: Deep Structured Prediction Library
Code: https://github.com/harvardnlp/pytorch-struct
Paper: https://arxiv.org/abs/2002.00876v1
Fast, general, and tested differentiable structured prediction in PyTorch: http://nlp.seas.harvard.edu/pytorch-struct/
Наш телеграм канал - tglink.me/ai_machinelearning_big_data
🔗 harvardnlp/pytorch-struct
Fast, general, and tested differentiable structured prediction in PyTorch - harvardnlp/pytorch-struct
Code: https://github.com/harvardnlp/pytorch-struct
Paper: https://arxiv.org/abs/2002.00876v1
Fast, general, and tested differentiable structured prediction in PyTorch: http://nlp.seas.harvard.edu/pytorch-struct/
Наш телеграм канал - tglink.me/ai_machinelearning_big_data
🔗 harvardnlp/pytorch-struct
Fast, general, and tested differentiable structured prediction in PyTorch - harvardnlp/pytorch-struct
GitHub
GitHub - harvardnlp/pytorch-struct: Fast, general, and tested differentiable structured prediction in PyTorch
Fast, general, and tested differentiable structured prediction in PyTorch - harvardnlp/pytorch-struct
Python Gateway в InterSystems IRIS
Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект
позволяет оркестрировать любые алгоритмы машинного обучения, созданные на языке Python (основная среда для многих Data Scientists), использовать многочисленные готовые библиотеки для быстрого создания адаптивных, роботизированных аналитических AI/ML-решений на платформе InterSystems IRIS. В этой статье я покажу как InterSystems IRIS может оркестровать процессы на языке Python, эффективно осуществлять двустороннюю передачу данных и создавать интеллектуальные бизнес-процессы.
🔗 Python Gateway в InterSystems IRIS
Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект позволяет оркестрировать лю...
Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект
позволяет оркестрировать любые алгоритмы машинного обучения, созданные на языке Python (основная среда для многих Data Scientists), использовать многочисленные готовые библиотеки для быстрого создания адаптивных, роботизированных аналитических AI/ML-решений на платформе InterSystems IRIS. В этой статье я покажу как InterSystems IRIS может оркестровать процессы на языке Python, эффективно осуществлять двустороннюю передачу данных и создавать интеллектуальные бизнес-процессы.
🔗 Python Gateway в InterSystems IRIS
Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект позволяет оркестрировать лю...
Хабр
Python Gateway в InterSystems IRIS
Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект позволяет оркестрировать любые алгоритмы машинного обучения,...
Искусственный интеллект учится парковаться.
https://youtu.be/VMp6pq6_QjI
🔗 AI Learns to Park - Deep Reinforcement Learning
An AI learns to park a car in a parking lot in a 3D physics simulation. The simulation was implemented using Unity's ML-Agents framework (https://unity3d.com/machine-learning). The AI consists of a deep Neural Network with 3 hidden layers of 128 neurons each. It is trained with the Proximal Policy Optimization (PPO) algorithm, which is a Reinforcement Learning approach.
Basically, the input of the Neural Network are the readings of eight depth sensors, the car's current speed and position, as well as its r
https://youtu.be/VMp6pq6_QjI
🔗 AI Learns to Park - Deep Reinforcement Learning
An AI learns to park a car in a parking lot in a 3D physics simulation. The simulation was implemented using Unity's ML-Agents framework (https://unity3d.com/machine-learning). The AI consists of a deep Neural Network with 3 hidden layers of 128 neurons each. It is trained with the Proximal Policy Optimization (PPO) algorithm, which is a Reinforcement Learning approach.
Basically, the input of the Neural Network are the readings of eight depth sensors, the car's current speed and position, as well as its r
YouTube
AI Learns to Park - Deep Reinforcement Learning
An AI learns to park a car in a parking lot in a 3D physics simulation. The simulation was implemented using Unity's ML-Agents framework (https://unity3d.com/machine-learning). The AI consists of a deep Neural Network with 3 hidden layers of 128 neurons each.…
50+ free Datasets for Data Science Projects - Journey of Analytics
🔗 50+ free Datasets for Data Science Projects - Journey of Analytics
[Updated as on Jan 31, 2020] There is no doubt that having a project portfolio is one of the best ways to master Data Science whether you aspire to be a data analyst, machine learning expert or data visualization ninja! In fact, students and job seekers who showcase their skills with a unique portfolio find …
🔗 50+ free Datasets for Data Science Projects - Journey of Analytics
[Updated as on Jan 31, 2020] There is no doubt that having a project portfolio is one of the best ways to master Data Science whether you aspire to be a data analyst, machine learning expert or data visualization ninja! In fact, students and job seekers who showcase their skills with a unique portfolio find …
Journey of Analytics
50+ free Datasets for Data Science Projects - Journey of Analytics
[Updated as on Jan 31, 2020] There is no doubt that having a project portfolio is one of the best ways to master Data Science whether you aspire to be a data analyst, machine learning expert or data visualization ninja! In fact, students and job seekers who…
Теория графов в машинном обучении для самых маленьких
Сложность представления данных для глубокого обучения растет с каждым днем. Нейронные сети на основе данных в виде графа (Graph Neural Network, GNN) стали одним из прорывов последних лет. Но почему именно графы набирают все большую популярность в машинном обучении?
Конечной целью моего повествования является общее представление графов в приемах машинного обучения. Статья не претендует на научную работу, которая в полной мере описывает всю мощь представления графов, а лишь знакомит читателя с этим удивительным и сложным миром. Публикация отлично подойдет, как для закаленных в боях профессионалов, которые еще не знакомы с представлением графов в глубоком обучении, так и для новичков в этой сфере.
🔗 Теория графов в машинном обучении для самых маленьких
Сложность представления данных для глубокого обучения растет с каждым днем. Нейронные сети на основе данных в виде графа (Graph Neural Network, GNN) стали одним...
Сложность представления данных для глубокого обучения растет с каждым днем. Нейронные сети на основе данных в виде графа (Graph Neural Network, GNN) стали одним из прорывов последних лет. Но почему именно графы набирают все большую популярность в машинном обучении?
Конечной целью моего повествования является общее представление графов в приемах машинного обучения. Статья не претендует на научную работу, которая в полной мере описывает всю мощь представления графов, а лишь знакомит читателя с этим удивительным и сложным миром. Публикация отлично подойдет, как для закаленных в боях профессионалов, которые еще не знакомы с представлением графов в глубоком обучении, так и для новичков в этой сфере.
🔗 Теория графов в машинном обучении для самых маленьких
Сложность представления данных для глубокого обучения растет с каждым днем. Нейронные сети на основе данных в виде графа (Graph Neural Network, GNN) стали одним...
Хабр
Теория графов в машинном обучении для самых маленьких
Сложность представления данных для глубокого обучения растет с каждым днем. Нейронные сети на основе данных в виде графа (Graph Neural Network, GNN ) стали одним из прорывов последних лет. Но почему...
Transition from Mechanical Engineer to Machine Learning Engineer (or Data Scientist)
🔗 Transition from Mechanical Engineer to Machine Learning Engineer (or Data Scientist)
A journey story of myself from a world of physical machines to another world that is full of digital ones.
🔗 Transition from Mechanical Engineer to Machine Learning Engineer (or Data Scientist)
A journey story of myself from a world of physical machines to another world that is full of digital ones.
Medium
Transition from Mechanical Engineer to Machine Learning Engineer (or Data Scientist)
A journey story of myself from a world of physical machines to another world that is full of digital ones.
Neural Module Networks for Reasoning over Text
Gupta et al.: https://arxiv.org/abs/1912.04971
Code: https://nitishgupta.github.io/nmn-drop/
#NeuralNetworks #Reasoning #SymbolicAI
🔗 Neural Module Networks for Reasoning over Text
Neural Module Network for Reasoning over Text, ICLR 2020
Gupta et al.: https://arxiv.org/abs/1912.04971
Code: https://nitishgupta.github.io/nmn-drop/
#NeuralNetworks #Reasoning #SymbolicAI
🔗 Neural Module Networks for Reasoning over Text
Neural Module Network for Reasoning over Text, ICLR 2020
nmn-drop
Neural Module Networks for Reasoning over Text
Neural Module Network for Reasoning over Text, ICLR 2020