Курс призначений для вивчення основ інтелектуального аналізу даних, передбачає застосування сучасних інструментальних засобів аналізу даних для вирішення задач класифікації, регресії, пошуку асоціацій та послідовності (послідовної асоціації) процесів в реальному часі, які відбуваються на об’єктах дослідження.
Обговорюються відмінності Data Mining від класичних статистичних методів аналізу й OLAP-систем. Описується сфера застосування Data Mining. Докладно розглядаються методи, інструментальні засоби та застосування Data Mining в сучасних програмних продуктах для різноманітних сфер діяльності. Вивчається бібліотека мови програмування Python Scikit-Learn.
На практичних та лабораторних заняттях за допомогою засобів бібліотеки Scikit-Learn вирішуються задачі класифікації, регресії та прогнозування на реальних відкритих наборах даних з таких джерел, як Kaggle, UCI Machine Learning Repository, VisualData, Amazon, Google’s Datasets Search Engine, Computer Vision Datasets, Public Government Datasets for Machine Learning.