Курс призначений для вивчення основ інтелектуального аналізу даних, передбачає застосування сучасних інструментальних засобів аналізу  даних для вирішення  задач  класифікації,  регресії, пошуку асоціацій  та  послідовності (послідовної асоціації)  процесів  в  реальному  часі,  які відбуваються на об’єктах дослідження.

Обговорюються відмінності Data Mining від класичних статистичних методів аналізу й OLAP-систем. Описується сфера застосування Data Mining. Докладно розглядаються методи, інструментальні засоби та застосування Data Mining в сучасних програмних продуктах для різноманітних сфер діяльності. Вивчається бібліотека мови програмування Python Scikit-Learn.

На практичних та лабораторних заняттях за допомогою засобів бібліотеки Scikit-Learn вирішуються задачі класифікації, регресії та прогнозування на реальних відкритих наборах даних з таких джерел, як Kaggle, UCI Machine Learning Repository, VisualData, Amazon, Google’s Datasets Search Engine, Computer Vision Datasets, Public Government Datasets for Machine Learning.