Библиотека для машинного обучения.
Простой и эффективный инструмент для предиктивного анализа данных.
Основанный на NumPy, SciPy, и matplotlib.
BSD лицензия.
Сайт проекта
Платформы: Кроссплатформенность
Версии: Cloud/On-Premise
Классификация: определение к какой категории принадлежит объект.
Применение: выявление спама, распознавание изображений
Регрессия: прогнозирование атрибута с непрерывным значением связанного с объектом.
Применение: ответ на применение лекарство, прогнозирование оттока клиентов.
Кластеризация: автоматическая группировка похожих объектов в наборы.
Применение: сегментация клиентов, группировка экспериментальных результатов
Понижение размерности: снижение числа случайных переменных для анализа.
Применение: визуализация, увеличение эффективности
Выбор модели: сравнение, валидация и выбор параметром и моделей.
Применение: улучшение точности через настройку параметров
Препроцессинг: извлечение признаков и нормализация
Применение: преобразование входных данных, таких как текста, для применения алгоритмов машинного обучения
Scikit-learn в основном написан на Python и широко использует NumPy для высокопроизводительной линейной алгебры и операций с массивами. Кроме того, некоторые основные алгоритмы написаны на Cython для повышения производительности. Машины опорных векторов реализуются оболочкой Cython вокруг LIBSVM; логистическая регрессия и машины векторов линейной поддержки с помощью аналогичной оболочки для LIBLINEAR.
В таких случаях расширение этих методов с помощью Python может оказаться невозможным.
Scikit-learn хорошо интегрируется со многими другими библиотеками Python, такими как Matplotlib и plotly для построения графиков, NumPy для векторизации массивов, фреймы данных Pandas, SciPy и многие другие.