Scikit-learn

Scikit-learn

Библиотека для машинного обучения
Простой и эффективный инструмент для предиктивного анализа данных
Основанный на NumPy, SciPy, и matplotlib
BSD лицензия

Платформы: Кроссплатформенность

Версии: Cloud/On-Premise

Применение

Классификация: определение к какой категории принадлежит объект.


Применение: выявление спама, распознавание изображений

Регрессия: прогнозирование атрибута с непрерывным значением связанного с объектом.


Применение: ответ на применение лекарство, прогнозирование оттока клиентов.

Кластеризация: автоматическая группировка похожих объектов в наборы.


Применение: сегментация клиентов, группировка экспериментальных результатов

Понижение размерности: снижение числа случайных переменных для анализа.


Применение: визуализация, увеличение эффективности

Выбор модели: сравнение, валидация и выбор параметром и моделей.


Применение: улучшение точности через настройку параметров

Препроцессинг: извлечение признаков и нормализация


Применение: преобразование входных данных, таких как текста, для применения алгоритмов машинного обучения

Преимущества

Scikit-learn в основном написан на Python и широко использует NumPy для высокопроизводительной линейной алгебры и операций с массивами. Кроме того, некоторые основные алгоритмы написаны на Cython для повышения производительности. Машины опорных векторов реализуются оболочкой Cython вокруг LIBSVM ; логистическая регрессия и машины векторов линейной поддержки с помощью аналогичной оболочки для LIBLINEAR .

В таких случаях расширение этих методов с помощью Python может оказаться невозможным.
Scikit-learn хорошо интегрируется со многими другими библиотеками Python, такими как Matplotlib и plotly для построения графиков, NumPy для векторизации массивов, фреймы данных Pandas , SciPy и многие другие.