CatBoost

Открытая программная библиотека, разработанная компанией Яндекс и реализующая уникальный патентованный алгоритм построения моделей машинного обучения, использующий одну из оригинальных схем градиентного бустинга. Основное API для работы с библиотекой реализовано для языка Python, также существует реализация для языка программирования R.

18 июля 2017 года компания Яндекс выложила библиотеку с алгоритмом CatBoost в открытый доступ с открытой лицензией Apache 2.0, которая является продолжением и развитием проекта Яндекса — Матрикснет.

Клиенты: Европейский центр ядерных исследований (ЦЕРН) , Интернет-сервисы Яндекса: Дзен, погода, лента рекомендаций.

...

Сайт проекта

Платформы: Кроссплатформенность

Кейсы

Улучшение результатов поисковой системы Яндекс

Ранжирования персональной ленты рекомендаций — например в Яндекс.Дзен, для расчёта прогноза погоды и в других интернет-сервисах компании «Яндекс».

Решениях для промышленности

Используется для оптимизации расхода сырья и предсказания дефектов при производстве.

Европейский центр ядерных исследований (ЦЕРН)

При исследованиях на Большом адронном коллайдере (БАК) для объединения информации с различных частей детектора LHCb в максимально точное, агрегированное знание о частице. Используя для комбинирования данных CatBoost, учёным удалось добиться улучшения качественных характеристик финального решения, где результаты CatBoost оказались лучше результатов, получаемых с использованием других методов.

Преимущества

Сравнивая CatBoost с подобными системами машинного обучения компаний Google (TensorFlow) и Microsoft (LightGBM), можно отметить, что Google TensorFlow решает другой класс задач, эффективно анализируя однородные данные — например изображения.

CatBoost работает с данными разной природы и может быть использован в связке с TensorFlow и другими алгоритмами машинного обучения в зависимости от конкретных задач. У Microsoft LightGBM российская разработка выигрывает по качеству, что демонстрирует таблица тестов с общепринятыми в машинном обучении сравнениями.