Открытая программная библиотека, разработанная компанией Яндекс и реализующая уникальный патентованный алгоритм построения моделей машинного обучения, использующий одну из оригинальных схем градиентного бустинга. Основное API для работы с библиотекой реализовано для языка Python, также существует реализация для языка программирования R.
18 июля 2017 года компания Яндекс выложила библиотеку с алгоритмом CatBoost в открытый доступ с открытой лицензией Apache 2.0, которая является продолжением и развитием проекта Яндекса — Матрикснет.
Клиенты: Европейский центр ядерных исследований (ЦЕРН) , Интернет-сервисы Яндекса: Дзен, погода, лента рекомендаций.
Сайт проекта
Платформы: Кроссплатформенность
Улучшение результатов поисковой системы Яндекс
Ранжирования персональной ленты рекомендаций — например в Яндекс.Дзен, для расчёта прогноза погоды и в других интернет-сервисах компании «Яндекс».
Решениях для промышленности
Используется для оптимизации расхода сырья и предсказания дефектов при производстве.
Европейский центр ядерных исследований (ЦЕРН)
При исследованиях на Большом адронном коллайдере (БАК) для объединения информации с различных частей детектора LHCb в максимально точное, агрегированное знание о частице. Используя для комбинирования данных CatBoost, учёным удалось добиться улучшения качественных характеристик финального решения, где результаты CatBoost оказались лучше результатов, получаемых с использованием других методов.
Сравнивая CatBoost с подобными системами машинного обучения компаний Google (TensorFlow) и Microsoft (LightGBM), можно отметить, что Google TensorFlow решает другой класс задач, эффективно анализируя однородные данные — например изображения.
CatBoost работает с данными разной природы и может быть использован в связке с TensorFlow и другими алгоритмами машинного обучения в зависимости от конкретных задач. У Microsoft LightGBM российская разработка выигрывает по качеству, что демонстрирует таблица тестов с общепринятыми в машинном обучении сравнениями.