H2O

Скорость, качество, простота использования и развертывание моделей для различных передовых контролируемых и неконтролируемых алгоритмов, таких как Deep Learning, Tree Ensembles и GLRM, делают H2O востребованным API для науки о больших данных.

H2O — это распределенная, быстрая и масштабируемая платформа машинного обучения и прогнозной аналитики с открытым исходным кодом в оперативной памяти, которая позволяет создавать модели машинного обучения на основе больших данных и обеспечивает простую производственную реализацию этих моделей в корпоративной среде.

H2O находится под лицензией Apache License версии 2.0.

...

Сайт компании

Платформы: Windows 7 или новее. OS X 10.9 или новее Ubuntu 12.04, RHEL / CentOS 6 или новее

Версии: Cloud/On-Premise

Преимущества

Основной код H2O написан на Java. Внутри H2O хранилище распределенных ключей / значений используется для доступа и ссылок на данные, модели, объекты и т. д. на всех узлах и машинах.

Алгоритмы реализованы поверх распределенной инфраструктуры Map / Reduce H2O и используют структуру Java Fork / Join для многопоточности. Данные считываются параллельно, распределяются по кластеру и сохраняются в памяти в столбчатом формате в сжатом виде. Парсер данных H2O имеет встроенный интеллект, позволяющий угадывать схему входящего набора данных, и поддерживает прием данных из нескольких источников в различных форматах.

REST API H2O позволяет получить доступ ко всем возможностям H2O из внешней программы или сценария через JSON через HTTP. Rest API используется веб-интерфейсом H2O (Flow UI), привязкой R (H2O-R) и привязкой Python (H2O-Python).