Yandex Data Proc — сервис для обработки многотерабайтных массивов данных с использованием инструментов с открытым исходным кодом, таких как Apache Spark™, Apache Hadoop®, Apache HBase, Apache Hive, Apache Zeppelin и других сервисов экосистемы Apache®.

Работы по обслуживанию кластеров

Наш блог

Выбор базы данных в Yandex Cloud

14 октября, 2022

Подробнее

Безопасность Yandex Data Platform + Краткий обзор по возможностям доступа

5 октября, 2022

Подробнее

Техническое глубокое сравнение Microsoft Power BI и Yandex DataLens

21 сентября, 2022

Подробнее

Функциональное глубокое сравнение Microsoft Power BI и Yandex DataLens

21 сентября, 2022

Подробнее

Как начать использовать Apache Airflow с ClickHouse?

25 августа, 2022

Подробнее

Почему для Yandex DataLens нужен ClickHouse?

16 августа, 2022

Подробнее

Смотреть все проекты

Преимущества Data Proc

Простота использования

Выберите размер кластера, мощность узлов и набор сервисов, а Data Proc автоматически создаст и настроит кластеры Spark, Hadoop и другие компоненты.

Автоматическое масштабирование

Data Proc использует группы виртуальных машин Instance Groups, чтобы автоматически наращивать или уменьшать вычислительные ресурсы compute-подкластеров на основе показателей загруженности процессоров.

Низкая стоимость

Можно запустить кластер Data Proc, содержащий 10 узлов всего за 18 рублей в час. Еще можно экономить до 70% от стоимости виртуальных машин, выбирая прерываемые виртуальные машины.

Безопасное хранение данных

Data Proc заменяет вышедшие из строя узлы, перераспределяет нагрузку между ними автоматически и перезапускает задачи.

Полный контроль над кластером

Устанавливайте собственные приложения и библиотеки на работающих кластерах без необходимости их перезагружать.

Автоматизация задач

Сэкономьте время на построении ETL-пайплайнов и пайплайнов для обучения и разработки моделей, а также для описания других итерационных задач.

Работы по обслуживанию кластеров

Наш блог

Выбор базы данных в Yandex Cloud

Безопасность Yandex Data Platform + Краткий обзор по возможностям доступа

Техническое глубокое сравнение Microsoft Power BI и Yandex DataLens

Функциональное глубокое сравнение Microsoft Power BI и Yandex DataLens

Как начать использовать Apache Airflow с ClickHouse?

Почему для Yandex DataLens нужен ClickHouse?

Преимущества Data Proc

Простота использования

Автоматическое масштабирование

Низкая стоимость

Безопасное хранение данных

Полный контроль над кластером

Автоматизация задач

Давайте делать крутые проекты вместе!

Оставайтесь с нами!

Оставьте заявку на проект, и наши менеджеры свяжутся с вами