Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена об

-17%

Spark в действии

Жан-Жорж Перрен

Описание и характеристики

Тип обложки Твёрдый переплёт
Кол-во стр. 636
Вес 1080 г
Год издания 2020
Издательство ДМК Пресс
Серия Библиотека студента
Автор Жан-Жорж Перрен
Переводчик Снастин А. В.
Размер 3.7x17x24.2
ID товара 2833146
ISBN 978-5-9706-0879-1, 978-5-97060-879-1