Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена об
Spark в действии
Этот товар закончился
Описание и характеристики
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.
- Тип обложки Твёрдый переплёт
- Количество страниц 636
- Вес, г 1080
- Размер 3.7x17x24.2
- Издательство ДМК Пресс
- Серия Библиотека студента
- Год издания 2020
- Тираж 200
- ID товара 2833146