Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены о
- -17%
Расширенная аналитика с PySpark
Купили 206 человек
Описание и характеристики
- Тип обложки Мягкий переплёт
- Кол-во стр. 224
- Вес 300 г
- Год издания 2023
- Издательство BHV-CПб
- Автор Ури Ласерсон, Акаш Тандон, Сэнди Райза
- Размер 1.2x16.7x23.3
- ID товара 2972710
- ISBN 978-5-9775-1770-6