Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL.
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различи
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различи
- -15%
Нечеткое сопоставление данных в SQL
Купили 12 человек
Описание и характеристики
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
Примеры в книге содержат реальные кейсы и рабочий код.
5 причин купить эту книгу:
- 1. Вы узнаете, как находить и удалять дубликаты в разных наборах данных с помощью SQL.
- 2. Научитесь нормализовать данные и повышать их качество с помощью SQL.
- 3. Будете генерировать SQL с помощью SQL для повышения производительности.
- 4. Сможете подготавливать наборы данных для импорта, объединения и лучшего анализа с помощью SQL.
- 5. Повысите качество данных и научитесь выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
- Тип обложки Мягкий переплёт
- Количество страниц 288
- Вес, г 462
- Размер 1.5x16.5x23.3
- Издательство Sprint Book
- Серия Бестселлеры O`Reilly
- Возрастные ограничения 16+
- Год издания 2024
- ISBN 978-601-08-4037-9
- Тираж 700
- ID товара 3050734