| Title: | Data Engineering with Google Cloud Platform |
| Authors: | Wijaya A. |
| Keywords: | Big Data data pipelines GCP components Google Cloud Platform (GCP) machine learning большие данные компоненты GCP конвейеры данных машинное обучение |
| Issue Date: | 2022 |
| Publisher: | Packt Publishing |
| Citation: | Wijaya, A. Data Engineering with Google Cloud Platform : A Practical Guide to Operationalizing Scalable Data Analytics Systems on GCP / Adi Wijaya. - Birmingham ; Mumbai : Packt Publishing, 2022. - 1 file (9,13 Mb) (440 p.). - ISBN = 9781800561328, 9781800565067. - Текст : электронный |
| Abstract: | With this book, you will understand how Google Cloud Platform enables data engineers to create scalable data pipelines from storing and processing data to orchestrating workflows and presenting data through visualizations. Starting with an overview of fundamental data engineering concepts, you will learn about the responsibilities of a data engineer and the role of Google Cloud in fulfilling these responsibilities.. As you progress through the book, you will be able to use GCP products to create a sample data warehouse using Cloud Storage and BigQuery, and a data lake using Dataproc. The book will gradually guide you through operations such as data ingestion, cleaning, transformation, and integration with other sources. You will learn how to design identity and access management (IAM) for data governance, deploy machine learning (ML) pipelines with Vertex AI, use pre-built GCP models as services, and visualize data with Google Data Studio for creating compelling reports. This book is for data engineers, analy Используемые программы Adobe Acrobat Руководство позволяет инженерам по обработке данных создавать с помощью облачной платформы Google масштабируемые конвейеры обработки данных - от хранения и обработки данных до организации рабочих процессов и представления данных с помощью визуализаций. Представлен обзор основных концепций разработки данных, описана роль Google Cloud в осуществлении деятельности инженера по обработке данных. Рассмотрено использование продуктов GCP для создания образца хранилища данных с использованием облачного хранилища и BigQuery, а также озера данных с использованием Dataproc. Подробно описаны такие операции, как прием данных, очистка, преобразование и интеграция с другими источниками. Представлена информация о разработке системы управления идентификацией и доступом (IAM) для управления данными, внедрении конвейеров машинного обучения (ML) с помощью Vertex AI, использовании готовых модели GCP в качестве сервисов и визуализации данных с помощью Google Data Studio для создания убедительных отчетов. Книга предназначена для ин |
| URI: | http://repo.ssau.ru/jspui/handle/123456789/59440 |
| ISBN: | 9781800561328 9781800565067 |
| Appears in Collections: | eBooks |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| 3181894.pdf | 9.36 MB | Adobe PDF | View/Open Request a copy |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.