ISBN/价格: | 978-7-302-46980-3:CNY89.00 |
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Hadoop构建数据仓库实践/.王雪迎著 |
出版发行项: | 北京:,清华大学出版社:,2017 |
载体形态项: | 434页:;+26cm |
一般附注: | 大数据技术 |
相关题名附注: | 封面英文题名:Practice of Hadoop data warehouse |
提要文摘: | 本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。 |
并列题名: | Practice of Hadoop data warehouse eng |
题名主题: | 数据处理软件 |
中图分类: | TP274 |
个人名称等同: | 王雪迎 著 |
记录来源: | CN JCUL 20170622 |