ISBN/价格: | 978-7-5218-4565-5:CNY65.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Hadoop大数据分布式计算框架/.杨成伟, 祝翠玲, 刘位龙编著 |
出版发行项: | 北京:,经济科学出版社:,2023.9 |
载体形态项: | 352页:;+图:;+24cm |
提要文摘: | 本书主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在, 互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等, 每时每刻都在不断产生数据。这些分散在各处的数据, 需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析, 因为对于来源众多、类型多样的数据而言, 数据缺失和语义模糊等问题是不可避免的, 因而必须采取相应的措施有效解决这些问题, 这就需要一个被称为“数据预处理”的过程, 把数据变成一个可用的状态。 |
并列题名: | Hadoop big data distributed computing framework eng |
题名主题: | 数据处理 |
中图分类: | TP274 |
个人名称等同: | 杨成伟 编著 |
个人名称等同: | 祝翠玲 编著 |
个人名称等同: | 刘位龙 编著 |
记录来源: | CN SCZH 20240520 |