大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。那么,大数据的关键技术有哪些呢?今天就跟随小编一起来了解下吧!

大数据

1、数据收集

大数据时代,数据的来源极其广泛,数据有不同的类型和格式,同时呈现爆发性增长的态势,这些特性对数据收集技术也提出了更高的要求。数据收集需要从不同的数据源实时的或及时的收集不同类型的数据并发送给存储系统或数据中间件系统进行后续处理。

2、数据预处理

数据的质量对数据的价值大小有直接影响,低质量数据将导致低质量的分析和挖掘结果。广义的数据质量涉及许多因素,如数据的准确性、完整性、一致性、时效性、可信性与可解释性等。

3、数据存储

分布式存储与访问是大数据存储的关键技术,它具有经济、高效、容错好等特点。分布式存储技术与数据存储介质的类型和数据的组织管理形式直接相关。

4、数据处理

分布式数据处理技术一方面与分布式存储形式直接相关,另一方面也与业务数据的温度类型(冷数据、热数据)相关。目前主要的数据处理计算模型包括MapReduce计算模型、DAG计算模型、BSP计算模型等。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-22 09:44:25
国内资讯 信通院余晓晖:我国存储总量达到1080EB
余晓晖表示,结合算力、存力、运力发展特点和重点影响因素,在2022年的基础上,中国信通院进一步完善综合算力发展体系,构建了中国综合算力指数体系2.0。 <详情>
2023-07-20 09:07:15
国内资讯 倪光南:大力发展数据存储产业,掌握竞争主动权
倪光南总结到,鉴于存储在现代科技中的重要地位,我国应抓住中国存储业面临的重大机遇和挑战,实现科技自立自强,高质量发展,为科技强国建设和掌握数字经济竞争主动权提供 <详情>
2023-06-27 10:38:24
国内资讯 倪光南院士:必须高度重视数据存储产业发展,加强顶层设计和战略布局
随着5G网络、人工智能、自动驾驶、云计算、工业互联网等新兴产业的快速发展,数据已成为数字经济时代的核心生产要素。 <详情>
2023-01-16 11:09:03
国内资讯 算网融合下,数据存力发展探讨
业界普遍认为,数据存力与算力同等重要,是数字经济稳定发展的基石,而建设强大的数据基础设施则是提升数据存力水平的关键所在。 <详情>
2023-01-13 13:28:54
交换存储 企业如何“数矩觉醒”?联想凌拓以创新构建数智未来
随着越来越多应用部署上云,用户对云端存储服务的性能、可靠性、企业级数据管理能力的需求也越来越强烈。 <详情>