在数字经济时代,互联网、物联网、5G、大数据、智慧城市等各类形式的信息技术呈爆炸式增长,使得数据以令人难以想象的速度不断增长,企业经营的各个阶段都可以被记录下来,产品销售的各个环节也被记录下来,客户的消费行为和网上行为,智能设备的信息都被采集下来。数据已成为一种重要的生产要素,通过对数据的收集、存储、再组织和分析建模,隐藏在数据中的重要价值及规律被客观的挖掘展现出来,成为企业和社会升级及可持续发展的重要推动力量。而然这些技术应用的发展,基础是数据治理和大数据分析建模,大数据分析建模也成为了大数据应用的核心和关键环节,也成为科技界和企业界关注的热点话题。如何进行大数据的建模分析呢,本文带领大家,了解大数据分析建模的思路。

大数据分析建模的背景

随着企业信息化的逐步深入,大量信息系统在企业中广泛应用,物联网、云计算、工业互联网等技术与企业经营生产紧密结合,设备运行、生产加工、测试试验等数据采集过程更加自动化,企业积累了大量的数据,包括产品销售数据、客户消费数据、客户行为数据、企业运营数据等,企业经营生产的各个阶段都可以被记录下来,产品销售的各个环节也被记录下来,客户的消费行为和网上行为都被采集下来,这些数据隐藏着大量的有价值的规律和信息,是企业的重要资产。

ZFFnam

分析手段已无法满足企业对于深层次信息的挖掘需求,大数据融合、大数据分析、大数据挖掘等技术不断发展,漏斗分析、事件分析、行为分析、留存分析、属性分析等模型不断完善,神经网络、决策树、关联规则等挖掘算法不断成熟,基于Hadoop、HDFS的分布式存储技术以及基于Storm、Spark、MapReduce等分布式计算技术迅猛发展,为大数据分析处理及分析建模提供了坚实的技术支撑。

大数据分析建模步骤

企业开展大数据分析,首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选择数据源、进行数据抽样选择、数据类型选择、缺失值处理、异常值检测和处理、数据标准化、数据簇分类、变量选择等,再次应进行数据处理工作,即进行数据采集、数据清洗、数据转换等工作,最后开展数据分析建模及展现工作。大数据分析建模需要进行5个步骤,即选择模型、训练模型、评估模型、应用模型、优化模型结构。

选择模型----训练模型-----评估模型----应用模型----优化模型

选择分析模型: 基于收集到的业务需求、数据需求等信息,研究决定选择具体的模型,如行为事件分析、漏斗分析、留存分析、分布分析、点击分析、用户行为分析、分群分析、属性分析等模型,以便更好地切合具体的应用场景和分析需求。

训练分析模型: 每个数据分析模型的模式基本是固定的,但其中存在一些不确定的参数变量或要素在里面,通过其中的变量或要素适应变化多端的应用需求,这样模型才会有通用性。企业需要通过训练模型找到最合适的参数或变量要素,并基于真实的业务数据来确定最合适的模型参数。

评估分析模型: 需要将具体的数据分析模型放在其特定的业务应用场景下(如物资采购、产品销售、生产制造等)对数据分析模型进行评估,评价模型质量的常用指标包括平均误差率、判定系数,评估分类预测模型质量的常用指标包括正确率、查全率、查准率、ROC曲线和AUC值等。

应用分析模型: 对数据分析模型评估测量完成后,需要将此模型应用于业务基础的实践中去,从分布式数据仓库中加载主数据、主题数据等,通过数据展现等方式将各类结构化和非结构化数据中隐含的信息显示出来,用于解决工作中的业务问题的,比如预测客户行为、科学划分客户群等。

优化分析模型: 企业在评估数据分析模型中,如果发现模型欠拟合或过拟合,说明这个模型有待优化;在真实应用场景中,定期进行优化,或者当发现模型在真实的业务场景中效果不好时,也要启动优化,具体优化的措施可考虑重新选择模型、调整模型参数、增加变量因子等。 大数据分析建模建议

数据分析建模是企业大数据应用的重要基础,通过建模不仅有效地组织了原始数据,而且为数据展现提供了重要支撑,企业在开展数据分析建模过程中应注意以下几点:

1. 重视需求牵引作用,深化业务问题解决

企业应结合业务发展目标,梳理经营生产过程中的瓶颈问题,以问题为导向,重视业务需求调研工作,清理业务流程和业务数据,研究数据来源、采集通道和映射关系,深入梳理数据基础,不断推进业务问题的解决并构建合理的业务架构。

2. 加大数据积累力度,夯实数据体系基础

企业应深化信息系统应用,提升业务流程和业务数据上线力度,深化物联网、云计算等新兴技术应用,提高数据采集效率,丰富数据积累力度;完善主数据、主题数据、数据建模等标准规范,构建包含业务、指标、报表等的数据体系,夯实数据体系基础。

3. 加大人员队伍建设,提高技术支撑能力

大数据分析建模是数据到信息转变的重要支撑,也是凸显数据价值实现的重要环节,企业应加强业务需求调研与业务架构优化,夯实数据基础和应用基础,不断选择、训练、评估、应用和优化模型,不断推进大数据分析建模的应用,为转型升级奠定坚实基础。

企业应加大技术专家、业务专家、数据分析师、数据管理员、运营专家等专业人员的培养,调动业务部门参与数据分析的积极性和主动性。同时加大数据分析、数据建模、数据挖掘技术储备、技术工具库和模型库建设,提高技术支撑能力。

相关阅读:

第一家医疗大数据创业企业成功上市,医疗大数据应用不再“隔靴搔痒

” 张礼立:从大数据,工业物联网,工业大数据应用谈三一重工转型    

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 11:39:36
云资讯 构造云原生数据战略三大核心因素 亚马逊云科技2022 re:Invent全球大会发布多项新功能
亚马逊云科技指出了构建云原生数据战略的三大关键构成:建立面向未来的云原生数据基础设施;实现高效、跨组织的数据一体化融合;借助教育和工具,使数据普惠化。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>