数据挖掘专家称2017年为数据扫盲和数字转换年。虽然数据是推动真正数字转换的关键要素,但企业往往以错误的方式处理数据和分析项目。事实上,只有13%的数据和分析项目已经完成,而在那些已经完成的项目中,只有8%的公司领导报告对结果完全满意。

500520243_wx

为什么数据科学项目的结果如此惨淡?

大多数失败可以追溯到四个主要的陷阱:从错误的问题开始;使用错误的数据;缺乏利益相关者的认同;以及缺乏多样化的专业知识。

预先认识到这些常见的危害,会让首席信息官和IT主管更好地领导数据科学项目,这些项目将推动有价值的洞察力,并为组织的全面成功的数字变革做出贡献。

1. 从错误的问题开始

很多时候,数据科学项目从分析数据开始,期望有趣的洞察力会显露出来,成为商业案例的基础,证明转换是正确的。

这种“探索性分析”方法常常产生数十个潜在的数据项目,这些项目可能产生引人注目的结果。但是他们中的任何一个都能产生一个强有力的商业案例,例如,可以降低成本、鼓励重复的客户或留住员工吗?“探索性”项目的范围太广,无法推动有用的分析,这是对IT资源的浪费。

更好的方法是以直接映射到创建业务价值的既定目标启动项目。遵循“假设检验”方法的项目从一组明确定义的问题开始,这些问题表明哪些数据应该分析。

这种有针对性的方法通过将业务合理性与业务操作结合起来,简化了数据挖掘和分析过程,从而将信息技术资源导向最有可能产生可信和有意义的发现的信息。从正确的问题开始,通过提高准确性和效率,为一个成功的数据科学项目奠定基础,从而产生有目的的洞察力。

2. 使用错误的数据

使用准确的数据是项目成功的根本,但糟糕的数据是最被低估的失败原因。很多时候,公司根本没有花足够的时间清理数据。由于清洁数据十分重要,一个很好的指导方针需要将预计项目时间表的80%分配给数据清理。

虽然这看起来有些过分,但是做一项彻底的工作将成为该项目最重要的节省时间的方法,因为使用干净的数据可以加快后续的所有步骤。考虑一下,即使是一个简单的错误,也会产生一个错误的洞察,有可能使整个项目失败,并导致领导层撤回对未来数字改造计划的支持。

现代云和数据获取工具促进了非结构化数据的合并,然后可以以不同的方式提取、挖掘和关联这些数据,从而使数据更容易管理,同时减少时间、基础设施和错误。

3.缺乏利益相关者的认同

数据科学项目可能会影响整个公司的商业领袖。如果没有利益相关者的支持和实施变革的承诺,项目可能会陷入停滞或失败。

确保整个组织的业务一致的较佳方法是制定一个可靠的数据策略和路线图,以使每个人都走上正轨。

利益相关者必须相信项目的目的,并在时机成熟时承诺在部门内贯彻执行。当涉众看到由坚实的业务案例支持的计划的价值时,由涉众障碍引起的项目失败的可能性就会大大降低。

4. 缺乏多样化的专业知识

一个常见的误解是,任何涉及数据的项目都应该是IT部门的责任。这种目光短浅的观点对项目的成功再危险不过了。使用正确的数据分析工具很重要,但是产出不能提供有意义和有用的洞察力。让合适的人才参与这个项目是至关重要的,不管他们是哪个部门的。

最成功的数据科学项目雇用具有多种技能的部门的团队成员,包括对定量研究、统计和专题知识的理解,这取决于该倡议的问题和重点。

它们可以一起带来不同的视角、熟练程度和经验,以塑造项目的目标和方向。

数据项目还得益于团队中有一位了解业务内部运作的人,以确保其与最初的业务目标保持一致。更多地关注项目,发现错误的机会,同时充分利用整个团队的集体知识和人才。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-31 09:28:00
大数据资讯 2023数据科学峰会 百分点科技正式发布数据科学基础平台
3月30日,由百分点科技主办的“2023数据科学峰会”在北京金隅智造工场·科技秀场成功召开。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>