随着美国硅谷开始挖掘全球的数据,人们没有忘记大数据世界是如此的复杂。特别是非洲在世界上许多数据集上呈现出一个明显的空白时,但这个差距究竟有多大?

Facebook公司创始人马克•扎克伯格表示,Facebook的原始热门主题Feed几乎完全没有来自非洲的新闻来源,这意味着几乎不可能有来自非洲大陆的Facebook公司用户,除非他们被美国媒体覆盖,才会有非洲大陆的大多数事件。

其余的社交媒体的情况也不是更好,Twitter也没有真正进入整个非洲大陆。这就很有问题因为定义大数据革命的“社交媒体监控”领域的大部分都是基Twitte的firehose,因此这意味着将错过非洲和中东地区的市场。

大数据1

2012-2014年期间Twitter大量活动的地点

当涉及到网络搜索引擎,其市场似乎没有任何更好的发展。Google公司的趋势小组在2016年6月生成了一张地图,显示了美国人在2016年搜索全球的每个国家/地区的频率。非洲则独树一帜,成为搜索次数最少的大陆。

大数据2

美国人在Google上针对世界各国搜索的频率的地图

这些地图清楚地说明了人们根本不谈论非洲,而且没有足够的兴趣去探索非洲。这就提出了这样一个问题:新闻媒体是否同样不覆盖非洲大陆,或者是否有大量报道,但它根本没有与人们产生共鸣。

以下的地图显示了2015年3月“纽约时报”和BBC报道中提到的所有地点。虽然非洲当然被提及,但这个地图清楚地表明,非洲并不是两个媒体报道的的优先事项。

大数据3

当然,网络不是唯一的新闻来源,电视新闻仍然在美国发挥着关键作用。然而,如下图所示,电视新闻在其对非洲的覆盖不是太好。如果人们观察每个月在美国电视新闻上提到的所有位置的地图,人们多数对非洲缺乏兴趣在,往往多个月都没有提到一个特定国家。

事实上,下面的地图与Google趋势地图有着惊人的相似之处,美国人在哪些国家搜索最多。这并不能告诉人们缺乏媒体关注导致缺乏搜索兴趣,反之亦然,但是相似之处是显著的。总之,媒体没有覆盖非洲,人们并没有寻找非洲事物的兴趣。

即使是拥有丰富的资源的美国情报界,似乎对非洲没有什么兴趣。在1994-2004年期间,美国OSINT机构(负责监测世界各地的新闻和其他“开放”资源)大部分通过欧洲媒体(如法新社)的报道观察了非洲大陆,并几乎没有实际监测非洲各国的站点。事实上,这是美国政府资助的监测项目错过了埃博拉疫情的第一次爆发的原因之一,因为这些早期警报标志首先出现在美国的法语广播电台。

如果人们不在谈论非洲,并不在网络寻找它时,那些西方网络和电视新闻媒体似乎并不覆盖非洲大陆。在拥有撒哈拉沙漠,人口密度低的非洲,事实上有相当多的媒体和媒体报道的事件,而这些也被传统的西方网站和社交媒体错过。

将这些结合在一起,人们看到“大数据”提供了令人难以置信全球社会的一瞥,非洲大陆十分缺乏人们的关注,而对于传统的大数据集,如社交媒体的分析捕获非洲国家的地方事件和观点则非常糟糕。然而,由于大数据的发展,以及机器翻译等技术的应用,有可能使非洲大陆重新回到“大数据”分析的视野。数据科学界需要的是更加重视确保人们使用的数据集在地理上代表整个世界的努力方向。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>