据新加坡《联合早报》报道,由新加坡国立大学中文系主任丁荷生和高级研究员许源泰率领的研究团队,近几年造访当地各大会馆、庙宇、坟场,展开了工程浩大的资料搜集和编码整理工作,目标是建立1819年至2019年八代新加坡先贤的个人和人物关系网络大数据库,以大数据谱写新加坡的华社关系网。

当地的华社研究不仅聚焦华人领袖,也放眼历史上的“小人物”,进一步通过大数据谱写华社领袖和中低层社会人物的关系网络。

2017年,团队开始利用地理信息系统(Geographical Information System)来捕捉新加坡历史。而自2019年2月,由新加坡国家图书管理局、新加坡宗乡会馆联合总会,以及新加坡国立大学中文系携手共创的“新加坡人物传记数据库”正式上线以来,数据库共收录了200位本地重要华社领袖以及由他们扩展而来的社会关系网络,把研究带到了一个新阶段。

许源泰指出,数据库的建立是从“大人物”出发,并已整理出约1000名华人领袖的资料。他们的计划是建立1819年至2019年八代新加坡先贤的个人和人物关系网络大数据库。以每25年为一个阶段,目前团队正在整理收录于《新加坡华文铭刻汇编1819-1911》中约5万人的资料。

许源泰说,这5万人是一个庞大的网络,从会馆、庙宇和碑文搜罗而来,其中大多数都是名不见经传的“小人物”,“这些中层阶级和低层阶级人物,也是构成华社的重要分子,却常被学界忽略。”

从会馆特刊坟场墓碑搜集新资料

此外,团队也在开拓新的第一手资料,包括从各大会馆收集的会馆特刊,以及从墓碑上手抄而来的死亡记录,经过团队的辨认和数码化后,从中整理出记录于1922年至1972年的6万2000多个人名。

“目前学术界从来没有把这批资料列入研究范围。”许源泰说,保留下来的都是武吉布朗坟场的墓碑记录,由国家文物局提供,其中大部分人都属于福建籍贯。

丁荷生和许源泰也带着学生亲自到武吉布朗坟场寻找更早期的墓碑,目前已经找到了1500多个清代时期的人名。而在被发现的墓碑当中,年代最久远的刻于1824年。

许源泰透露,团队这两年来已经为这批墓碑成立了独立的资料库,将来也会与“新加坡人物传记数据库”接轨,让墓碑的地理信息和人物的个人信息相结合,打开新的研究视角和方向。

团队也与新加坡族谱学会合作,收集了100多部家谱资料,主要来自福建和广东,其中也包括来自潮州的家庭。许源泰说,明朝和清朝时期有大量的移民迁徙至新加坡和台湾等地,通过研究家谱,可以看出离散于两地移民之间的关联和差异。

许源泰也指出,在美国和台湾等地的人物研究主要专注于“仕”,即知识分子,“不过新马一带早期都是商人和工人为多,他们往往通过建庙、建会馆而留名。我们研究的切入点因此很不一样。当然量很多,困难也很大,建立这样的资料库因此不容易。”

新加坡国立大学中文系硕士生张文博(23岁)、南洋理工大学中文系二年级生邓凯恩(21岁)都是团队一员,分别参与了庙宇和墓碑的研究工作。

邓凯恩说,田野调查的过程十分严谨,墓碑上的资料须仔细分类、辨认和校对。整理后的资料还须进一步编码,才能收录在资料库以便分析。

许源泰相信,这项研究可以帮助了解华人社群在当地的活动足迹和互动过程,“新加坡的会馆和庙宇总是在不断搬迁,许多记录都在流失,许多人名也有所重复。但通过电脑的识别和编码,可以帮助我们串联出一个网络,看到人脑和肉眼所看不到的东西,提出新的问题。”

相关阅读:

重庆成立大数据产业人才联盟  

使用预测分析解决网络问题:事实还是虚构?  

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>