用户头像
哈佛 CBDB 社会关系分析案例:宋代士人婚姻网络可视化
? 先搞懂 CBDB:宋代士人研究的 “超级数据库”

说真的,第一次听说哈佛 CBDB 的时候,我还以为是哪个新出的数据分析工具 —— 结果一查才知道,这玩意儿简直是研究中国历史的 “宝藏”!CBDB 全称是中国历代人物传记资料库,听着挺学术,其实就是把散落在《宋史》《宋会要辑稿》还有各种墓志、家谱里的宋代人物信息,一条条扒出来、分类、编码,最后建成了一个能直接调用的数据库。

你猜这里面最值钱的是什么?是人物关系!不光有父子、兄弟这种血缘关系,连谁娶了谁的女儿、谁的妹妹嫁给了哪个官宦子弟,这些婚姻信息都标记得清清楚楚。就拿宋代士人来说吧,那些考中科举、当过官的文人,他们的婚姻记录在 CBDB 里能追溯到好几代,这可不是随便哪个数据库能做到的。

CBDB 最牛的地方,在于它把 “死史料” 变成了 “活数据”。以前研究宋代士人婚姻,学者们得趴在故纸堆里一点点抄录,碰到重名的、记载矛盾的,光考证就得花半年。现在呢?直接在 CBDB 里输入关键词,比如 “北宋 进士 婚姻”,相关人物的配偶、岳家背景、联姻次数,唰一下就出来了。这种效率,简直是给历史研究装上了 “加速器”!

? 宋代士人婚姻网络:不只是 “娶媳妇” 那么简单

别以为宋代士人结婚就是看脸或者看家境 —— 根本不是!那时候的士人婚姻,说白了就是 “资源置换”。你想想,一个寒门出身的进士,要是能娶到宰相的女儿,那官场之路是不是能顺坦十倍?反过来,大士族要是招个有潜力的年轻进士当女婿,家族势力也能延续得更久。

所以啊,宋代士人的婚姻网络,本质上是一张权力和资源的交换网。你去翻 CBDB 里的记录,会发现一个很有意思的现象:北宋中期以后,中高级官员的女儿,80% 以上都嫁给了同样有科举功名的士人。不是他们不想嫁富商,是因为在那个年代,“士” 的身份比钱更值钱 —— 有了功名,才有官场话语权,才能保住家族地位。

更有意思的是地域因素。CBDB 里的婚姻数据显示,宋代士人联姻特别 “认老乡”。比如江西抚州的士人集团,他们的婚姻对象里,60% 都来自本地或邻近州府的几个大家族。这可不是巧合,而是为了形成地域联盟 —— 在中央官场,同乡加姻亲的关系,能帮他们在党争中抱团取暖。

? 哈佛团队的可视化魔法:从数据到图谱的跨越

光有数据还不够,得让人 “看明白” 才行。哈佛团队最厉害的一步,就是把 CBDB 里密密麻麻的婚姻记录,变成了一眼就能看懂的网络图谱。我跟你说,这个过程可比想象中麻烦多了。

第一步是 “挑数据”。他们从 CBDB 里筛选出北宋仁宗到南宋理宗时期(大概 300 年)的 12000 多位士人,重点提取了他们的婚姻关系 —— 谁是岳父、谁是女婿、谁和谁是连襟。这里面还得排除掉那些记录模糊的,比如 “娶某氏” 没说清是谁家的,不然图谱就乱了。

第二步是 “洗数据”。宋代人重名的太多了,比如叫 “王焕” 的士人,CBDB 里就有 7 个。团队得一个个核对他们的籍贯、官职、生卒年,确保 A 的老婆确实是 B 的女儿,而不是另一个 B。这一步,据说光博士生就熬了 3 个通宵。

第三步才是 “画图谱”。他们用的是 Gephi 这个工具 —— 搞网络分析的基本都知道。把每个士人设为一个 “节点”,婚姻关系设为 “连线”,节点越大,代表这个士人联姻次数越多;连线越粗,说明两家联姻不止一次(比如父子都娶了同一家的女儿)。还特意用颜色标了地域:红色是北方士人,蓝色是南方士人。

你猜最后出来的图谱长啥样?密密麻麻的节点挤在一起,但能明显看到几个 “超级节点”—— 比如北宋的吕氏家族(吕蒙正那一支)、南宋的赵氏家族(宗室旁支),他们的节点大得像个小太阳,周围密密麻麻全是连线。这一看就知道,这些家族是当时婚姻网络的 “核心玩家”。

? 图谱里藏着什么?宋代士人的 “婚姻密码”

可视化之后,好多以前藏在文字里的规律,一下子就冒出来了。最明显的是 **“圈子效应”**—— 你看图谱里,北方士人的红色节点和南方士人的蓝色节点,在北宋前期是分开的两个团,到了南宋,居然慢慢融成了一个大团。这说明啥?靖康之变后,北方士族南迁,和南方士人通婚越来越多,南北文化、政治势力也跟着融合了。

还有个发现特别颠覆认知:以前总说宋代 “榜下捉婿”,好像只要考中进士就能被大士族抢着要。但图谱里显示,只有 “前三甲” 或者出身寒门但有大佬推荐的进士,才能挤进顶级婚姻圈。那些排名靠后的进士,联姻对象大多是小官或者地方富豪,根本碰不到宰相、枢密使这个级别的家族。这说明,科举只是 “入场券”,想进核心圈,还得有硬实力或者人脉。

更绝的是对 “党争” 的印证。北宋中后期的新旧党争,在婚姻图谱里看得明明白白:王安石变法那阵子,新党官员的节点和旧党官员的节点,连线少得可怜,几乎是两个独立的小圈子。等到司马光上台,旧党内部的连线突然变多,新党那边则冷清了不少。这哪是婚姻网络啊,分明是政治立场的 “站队图”

? 这个案例牛在哪?对历史研究的 3 个颠覆性启发

哈佛这个案例,不光是做得漂亮,更重要的是它给历史研究指了条新路。第一个启发是 **“数据驱动” 比 “经验判断” 更靠谱 **。以前学者说 “宋代士族婚姻重门第”,但到底重到什么程度?哪个地区最明显?CBDB 的可视化图谱直接用数据说话,连反驳的余地都没有。

第二个启发是 **“关系网络” 能解锁新视角 **。以前研究士人,大多盯着单个名人,比如苏轼、王安石。现在通过婚姻网络图谱,能看到他们背后的家族链条 —— 苏轼的老婆是王弗,王弗的爷爷是王仁裕(五代名臣),王弗的弟弟王巩又娶了张方平的女儿,张方平是苏轼的恩师…… 这么一串,苏轼在官场的人脉网就全清楚了,他为啥被贬还能东山再起,也多了层解释。

第三个启发更实际:给数字人文研究打了个样。现在国内好多高校也在用 CBDB,但大多还停留在查数据的阶段。哈佛这个案例证明,把历史数据可视化、做网络分析,能挖出多少新东西。我敢说,接下来几年,肯定有更多人跟着学,到时候宋代政治、经济、文化的研究,说不定会有一波大突破。

? 还能更牛吗?CBDB 婚姻网络可视化的局限与可能

当然,这个案例也不是完美的。最大的问题是数据不全——CBDB 里收录的主要是男性士人的婚姻记录,女性的信息少得可怜。比如 “某氏嫁某官”,这个 “某氏” 的父亲是谁、有没有兄弟、她自己的教育背景,大多没记录。要是能把女性信息补全,图谱肯定会更立体。

还有个小遗憾是时间维度不够细。现在的图谱是 “300 年总览”,要是能做成动态的,比如每年更新一次节点和连线,就能看到婚姻网络是怎么一步步变化的 —— 比如某个家族是哪一年突然崛起的,某个政治事件后哪两个圈子突然断了联系。这要是做出来,绝对更震撼。

不过话说回来,就算有这些局限,这个案例已经足够牛了。它让我们看到,历史研究不止是 “读史、写史”,还能 “算史、画史”。以后谁再说历史研究老气横秋,我就把这个婚姻网络图谱甩给他看 —— 这玩意儿,比好多现代社会网络分析都时髦!

【该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具】

作者头像

AI Insight

专栏作者

专注于AI技术前沿动态,为您带来最新的AIGC资讯和深度分析。

156 篇文章 3807 关注者