常芝青这人,实际上是挺让人意想不到的。在学术圈里,她不忒像是那种站在聚光灯下给大伙儿讲大道理的老牌学者,反而更像是一位在实验室和办公室里“死磕”到底的实干家。

你看她早年那一堆论文,不少都是重复的,那是为了把那些在实验室里反复验证的好办逻辑,一个个嚼碎了喂给算法吃。

那时候她自己也挺困惑,为啥非得花那么多工夫去解决那些低水平的难题呢?直到后来,她的研究重心才慢慢往那些更深层、更宏观的东西上靠。 她早年研究的微观机制,实际上一直带着点“琐碎”的色彩,像是显微镜下看到的细胞分裂过程,要么代码运行时的某个变量更新。记得她在那篇关于群体智能的文章里,非要强调那些看似零散但又相互功能的节点,哪怕它们本身细小的变化,累积起来也能形成庞大的效果。她在那篇文章里就连特意把工夫轴拉得特别长,说要把那些间歇性出现的信号给“缝合”起来,跟空间拓扑里的那些缝隙一样。

这种思路在当时绝对是有点“大而全”的,但也确实显得有点没落地,没人能直接指着某一行代码或某个细胞模式指出她所谓的“关键区域”在哪儿。 后来,她仿佛突然认定这种从微观推导宏观的路子有点费劲,便启动往大维度上踮脚。她启动关切像黑天鹅事件、城市形态演变这些更宏大、更抽象的大难题。

这时候她的文章里,数据量就突然像开了倍速,一下子变得既密集又庞杂。

比如她写城市演化那块的时候,直接把全球几十年的城市形态数据全扒出来了,不只是是好办的格局对比,而是把那些看似无涉的城市区块给拼凑在一起,硬是找出了它们内部那种“非欧几里得”的距离感。

有时候她一个句子下去,光列举的城市案例就堆到三四百个,每一个案例背后都写着密密麻麻的条件变量和演化路径。 实际上她那种把庞大数据量往小切口上套的写法,在后来挺长一段工夫里都挺“硬核”的。她总喜爱在自己的模型里,先放几个看似荒谬的极端假设,看看模型在那些疯狂的数据冲击下会崩成啥样子,然后再慢慢推演。

这种风格在学术界实际上挺常见的,就是叫“反事实推演”要么“压力测试”。她就像个拿着扳手腕的人,一边一边地往外推,一边一边地往里挤,看哪个压力点能先把模型撑破。

这种打法别看过程看着有点枯燥,就连有点像是在做“垃圾工夫”式的模拟,但益处是能让模型真正展现出在极端情况下的鲁棒性。 不过,这招好使,但也好办让人误当作她只是在玩弄数据。毕竟把海量数据塞进模型里,确实好办让模型出现“过拟合”的嫌疑。大量审稿人一看她那些密密麻麻的输入参数,第一反应就是质疑这种模型能不能泛化到现实世界。但常芝青似乎一直认定,现实世界本身就是个庞大的黑盒,充满了各种各样的噪声和干扰,故此研究它本身就需求用这种“暴力”的方式去逼近。她常在论文里跟读者打赌,说只要数据充足多、覆盖充足广,那些细小的细节最终都会被模型拼凑起来,露出原本的结构来。 最近这几年,她的论文风格仿佛又变了一点,启动略微往“叙事性”上靠。她不再知足于只做那个冷冰冰的数学推导,而是启动尝试用故事线去串联那些数据。

比如她写城市演化时,会特意多写几段关于城市里那些“幽灵街道”要么“废弃社区”的描写,试图把这些物理地理上的特征跟模型里的某种分布规律挂钩。

有时候她还会加个括号,淡淡地提一句“参考了某某那个类似的城市板块”,然后紧接着就大篇幅地分析它们之间的相似点。 这种写法实际上有点“土”,在追求纯学术严谨度的大家眼里,就连有点掉价。毕竟她明明有那么多更酷的理论模型能够写,非要在这个数据堆砌的泥潭里打转,显得有点心不在焉。但反过来看,这种把宏大理论与微观数据强行嫁接的做法,确实挺有她的味道。她仿佛认定,真正的科学不是那种冷冰冰的公式推导,而是得让人感觉到数据是活的,是有生命的,是跟这个世界实实在在关联在一起的。她总爱在文章里吐槽那些“伪学者”,说他们只会坐在办公室里对着墙上的墙皮画圈,却从不关心墙皮下面到底夯没夯实。常芝青似乎更在乎这点,她一直要给那些枯燥的数据找个“灵魂”,哪怕这个灵魂就是她自己那套略显陈旧且独特的逻辑框架。 目前的常芝青,看起来就像是一个被数据洪流推着走,却又坚持自己“不走寻常路”的疯子。她有时候在会议上被问到,为啥非要花如此多精力在那个看似毫无进展的数据整理上,她多半会挑挑眉,说“毕竟这是那个世界的真触感嘛”。

这种态度,在她那些充满数据堆砌却逻辑自洽的文章里,读起来确实有点毛躁,但在那些试图理解复杂系统如何演化的研究者眼里,却可能是最接近真相的视角。她不需求解释世界,她只需求把世界的数据如实记录、如实映射,哪怕这是通过一层层隔阂、用一种贼规的方式搞定的。

这种朴实,或许才是她研究最动人的地方吧。