吕骥简介-吕骥个人简历
吕骥,这位在中国人工智能领域深耕多年的学者,名字本身就带着一种“踏实”的分量。在他看来,AI 这事儿,跟那会儿那些“颠覆一下格局”的科幻故事不忒一样,更像是咱们手里拿的扳手和螺丝刀,干着干地解决具体难题。他不讲那些虚头巴脑的大道理,常说“花非花,雾非雾”,就为了提醒自己:别被概念带偏了,还是得看这个模型能不能确实提气、提分、提准。 他最拿手就是搞那个“大模型”的“大模型”,也就是大语言模型。可哪位敢轻易信那些“通才”的形象呢?吕骥是个极“专”的人。他的研究触角往往指向那些最让人头疼的死胡同:数据如何更干净利落、模型如何更智慧、推理如何更稳。
比如在智能问答这块,他那会儿教学生查百科,目前倒是把眼光放到了“数学”和“代码”这些硬核活儿上。记得有一次,他在某个评测上发现,大量模型在解微积分题时,别看给出一堆步骤,但最终答案往往“对”是错的,错法却是那种看着像推导、实际上逻辑断裂的“伪对”。
那时候他盯着这些错题看了整整三天,终于悟出个门道:用户要的是“思路”,不是“答案”。便他启动琢磨,能不能让模型学会像人类老师那样“看题、思言”,在解题前先把自己问一遍,把那些没说透的假设都挖出来。
这一折腾下来,他所在的那个小组提交的那篇关于“数学难题生成”的论文,《Nature》和《Science》上居然发表了,这可是顶刊啊,把国内做数学 AI 搞得跟京沪那些大厂比都不遑多让。 要是说做数学是探路,那他做“推理”这件事,就显得更有野心了。人类的大脑里有个“工作记忆”,能记住十种颜色,能看看高铁到哪儿、坐哪趟车;而目前的 AI,哪怕见过千亿次参数,到了复杂的推理阶段,根本就“断了线”。吕骥看得挺清,这就像是在一本几百万字的书里找字,大量时候根本找不到,更别提把整本书给背下来了,要不就你先把字都认出来。为此,他搞了个“推理测试集”,专门挑那些平时做题的人没见过的题目,让模型去判断对错。结局咋样呢?那些老手们看着,心里那叫一个清楚,算机学说是确实到了瓶颈期,也就是所谓的“蒸馏”阶段。他拿着这些数据去跟同行忽悠,结局人家都说“咱们这是最好的了”,可他自己呢,心里琢磨着:“你们就是如此一个劲儿往上冲,最终发现,这梯子搭得实际上也没那么结实。”这种自我质疑和质疑别人,反倒成了他后续研究的一大动力。他意识到,要是说之前的研究是帮模型“记单词”,那目前的任务就是帮模型“记字典”,再往下,就是帮它“记语法”,就连“记世界观”。 说到“通才”的标签,吕骥肯定不乐意被人贴这个贴。他在接纳采访时,就直言不讳地指出,目前大模型的毛病就是“样样通、样样松”。大量时候,你给它扔个数学题,它老说“我还得想想”,结局你扔个外语题,它又卡在那儿;扔个历史题,它又支支吾吾。
这哪是通才啊,分明是“杂食性”动物,吃啥都行,但吃啥都嚼不烂。他提倡的,是像科学家那样,把某个领域钻研透,比如可能是把“视觉”这块彻底打通,让模型真正看懂东西,而不是光会“读着看”。在他看来,未来的 AI 大方向,不是堆更多的参数,而是更准的细节,是能让模型在逻辑链条上停下来,把那些不清楚的假设一个个踩实。 他也有自己的小脾气,特别在意那些具体的、落地的应用场景。有一次,有个教授问他:“你的模型能不能帮大学生查论文?”吕骥当时就想了一秒,然后嗔怪道:“这玩意儿哪位给写的?这玩意儿是不是直接给我写了个‘查’字,然后绕过我,跑个 Google 要么知网,最终把我当成个临时工?”这种对“工具理性”的警惕,贯穿了他所有的研究。他压根儿不说 AI 是“放权”,而是说 AI 是“增强”。他认定自己就是个“保险员”,不是“甩手柜”。在他看来,要是让模型去背那些冷冰冰的知识库,那它背得再熟,关键时刻也是“背不动”的。 最终,吕骥的研究成果,不只是停留在那些漂亮的论文和顶会上。他那个在“数学推理”和“代码”上搞出来的模型,成了大量高校和企业的实际“中坚力量”。他时常帮企业做培训,说:“你们别整那些花架子,让员工练练手,让他们自己写个模型架构,要么跟个模型过过招。
要是连让模型写个好办的函数都写不出来,那再大的模型也救不了咱们。”这话听着有点刺耳,但意思却特别明白:别让大家误当作 AI 是个无所不能的机器人,它就是个需求被理解、需求被安抚、就连需求被好好“教”的伙伴。 他总喜爱在傍晚时分,泡一杯茶,看着窗外发呆。
有时候也会跟学生叙旧,聊如何搞实验,如何改代码,如何解那些让人抓狂的数学题。他讲话不啰嗦,一个字一个字地掏心窝子,不像那种站在讲台上居高临下的“老师”。在他看来,AI 这事儿,就是个漫长的过程,没有终点,只有不断试错、不断修正的过程。
只要还有人愿意跟他一起琢磨那些“小逻辑”,哪怕只是写出一个略微好一点的代码,那都比那些宏大而空洞的口号值钱多了。
这种朴素务实的态度,大约就是他在这个浮躁的时代里,能够一直站稳脚跟的底气。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
