顾晓韬本科毕业于清华大学计算机科学与技术系,博士毕业于伊利诺伊大学厄巴纳-香槟分校(UIUC),师从数据挖掘领域技术大牛韩家炜。读博之前顾晓韬曾到康奈尔大学做研究实习生,并与 Thorsten Joachims 教授和其团队一起工作。
据 AI 科技评论了解,早在本科期间,顾晓韬就曾进入清华大学知识工程实验室做科研实习,师从唐杰(智谱 AI 联合创始人),开始做数据挖掘、模型训练等方面的相关研究。他参与了清华大学 Aminer 数据挖掘系统开发工作,并获得一项“基于人名的邮箱地址推荐方法及系统”的专利,而 Aminer 是唐杰主导,也是智谱 AI 起家的第一块业务。
博士期间,顾晓韬在Google参与了多项知识抽取系统开发工作,并在国际期刊会议发表论文十余篇。期间,顾晓韬曾花费三个夏天的时间,建立了实用的工具和系统的关系提取,新闻故事标题生成等,而这一系列工作也成功加速了大规模语言模型的预训练。
加入华为后,顾晓韬主要参与华为云的 NLP 与大模型研发工作,是盘古大模型的三个算法负责人之一。一度,华为云的大模型算法负责人有三人,分别是负责预训练的顾晓韬、负责监督微调的史佳欣与负责强化的朱疆成。
此外,顾晓韬也是盘古气象大模型的主要完成人之一。
过去一年,智谱 AI 的发展迅速,一跃成为国内大模型赛道的独角兽。顾晓韬加入智谱,将为智谱的大模型技术团队注入新血液,期待后续发展。