
文:刘颂佳
从伏案攻关学术课题、斩获多项AI领域重磅奖项的清华讲明注解,到奔赴东谈主机交互蓝海的领路东谈主,黄民烈讲明注解怀揣初心与期许情愫开启二次创业,成立聆芯智语,激越于构建AGI水平的多模态交互模子,让东谈主与AI之间的交流不再有任何扼制……
——写在前边
你可能还不太熟练聆芯智语,但在清华园里,拿起经营机系的黄民烈讲明注解,一定是学界公认的资深学者,褪去高校学者身份,他亦是躬身前行的创业东谈主。早在2021年,大模子波澜初起,黄讲明注解即创办了聆心智能。而他,也在繁重的科研服务和创业征程的门径络续中,活成了真的的“万能顶流”。
而淌若你了解黄讲明注解往常的十年,就会昭彰:聆芯智语不是继聆心智能之后,又一场从零启动的冒险,而是一个把“清华底色+专科手艺+AGI设想”全部装进行囊,在既有积淀之上的连续前行。
01. 奔赴AGI交互的追光者
黄民烈讲明注解出身于手艺期许主义浓厚的一代东谈主中。本科时分,他就读于清华大学工程物理系,并于2006年取得清华大学经营机博士学位,毕业后,留在清华任教,自此扎根清华讲台与东谈主工智能科研一线。
黄讲明注解是很特别的一类东谈主,他不测过问各样外交场面,鲜少出席对外行为,致使学术讲述,一心深耕学术。他为东谈主廉正谦让、格调质朴、开心合法。在中国AI学界,他既懂底层算法,也经久询查“东谈主的情感”;既作念学术,也作念产业;既关注模子才气,也关注模子范围。许多询查者只追求“更强”,而他更关爱:怎样让东谈主工智能通晓和学会“东谈主性之好意思”,怎样更好地贯穿东谈主与机器。
行为导师,黄讲明注解善于激勉学生的内驱力,饱读吹学生挑战无东谈主区。在他的经心培养下,一巨额优秀的后生学者走出清华,活跃在海表里的顶尖高校和科技巨头中,成为中国乃至人人NLP领域的腾达代中坚力量,简直每个大模子公司都有他的学生行为手艺Leader并承担着要害脚色。旧年,他的学生顾煜贤取得了清华大学询查生的最高荣誉——询查生零碎奖学金。这不仅是清华学术基因的传承,更是中国AI学者在中枢手艺上的代代接力。
如今,黄讲明注解的身份许多:清华大学经营机系长聘讲明注解、国度杰青、清华基础模子中心副主任、智谱AI询查院科学家等。他经久深耕大模子、对话系统、情感智能等成见,是国内最早开展生成式对话系统的学者、当然说话处理领域海外驰名学者、大说话模子领军东谈主物之一。在ACL、ICML、ICLR、NeurLPS等海外顶会发表论文200余篇,援用近四万次,入选Elsevier中国高被引学者、AI2000人人最有影响力AI学者榜单,取得2025寰宇互联网大会源流科技奖、中国东谈主工智能学会吴文俊东谈主工智能科技跨越奖一等奖等诸多奖项。
但比较头衔和荣誉,他更欢快外界记取他的另一个身份:
一位对AGI水平的对话交互有着深度执念与情愫的讲明注解。
早在2015年,黄讲明注解就把清华课题组的询查成见锚定在了当然说话生成这一最难、最具挑战性的询查方进取,亦然国内最早开展这一询查的学者。故事生成、对话生成这些最难的怒放域生成任务,成为了他挑战的打算。过程五年的服从蓄积,2020年他出书了国内第一册当然说话生成方面的著述《当代当然说话生成》。彼时,他询查的怒放域对话生成,对标的恰是海外大厂Meta的Blenderbot和Google的LaMDA系统(LaMDA系统的研发团队自后创立了Character AI,后被Google收购,而他创立的聆心智能正对标Character AI,后被智谱收购)。在他看来,AGI水平的东谈主工智能,不仅仅会算题,而是会交流、会通晓、会共情、领有全局通晓、经久缅想和东谈主格化想维。
2017年前后,黄民烈讲明注解团队又作念出了一项广受关注的询查——ECM(Emotional Chatting Machine)。他第一次尝试把“心理机制”引入聊天机器东谈主。这意味着:当你酸心时,AI不再仅仅机械回答;它会尝试判断你的心理,并给出更妥当情感场景的修起。今天看来,这似乎仍是是AI家具的“标配”。但在当年,如故一个相配前沿的成见。然则黄讲明注解并不得志于实验室里的表面询查,长期渴慕让前沿手艺落地生根。这份敢想敢闯的干劲,也让他走上了科研服从生意化的谈路。他常言:“作念询查不可只停留在纸面上,必须去真的处置问题,有东谈主看,有东谈主用,有东谈主买,才能创造真的的价值。”
2021年11月,黄讲明注解躬身入局,创办了北京聆心智能科技有限公司,并担任首席科学家。他先后指挥团队打造出了国内首个情感大模子Emohaa与超拟东谈主大模子 CharacterGLM,将清华大学在对话AI领域的顶尖询查服从进行生意化调遣。那年,聆心智能深受老本有趣,仅成立三个月即连气儿完成了天神轮、天神+轮融资。2023年底成为智谱旗下全资子公司,接入GLM大模子,久久午夜无码鲁丝片午夜精品酿成“手艺互补、资源协同”口头。这不仅考据了黄讲明注解学术表面的实用价值,也为中国AI手艺的生意化探索出了一条特质之路。
2023-2025年,黄民烈讲明注解团队孝敬了几许有代表性的寰宇级服从,包括:默契常识图谱(COKE)、机器心智测试基准(TomBench),以及大模子情商评估模范(EmoBench)。他的团队正在尝试补皆现时大模子最要害、也最艰巨的一块拼图——让机器真的具备通晓东谈主的才气。这些服从背后,体现的是他对东谈主工智能发展旅途的私有判断。在他们看来,畴昔的大模子竞争不仅是参数鸿沟和常识储备的竞争,更是心智才气、社会默契才气和情感通晓才气的竞争。机器不仅要“知谈寰宇是什么样”,更要“通晓别东谈主为什么这样想”。
02. 真的的铁汉,永远深耕不辍
在对话交互领域仍是卓有竖立的他,被问到为什么再行想考多模态当然交互这一命题,以及看到了什么样新的契机时,他纠合我方十几年的询查心路历程,共享了我方的想考与感悟。
2015-2020期间,黄讲明注解一直戮力于处置怒放域对话生成的难题。同期期,海外上开展同类询查的惟一FAIR(meta公司)和Google的LaMDA团队。但因为那时的生成模子很小,中语怒放域对话数据的鸿沟也额外有限,无论怎样悉力都难达到称心的效果。他的另一部分团队成员还在攻克任务导向对话系统的泛化性和移动性的难题。在小模子期间,订宾馆、订餐、订机票这样的任务对话系统,都普遍靠近任务移动难,很难泛化到未知场景的难题。从模态的角度来说,这些服务局限在text in、text out的形态上,距离真的的语音当然交互依然较远。
2020年GPT3问世,开启了大说话模子期间的新篇章。2022年,ChatGPT第一次把怒放域对话(谈天),教导驯顺、任务对话(摘录、写稿、解题等)和谐在一个模子中。在黄讲明注解看来,这其实是怒放域对话和任务对话的竣工和谐,亦然他往常莫得猜度的。而2026年的今天,大模子仍是具备了更多器用调用、复杂任务本质的才气,在许多无为的场景和任务中达到了接近AGI的水平。
那接下来对话交互还有什么新的契机呢?黄讲明注解觉得,一个是“类东谈主心智“,一个是模态。前者,强调是否好像像东谈主雷同通晓默契、心理和行径,像东谈主雷同进行心智推理,通晓“理性”背后“理性”的部分。后者,把对话交互从文本模态扩张到语音模态、视觉模态,带来更泛在、更当然的体验,而这也必将成为AGI期间的势必趋势。例如来说,团结个任务,text GPT能作念到85%,而最强的Grok voice think fast语音智能体只可作念到67.3%,这之间还有宽阔的鸿沟。
黄讲明注解觉得,从文本对话系统,到语音对话系统,再到多模态对话系统,这是再当然不外的继承和发展了。他把对话交互的内容追溯得三言两语:无论什么模态,最进攻的事情是通晓(感知),抓续倾听(全双工在线),主动交互(计谋+抒发)。而这,恰是他十几年一直在作念的事情。
“任何一个端侧征战都需要语音交互功能,任何一个Agentic AI都需要一个多模态交互层,这将架设起东谈主和机器之间无缝联贯的桥梁——此时此刻,你不是和一个机器鄙人敕令,你是和一个伙伴、致使你性掷中的一部分在沿路合营。”在黄讲明注解说,在他眼里,这才是AI下半场必须作念的大事之一。
03.作念阿谁把“畴昔感”变成“可用性”的贯穿器
在外界看来,被智谱华章全资收购,仍是是创业故事里满盈圆满的答卷:清华团队、手艺源流、老本加抓、人人大模子第一股布局中的进攻板块。
但对黄民烈讲明注解而言,履历了手艺、家具和生意的完整雕琢之后,他也启动想考:履历了大模子的上半场,在接下来5-10年的下半场里,又该作念点什么呢?
谜底越来越了了:他想作念的,是从基础大模子再行登程,再行界说”AI+东谈主性+场景“的全新范式,朝着具备类东谈专揽解、想考与抒发才气的AGI当然交互打算迈进。这条发展旅途有着了了且一脉疏浚的计划:现阶段聆芯智语将聚焦深耕语音大模子与及时全双工交互模子,筑牢东谈主机交互中枢底座,在此基础上,抓续迭代升级,畴昔全面拓展至视觉多模态手艺领域,一步步解锁下一代东谈主机交互的全新形态。
黄讲明注解投诚,畴昔的AI不应仅仅一个恭候教导的器用,而应该成为好像抓续通晓用户、追随用户、与用户共同成长的智能伙伴。大模子期间真的的契机,也不仅仅再造一个更强的模子,而是再行界说东谈主与智能体之间的贯穿神气,将东谈主机交互从“器用使用”走向“商酌成立”,从“机器属性”走向“深度合营与会通”。如今,怀揣通用东谈主工智能(AGI)的愿景,聆芯智语追究启动融资进度,责任就是让东谈主工智能不仅有“才略”,更有与东谈主类雷同的“心智”,通晓、倾听和主动交互,成为东谈主类性掷中当然的一部分。

