0131四篇论文入选ICLR 2026国际顶会!
创始人
2026-01-31 19:00:32
0

AI学会主动追问 千问C端应用团队ICLR 2026连中四篇论文

当AI助手越来越多地参与到学习、工作辅助、医疗咨询等生活场景,能否稳定输出、是否懂得追问关键信息,正成为衡量AI能力的重要标准。

1月30日消息,千问C端应用团队的四篇人工智能领域研究论文入选2026国际学习表征会议(ICLR 2026),论文聚焦扩散模型训练、多轮对话决策、信息验证及模型价值观对齐等关键问题,部分成果已有实际应用,推动AI助手在复杂场景下更加聪明、可靠、实用。

ICLR与NeurIPS、ICML并称为机器学习和人工智能领域三大顶级国际会议。本届会议投稿量接近19000篇,接收率创下近年来新低。

本次四篇论文在多个前沿领域取得创新突破。在扩散语言模型(Diffusion Models)研究方面,千问C端应用团队针对dLLM独特的掩码训练不稳定性,将其系统分解为了三种不同的噪声来源,并相应提出帕累托最优的无偏训练算法。该算法显著降低了dLLM的训练波动、进而提升其图文生成质量。这意味着在内容生成、创作辅助等应用中,AI输出将更加稳定。

围绕医疗多轮对话中的复杂推理任务,团队提出了自适应树策略优化(ATPO)方法,使AI能够根据对话中的不确定性动态调整决策路径。当信息不足时,AI会主动追问关键问题;当线索清晰时,则快速给出判断。这一能力可帮助AI助手在医疗咨询等专业场景学会“主动问诊”,让AI像经验丰富的医生一样,只问最关键的问题,避免无用的来回对话。

在信息检索与验证方面,研究团队构建了“提问—解答—验证”的自博弈强化学习框架,使AI在无需人工标注的情况下不断自我验证与进化。这一机制有助于提升AI在复杂问题下的检索与核验能力,在学习辅助、研究支持等知识密集型场景中表现更为可靠。

此外,在模型价值观对齐研究中,团队引入信息论偏见消除方法,引导奖励模型关注真正与人类偏好相关的信号,减少冗长、格式化但信息密度不高的输出。这使得AI在训练过程中真正关注能够帮助到用户的核心要点,降低模型输出中出现“表面迎合但缺乏实质内容价值”的情况。

业内专家指出,当前大模型竞争正从“参数规模”转向“算法深度与工程实效”。千问C端应用团队在生成稳定性、多轮对话决策和模型对齐等方向上的系统性探索,体现了其在基础算法与应用导向研究上的持续投入。

值得一提的是,此次千问C端应用团队入选 ICLR 2026 的四篇论文相关代码均已开源。通过开放核心实现细节,将为行业在提升AI可用性、可靠性方面提供有益参考。

相关内容

热门资讯

【青蓝讲堂第12期】“辐”光掠... 2月27日,湛江青蓝讲堂第12期在市生态环境局举行。市生态环境局环境监测与辐射管理科科长杨丹霞以《“...
新漫传感申请α谱仪系统专利,实... 国家知识产权局信息显示,上海新漫传感科技有限公司申请一项名为“α谱仪系统、控制方法、存储介质及产品”...
字节跳动在内蒙古成立3家新科技... 近日,呼和浩特塞北云基科技有限公司、呼和浩特塞北盛乐科技有限公司、乌兰察布雁北知微科技有限公司成立,...
金奥博获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示金奥博(002917)新获得一项发明专利授权,专利名为“一种液...
内存涨价潮波及手机终端市场 来源:科技日报 2月27日,魅族公司宣布暂停国内手机新产品自研硬件,公告表示“近来内存价格的持续暴涨...
NASA调整载人登月计划 此前... 来源:财联社 就在载人绕月计划因火箭不断“漏气”一再延迟之际,美国国家航空航天局(NASA)周五宣布...
浙江远大玻纤取得浸胶纤维绞丝机... 国家知识产权局信息显示,浙江远大玻纤网有限公司取得一项名为“浸胶纤维绞丝机构”的专利,授权公告号CN...
魅族输掉市场确实是事实,但给所... 要说清楚魅族,必须要认识黄章,这哥们儿不是传统意义上的CEO,是个把"工匠精神"刻进DNA的产品经理...
技术进步给就业领域带来哪些影响... 以往历次工业革命主要以物质设备和信息替代体力和部分脑力劳动,技术进步集中于生产工具、能源利用、信息资...
小型河道水质监测站(太阳能供电... 水利工程研究人员指出小型河道是水环境治理的重要组成部分,其分布散、周边基建薄弱的特点让传统站房式水质...