学术科研

西安交通大学孟德宇教授作题为“数据自动筛选-从算法到理论”学术报告

发布日期:2024-10-27 发表者:陈治国 浏览次数:



   (文|李伟夫 编辑|辛西 审核|陈洪)10月21日上午,bat365正版唯一官网“Happy Hour”第14期学术交流会在一综B316举行。西安交通大学孟德宇教授作了题为“数据自动筛选-从算法到理论”的学术报告。报告吸引众多师生参与。

   孟德宇教授目前聚焦于元学习、概率机器学习、可解释神经网络等机器学习基础问题研究,发表论文百余篇,谷歌学术引用超过31000次,现任中国工业与应用数学学会副理事长,CSIAM青年工作委员会主任,IEEE TPAMI,Science China:Information Sciences等7个国内外期刊编委,入选国家级人才计划、国家级青年人才计划,曾获陕西省科学技术一等奖,陕西省青年科技奖等。

   孟德宇教授的报告从大模型预训练数据的质量问题切入,介绍了其在元学习方面一系列研究工作。孟教授指出,数据质量是影响模型性能的关键因素之一。然而,手工筛选高质量数据费时费力,难以适应大数据场景需求。因此,实现数据自动筛选具有重要理论意义和应用价值。基于此,他首先介绍了如何依据各类数据的误差值进行损失加权,动态平衡不同数据在模型训练中的影响,实现自动数据筛选,孟德宇教授进而细致分析了Meta-Weight-Net及Class-aware Meta-Weight-Net两种超参学习的双层优化框架,展示了其在数据不均衡、噪声标记数据等情形的优异性能。然后,从更宏观视角,他解释了模拟学习方法论的建模、理论分析与应用的基本路径。最后,孟教授探讨了双层优化视角下元学习框架的统计学习理论基础。

   报告结束,孟德宇教授耐心解答了师生关于大模型效能、元学习数学基础、元学习农业应用等问题,并分享了相关研究思路。