活动新闻

赴新西兰参加ACM Multimedia Asia 2024出访总结

发布单位：北石化人工智能研究院发布日期：2024年12月10日

一、基本信息

2024年12月3日至12月7日，北京石油化工学院人工智能研究院王文通老师赴新西兰奥克兰参加ACM Multimedia Asia 2024国际学术会议。本次出访的核心目的是展示研究成果、了解多媒体技术领域的前沿动态、推动国际学术合作。王文通老师在会议中担任了《口头报告16 – 多媒体应用 II》分论坛主席，硕士生刘子强进行了论文报告，与国际学者广泛交流，圆满完成出访任务。

主要目的：

1. 宣传北京石油化工学院及科研成就

在ACM Multimedia Asia这一国际顶尖学术平台，展示北京石油化工学院在多模态知识图谱与动作（手语）生成领域的研究成果，提升学校及研究院在国际学术界的知名度。

2. 拓展学术视野

通过聆听学术报告、参加分论坛等，了解多媒体技术的最新研究进展，包括多模态生成、多模态大模型、联邦学习等，为后续研究提供新方向和灵感。

3. 推动国际合作

与国际学术界同行深入探讨合作意向，尤其是在多模态学习与知识图谱构建等领域，探索学生联合培养、教师互访等合作模式，为进一步推动国际合作奠定基础。

二、公务活动情况

第1天：12月3日，北京-奥克兰

凌晨1:15，王文通老师从北京首都国际机场搭乘国航CA783航班，前往新西兰奥克兰。下午18:35，抵达奥克兰国际机场，完成入境手续后前往酒店办理入住，并进行行程准备，为次日会议做好准备。

第2天：12月4日，奥克兰

上午，王文通老师前往奥克兰大学工程学院参加ACM Multimedia Asia 2024会议的注册和开幕式（图1），并聆听了清华大学Wenwu Zhu教授关于《Multimodal Generative AI in Dynamic and Open Environments》的主旨报告（图2），了解生成式AI在多模态动态环境中的技术挑战与应用前景。随后，他参加了《口头报告1 - 精选论文》分论坛，深入学习了多模态对齐、情感估计等领域的最新研究成果（图3）。下午，王文通老师继续参与学术活动，先后聆听了《口头报告2 – 多媒体深度学习I》（图4）和《口头报告5 – 多模态分析与描述II》（图5），内容涵盖深度学习在多媒体数据处理中的应用、手势识别以及多模态对齐方法等，进一步拓宽了研究视野。期间，他还参与了《海报论文环节1》（图6），与作者就深度伪造检测、低光图像增强等技术展开深入交流，收获了许多宝贵的研究思路。

图1大会主席梅西大学Ruili Wang教授主持会议开幕式

图2聆听清华大学Wenwu Zhu教授主旨报告

图3聆听日本九州大学Shun Katada的论文报告

图4聆听浙江大学Luhao Zhu的论文报告

图5聆听新加坡南洋理工大学Meng Shen的论文报告

图6参加《海报论文环节1》讨论

第3天：12月5日，奥克兰

上午，王文通老师首先聆听了美国伊利诺伊大学Klara Nahrstedt教授的主旨报告《End-to-End System and Networking Challenges of Multi-View Video Systems》（图7），深入探索了多视角视频系统的优化问题。随后，他参加了《口头报告10 – 多模态分析与描述III》分论坛（图8），报告内容涵盖视频摘要生成以及大模型在多模态分析中的最新应用，为相关研究提供了新思路。下午，王文通老师重点参与了多媒体人机交互和多模态推荐领域的学术交流。他聆听了《口头报告11 – 多媒体HCI和体验质量》（图9）和《海报论文环节2》（图10），深入了解人机手势生成、3D人类重建等研究进展，并担任《口头报告16 – 多媒体应用 II》分论坛主席（图11），主持并组织了关于医学图像分割、老电影上色及手语知识图谱构建等多个领域的学术讨论。期间，硕士生刘子强以《Multimodal Sign Language Knowledge Graph and Representation: Text, Video KeyFrames, and Motion Trajectories》为题作了报告（图12），全面展示了多模态手语知识图谱的构建及其在手语生成中的实践成果，获得了与会学者的热烈讨论与高度评价。

图7聆听美国伊利诺伊大学Klara Nahrstedt教授的主旨报告

图8聆听东北大学Dongming Chen教授的论文报告

图9聆听自动化研究所Zeyu Zhao的论文报告

图10参加《海报论文环节2》讨论

图11王文通老师担任《口头报告16 – 多媒体应用 II》分论坛主席

图12硕士生刘子强作口头报告

第4天：12月6日，奥克兰

上午，王文通老师继续参与会议的高水平学术活动，首先聆听了南洋理工大学Yonggang Wen教授的主旨报告《EasyFL: Optimising Federated Learning for Computer Vision Applications》（图13），学习了联邦学习在视觉任务中的优化策略。随后，他聆听了《口头报告17 – 多媒体中的音乐与音频处理》分论坛（图14），报告涵盖了音频情感分析、文本到语音生成等领域的最新研究进展。下午，王文通老师结束了会议的学术活动，随后于20:30从奥克兰国际机场搭乘国航CA784航班返回北京。

图13聆听南洋理工大学Yonggang Wen教授的主旨报告

图14聆听马来西亚多媒体大学Zheng-Xian Keh的论文报告

图15与硕士生刘子强会场合照

第5天：12月7日，北京

清晨5:00，王文通老师顺利抵达北京，圆满结束此次出访任务。

三、主要成果

1. 宣传成效显著

在会议期间，王文通老师团队通过论文报告和主持分论坛，全面展示了多模态知识图谱和手语生成的研究成果，得到了与会学者的高度评价。

2. 获取前沿信息

通过参与大会主旨报告、分论坛及海报展示环节，深入了解了多模态生成、多媒体系统优化等领域的最新技术趋势，为后续研究提供了宝贵参考。

3. 推动国际合作

与新加坡南洋理工大学、奥克兰大学及梅西大学等多位学者就智能交互、AIGC优化等问题进行了深入交流。

4. 提升国际学术影响力

通过担任分主席不仅提升了王文通老师的学术声誉，同时进一步提高了北京石油化工学院在国际学术界的影响力。

四、下一步计划

1. 深化学术合作

根据会议期间的讨论内容，进一步推动与新西兰及东南亚相关高校和研究机构的学术合作，争取联合申请研究基金。

2. 加强人才培养

借助国际合作机会，推动研究生与国际知名学者的联合培养，提升学生的学术水平和国际视野。

3. 持续跟踪前沿动态

通过参与类似国际学术会议，持续关注多模态人工智能与多媒体技术的学术动态，为学校科研建设和申博拓点做出贡献。

（编辑：王文通审核：王雨石批准：刘强）

内外资讯

活动新闻

赴新西兰参加ACM Multimedia Asia 2024出访总结