近期工作的若干项目页
以下条目以简明方式概括近期工作,后续可为精选页面补充更多材料。
Listening or Reading? An Empirical Study of Modality Importance Analysis Across AQA Question Types
案例研究:音频问答系统在不同题型上更依赖声学证据,还是文本或上下文捷径。
不同题型对音频的依赖有何不同?
对比 6 类 AQA 题型,检视模型是否真正在“听”。
Real aggregated accuracy from your experiment, averaged across the available seeds for this question type.
No material change. Remains strong without audio.
No material change. Useful as a reference point in the sweep.
+5.4 pts vs text-only. Improves when audio contributes more.
ECHOTWIN-QA: A Dual-Tower BEATSBERT System for DCASE 2025 Task 5
为 DCASE 2025 挑战赛搭建的端到端音频问答系统,包含从零开始的训练、评测与消融实验。
Expressive Timing Modelling in Performed Classical Piano Music
暑期本科生研究项目:通过计算建模探索古典钢琴演奏中的表现力时值(expressive timing)。
精选论文与报告
近期工作的精简列表,含会议/期刊、年份、贡献摘要与链接。
ECHOTWIN-QA: A Dual-Tower BEATSBERT System for DCASE 2025 Task 5 Audio Question Answering
DCASE 2025 Challenge (Task 5)
Zeyu Yin, Ziyang Zhou, Yiqiang Cai, Shengchen Li, Xi Shao
从零搭建端到端 AQA 系统,完成训练与评测流程、消融实验并撰写技术报告。
ADAPTF-SEPNET: AudioSet-Driven Adaptive Pre-training of TF-SEPNet for Multi-device Acoustic Scene Classification
DCASE 2025 Challenge
Ziyang Zhou, Zeyu Yin, Yiqiang Cai, Shengchen Li, Xi Shao
参与模型开发与实验评测,并支持结果分析与文稿撰写。
当前研究主题
工作围绕音频问答、层次化表示、评测与鲁棒性等相互关联的问题展开。
清晰的问题、统一的评测与审慎的诊断。
本站汇集已发表工作、进行中的研究主题,以及一个可扩展的案例研究页面(后续可加入图表、消融与交互分析)。
学术路径
近期角色与节点的概览,帮助理解当前研究兴趣的脉络。
DCASE 2025 参赛与科研
搭建端到端 AQA 系统,并按题型分析模态重要性
研讨会与挑战赛论文
参与音频问答相关项目的设计、实验、消融与写作
SURF 本科生研究员
在西浦开展古典钢琴演奏表现力时值建模研究
学业优秀奖获得者
获校级学业优秀奖及全额奖学金支持