您当前所在的位置: 网站首页 -> 新闻动态 -> 正文

【计算机丨科研】计算机学院在国际顶级会议KDD2025、FAST2025、AAAI2025发表多项工作成果

发布日期:2024-12-27   来源:   点击量:

北京工业大学计算机学院

工作信息

2024年 第93期




近日,数据库、数据挖掘及内容检索领域顶级会议“知识发现与数据挖掘大会”ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD),计算机体系结构、并行与分布计算及存储系统领域顶级会议“文件和存储技术大会” The USENIX Conference on File and Storage Technologies (FAST),人工智能领域国际顶级会议“人工智能促进会” Association for the Advancement of Artificial Intelligence (AAAI)公布了2025年论文录用结果,计算机学院捷报频传,计算机科学与技术系冀俊忠教授团队、方娟教授团队四篇论文分别被KDD 2025、FAST2025和AAAI 2025录用,第一作者分别为我院学生熊雯、周文斌、何思成和青年教师张晓丹,通讯作者分别为刘金铎、王茜、雷名龙和冀俊忠。

论文《Brain Effective Connectivity Estimation via Fourier Spatiotemporal Attention》被KDD2025录用,展示了团队在脑效应连接网络学习领域的最新研究成果。现有的脑效应连接学习方法通常采用分离的方式提取功能磁共振成像(fMRI)数据的时间依赖和空间特征,忽略了现实世界中fMRI数据统一的时空相关性。此外,fMRI数据中的高噪声水平进一步限制了现有方法的性能。针对上述问题,本文提出了一种基于傅里叶时空注意力的脑效应连接学习方法(Fourier spatiotemporal attention, FSTA-EC)。具体来说,该方法首先利用傅里叶注意力将高噪声的fMRI数据转换到频域。然后,通过一个可学习的滤波器来自适应地学习与大脑活动相关的频率成分,并将去噪后的fMRI数据映射回物理域。最后,利用时空注意力机制将时间注意力和空间注意力融合在一个统一的框架中,进而同时学习fMRI数据的空间动态和序列内的时间依赖关系,实现时间特征与节点间空间关系的深度融合。在模拟数据和真实数据集上的实验结果表明,该方法在脑效应连接学习及其下游任务(脑疾病诊断)中均表现出优异的性能。

图1 FSTA-EC方法

论文《3L-CACHE: Low Overhead and Precise Learning-based Eviction Policy for Web Caches》被FAST2025录用,展示了团队在缓存领域的最新研究成果。该工作针对学习类缓存驱逐策略因计算开销过高而在生产系统难部署问题,提出了3L-Cache,一种低开销且低丢失率的学习类驱逐策略。该工作首次发现了对象级学习策略在具有实现最低字节丢失率和对象丢失率潜力的同时,也存在显著的减少计算开销的空间。由此,提出了一种训练数据采集方法,通过滤掉不必要的历史缓存请求,实现训练频率的动态调整,同时不影响训练准确性。此外,我们还提出了一种对象驱逐方法以显著降低预测开销,包括增加驱逐候选对象中不流行对象的比例的双向采样策略,以及高效的对象驱逐策略;并且,设计了一个参数自动调整模块增加3L-Cache对于不同trace的泛用性。我们在4855个生产traces上评估3L-Cache的性能,与HALP相比平均CPU开销减少了60.9%,与LRB相比减少了94.9%;3L-Cache的开销达到了与启发式策略相同的数量级,同时在七种最新的策略中丢失率最低。

图23L-Cache 架构

论文《Decomposed Spatio-Temporal Mamba for Long-Term Traffic Prediction》被AAAI 2025录用,展示了团队在交通预测领域的最新研究成果。本文针对当前方法在长时交通预测任务中存在的时空关系建模不足、计算效率不高的问题,提出了一种基于解耦Mamba的交通预测方法。该方法结合空间双向Mamba与时间线性模型提取周期性与趋势性时空信息,不仅能够有效地建模交通数据中的长距离时空依赖,还能维持较高的计算效率。多个交通数据集的实验结果验证了所提模型的有效性。

图3基于解耦Mamba的交通预测方法

论文《MEPNet: Medical Entity-balanced Prompting Network for Brain CT Report Generation》被AAAI 2025录取,展示了团队在医学报告自动生成领域的最新研究成果。自动生成脑CT诊断报告有助于辅助医生诊断颅脑疾病,具有重要的研究意义和应用价值。由于不同医学实体在视觉分布上存在显著差异,导致模型难以均衡地学习多样的病理信息。针对这一问题,本文提出了一种面向脑CT报告自动生成任务的医学实体平衡提示网络(MEPNet)。该方法通过引入医学实体的视觉嵌入和学习状态作为辅助线索,引导大型语言模型(LLM)平衡地学习多样的医学实体,从而有效提升脑CT报告的生成质量。在多个脑CT报告生成基准数据集上的实验表明,所提方法生成的报告在临床准确性和文本连贯性上具有显著效果。

图4MEPNet 方法

KDD是数据库、数据挖掘及内容检索领域顶级会议,FAST是计算机体系结构、并行与分布计算及存储系统领域顶级会议,AAAI是人工智能领域国际顶级会议,均为CCF-A类推荐会议,具有极高的国际影响力。这些会议每年都汇聚全球顶尖学者与产业领袖,通过展示最前沿的研究成果推动相应领域研究的不断突破。

    计算机学院此次有多项研究成果录用,展现了学院在这些领域的研究水平和实力。这不仅有助于提升学院在国际学术界的影响力,也为相关研究方向的发展注入了新的动力,有望进一步推动计算机科学与技术学科的进步和发展。