基本情况
张晓丹,副教授,硕士生导师。2018年6月获中国科学院大学和香港城市大学双博士学位,于2018年7月加入北京工业大学计算机学院与北京人工智能研究院,主要进行包括计算机视觉与自然语言处理在内的人工智能领域关键技术理论和应用研究,目前在IEEE TIP、Pattern Recognition、AAAI、ACM MM、EMNLP、COLING等国际知名期刊和会议上发表论文30余篇。主持并参与多项国家自然科学基金项目,2022年获得北京市高层次留学人才回国资助。
个人主页:https://zhangxiaodan-bjut.github.io/
主要研究方向
计算机视觉、自然语言处理、多模态大模型等。
教育背景:
2015/09-2018/06,香港城市大学,计算机应用技术专业,博士(联培)
2014/09-2018/06,中国科学院大学,计算机应用技术专业,博士
2010/09-2014/06,中国科学院大学,计算机应用技术专业,硕士
2006/09-2010/06,郑州大学,生物医学工程专业,学士
课程教学
学术前沿、学术写作
主要科研项目
1.国家自然科学基金青年项目,基于脑血管疾病颅脑影像的医学报告自动生成及病灶定位研究,主持。
2.北京市教育委员会科技计划一般项目,基于时序三维影像的病变趋势预测报告生成方法研究,主持。
3.国家自然科学基金联合基金项目重点支持项目,面向社会媒体信息的视觉协同计算与聚焦推理,参与。
代表性成果(一作及通讯论文):
1.Xiaodan Zhang, Aozhe Jia, Junzhong Ji, Liangqiong Qu and Qixiang Ye. Intra- and Inter-Head Orthogonal Attention for Image Captioning. IEEE Transactions on Image Processing (IEEE TIP). 2025, 34: 594-607. (CCF A, 中科院一区期刊)
2.Xiaodan Zhang, Yanzhao Shi, Junzhong Ji, Chengxin Zheng, Liangqiong Qu. MEPNet: Medical Entity-balanced Prompting Network for Brain CT Report Generation. The 39th Annual AAAI Conference on Artificial Intelligence (AAAI) 2025.(CCF A, 人工智能领域顶会)
3.Chengxin Zheng, Junzhong Ji, Yanzhao Shi, Xiaodan Zhang*, Liangqiong Qu. See Detail Say Clear: Towards Brain CT Report Generation via Pathological Clue-driven Representation Learning. In Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2024: 16542–16552 (NLP领域顶会, CAAI-A, CCF-B)
4.Xiaodan Zhang, Shixin Dou, Junzhong Ji, Ying Liu, Zheng Wang. Co-occurrence Relationship Driven Hierarchical Attention Network for Brain CT Report Generation. IEEE Transactions on Emerging Topics in Computational Intelligence. 2024, 5(8):3643-3653. (SCI一区期刊)
5.Xiaodan Zhang, Sisi Yang, Yanzhao Shi, Junzhong Ji, Ying Liu, Zheng Wang, Huimin Xu; Weakly Guided Attention Model with Hierarchical Interaction for Brain CT Report Generation, Computers in Biology and Medicine (CIBM), 2023:107650. (中科院一区期刊)
6.Yanzhao Shi, Junzhong Ji, Xiaodan Zhang*, Liangqiong Qu, and Ying Liu. Granularity Matters: Pathological Graph-driven Cross-modal Alignment for Brain CT Report Generation. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2023:6617–6630. (NLP领域顶会, CAAI-A, CCF B)
7.Junzhong Ji, Zhuoran Du, Xiaodan Zhang*. Divergent-convergent Attention for Image Captioning. Pattern Recognition, 2021 (115): 107928. (中科院一区期刊)
8.Junzhong Ji, Cheng Xu, Xiaodan Zhang*, Boyue Wang, Xinhang Song. Spatio-temporal Memory Attention for Image Captioning. IEEE Transactions on Image Processing (IEEE TIP), 2020 (29): 7615-7628. (CCF-A, 中科院一区期刊)
学术服务
1. 国际会议程序委员会成员/审稿人:CVPR 2025-, AAAI 2025-, ACL ARR 2025-, ICCV 2025-, NeurIPS 2024-, CVPR 2024-, ACL ARR 2024-, ACM MM 2024-.
2. 国际期刊审稿人:IEEE TIP, IEEE TCSVT, Pattern Recognition, Neurocomputing.
联系方式:
1.E-mail: zhangxiaodan@bjut.edu.cn
2.地址:北京市朝阳区北京工业大学理科楼 北京人工智能研究院M812
实验室现有NVIDIA深度学习服务器若干,欢迎计算机、数学等相关专业有志于科研的同学报考,优先考虑有一定深度学习基础和编程能力强的同学,来信请注明英语六级或雅思、托福成绩。实验室正处于高速发展阶段,希望大家一起努力进步!