Martin Saveski

Publications

Most recent publications on Google Scholar.
^‡ indicates equal contribution.

Selected
All

CoQuIR: A Comprehensive Benchmark for Code Quality-Aware Information Retrieval

Jiahui Geng^*, Fengyu Cai^*, Shaobo Cui, Qing Li, Liangwei Chen, Chenyang Lyu, Haonan Li, Derui Zhu, Walter Pretschner, Heinz Koeppl, Fakhri Karray

ACL 2026 Main Conference (to be appeared)

Paper

Revela: Dense Retriever Learning via Language Modeling

Fengyu Cai, Tong Chen, Xinran Zhao, Sihao Chen, Hongming Zhang, Sherry Tongshuang Wu, Iryna Gurevych, Heinz Koeppl

ICLR 2026

Paper

Knowledge Graph–Augmented DNA Representation Learning

Fengyu Cai^*, Erik Kubaczka^*, Shaobo Cui, Heinz Koeppl

ICML 2025 Workshop on Multi-modal Foundation Models and LLMs for Life Sciences

Paper

MoR: Better Handling Diverse Queries with a Mixture of Sparse, Dense, and Human Retrievers

Jushaan Singh Kalra, Xinran Zhao, To Eun Kim, Fengyu Cai, Fernando Diaz, Tongshuang Wu

EMNLP 2025 Main Conference

Paper

A Comprehensive Survey of Machine Unlearning Techniques for Large Language Models

Jiahui Geng, Qing Li, Herbert Woisetschlaeger, Zongxiong Chen, Fengyu Cai, Yuxia Wang, Preslav Nakov, Hans-Arno Jacobsen, Fakhri Karray

In submission

Paper

MixGR:Enhancing Retriever Generalization for Scientific Domain through Complementary Granularity

Fengyu Cai, Xinran Zhao, Tong Chen, Sihao Chen, Hongming Zhang, Iryna Gurevych, Heinz Koeppl

EMNLP 2024 Main Conference

Paper

Finetuning Large Language Model for Personalized Ranking

Zhuoxi Bai, Ning Wu, Fengyu Cai, Xinyi Zhu, Yun Xiong

2024 ACM International Conference on Information and Knowledge Management (CIKM 2024)

Paper

GeoHard: Towards Measuring Class-wise Hardness through Modelling Class Semantics

Fengyu Cai, Xinran Zhao, Hongming Zhang, Iryna Gurevych, Heinz Koeppl

ACL 2024 Findings

Paper

A Survey of Confidence Estimation and Calibration in Large Language Models

Jiahui Geng, Fengyu Cai, Yuxia Wang, Heinz Koeppl, Preslav Nakov, Iryna Gurevych

NAACL 2024 Main Conference

Paper

SLIM: Explicit Slot-Intent Mapping with BERT for Joint Multi-Intent Detection and Slot Filling

Fengyu Cai, Wanhao Zhou, Fei Mi, Boi Faltings

ICASSP 2022: the 2022 IEEE Internal Conference on Acoustics, Speech and Signal Processing

Paper

Self-training Improves Pre-training for Few-shot Learning in Task-oritented Dialogue Systems

Fei Mi, Wanhao Zhou, Fengyu Cai, Lingjing Kong, Minglie Huang, Boi Faltings

EMNLP 2021: the 2021 Conference on Empirical Methods in Natural Language Processing

Paper

CRASH: A Collaborative Aerial-Ground Exploration System Using Hybrid-Frontier Method

Luqi Wang, Fei Gao, Fengyu Cai, Shaojie Shen

ROBIO 2018: 2018 IEEE International Conference on Robotics and Biomimetics

Paper

A collaborative aerial-ground robotic system for fast exploration

Luqi Wang, Daqian Cheng, Fei Gao, Fengyu Cai, Jixin Guo, Mengxiang Lin, Shaojie Shen

Proceedings of the 2018 International Symposium on Exxperimental Robotics

Paper

CoQuIR: A Comprehensive Benchmark for Code Quality-Aware Information Retrieval

Jiahui Geng^*, Fengyu Cai^*, Shaobo Cui, Qing Li, Liangwei Chen, Chenyang Lyu, Haonan Li, Derui Zhu, Walter Pretschner, Heinz Koeppl, Fakhri Karray

ACL 2026 Main Conference (to be appeared)

Paper

Revela: Dense Retriever Learning via Language Modeling

Fengyu Cai, Tong Chen, Xinran Zhao, Sihao Chen, Hongming Zhang, Sherry Tongshuang Wu, Iryna Gurevych, Heinz Koeppl

ICLR 2026

Paper

Knowledge Graph–Augmented DNA Representation Learning

Fengyu Cai^*, Erik Kubaczka^*, Shaobo Cui, Heinz Koeppl

ICML 2025 Workshop on Multi-modal Foundation Models and LLMs for Life Sciences

Paper

MoR: Better Handling Diverse Queries with a Mixture of Sparse, Dense, and Human Retrievers

Jushaan Singh Kalra, Xinran Zhao, To Eun Kim, Fengyu Cai, Fernando Diaz, Tongshuang Wu

EMNLP 2025 Main Conference

Paper

A Comprehensive Survey of Machine Unlearning Techniques for Large Language Models

Jiahui Geng, Qing Li, Herbert Woisetschlaeger, Zongxiong Chen, Fengyu Cai, Yuxia Wang, Preslav Nakov, Hans-Arno Jacobsen, Fakhri Karray

In submission

Paper

MixGR:Enhancing Retriever Generalization for Scientific Domain through Complementary Granularity

Fengyu Cai, Xinran Zhao, Tong Chen, Sihao Chen, Hongming Zhang, Iryna Gurevych, Heinz Koeppl

EMNLP 2024 Main Conference

Paper

Finetuning Large Language Model for Personalized Ranking

Zhuoxi Bai, Ning Wu, Fengyu Cai, Xinyi Zhu, Yun Xiong

2024 ACM International Conference on Information and Knowledge Management (CIKM 2024)

Paper

GeoHard: Towards Measuring Class-wise Hardness through Modelling Class Semantics

Fengyu Cai, Xinran Zhao, Hongming Zhang, Iryna Gurevych, Heinz Koeppl

ACL 2024 Findings

Paper

A Survey of Confidence Estimation and Calibration in Large Language Models

Jiahui Geng, Fengyu Cai, Yuxia Wang, Heinz Koeppl, Preslav Nakov, Iryna Gurevych

NAACL 2024 Main Conference

Paper

SLIM: Explicit Slot-Intent Mapping with BERT for Joint Multi-Intent Detection and Slot Filling

Fengyu Cai, Wanhao Zhou, Fei Mi, Boi Faltings

ICASSP 2022: the 2022 IEEE Internal Conference on Acoustics, Speech and Signal Processing

Paper

Self-training Improves Pre-training for Few-shot Learning in Task-oritented Dialogue Systems

Fei Mi, Wanhao Zhou, Fengyu Cai, Lingjing Kong, Minglie Huang, Boi Faltings

EMNLP 2021: the 2021 Conference on Empirical Methods in Natural Language Processing

Paper

CRASH: A Collaborative Aerial-Ground Exploration System Using Hybrid-Frontier Method

Luqi Wang, Fei Gao, Fengyu Cai, Shaojie Shen

ROBIO 2018: 2018 IEEE International Conference on Robotics and Biomimetics

Paper

A collaborative aerial-ground robotic system for fast exploration

Luqi Wang, Daqian Cheng, Fei Gao, Fengyu Cai, Jixin Guo, Mengxiang Lin, Shaojie Shen

Proceedings of the 2018 International Symposium on Exxperimental Robotics

Paper

Fengyu Cai

Bio

Publications

Vitæ

Acknowledgement