Yinghao Zhu (朱英豪)

Email: yhzhu99 [at] gmail [dot] com

About Me

I am an incoming PhD student at The University of Hong Kong, where I will be supervised by Prof. Lequan Yu. I also work closely with Prof. Liantao Ma at Peking University. My research primarily focuses on AI for Healthcare.

Research Interests

Medical Large Language Models (LLMs): Developing LLM agents and multimodal LLMs for diverse medical applications.
Healthcare Modeling: Clinical predictive modeling using multimodal electronic health record (EHR) data.
Healthcare Benchmarks, Toolkits & Platforms: Creating robust benchmarks, open-source toolkits, and accessible platforms to advance research in the healthcare community.
Trustworthy AI: Focusing on explainability, fairness, and robustness of AI models in critical healthcare scenarios.

Education

The University of Hong Kong School of Computing and Data Science, Hong Kong SAR, China

2025.07 -

PhD Student, supervised by Prof. Lequan Yu
Beihang University School of Artificial Intelligence, Beijing, China

2022.09 - 2025.01

M.Eng. in Artificial Intelligence, supervised by Prof. Chengwei Pan
Politecnico di Milano Milan, Italy

2024.02 - 2024.07

Exchange in Computer Science and Engineering
Beihang University School of Software, Beijing, China

2018.09 - 2022.06

B.Eng. in Software Engineering
Shanghai High School Shanghai, China

2015.09 - 2018.06

Professional Experience

Peking University School of Computer Science, Beijing, China

2023.09 - Present

External Research Advisor, working with Prof. Liantao Ma
Stanford University Stanford Casual Science Center, Remote

2024.03 - 2024.12

Research Assistant, advised by Prof. Yiqing Xu
University of Zurich & University Hospital Zurich KrauthammerLab, Zurich, Switzerland

2024.04 - 2024.12

Research Assistant, advised by Dr. Ahmed Allam and Prof. Michael Krauthammer
Children's Hospital of Fudan University Department of Radiology, Shanghai, China

2022.10 - 2023.12

Research Assistant, advised by Prof. Zhongwei Qiao
Peking University National Engineering Research Center for Software Engineering, Beijing, China

2021.05 - 2023.08

Research Assistant, advised by Prof. Yasha Wang

Publications(^*: Equal contribution, ^†: Corresponding author)

MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks Yinghao Zhu^*, Ziyi He^*, Haoran Hu^*, Xiaochen Zheng^*, Xichen Zhang, Zixiang Wang, Junyi Gao, Liantao Ma^†, Lequan Yu^† Preprint, 2025
PaperCodeWebsite
ClinicRealm: Re-evaluating Large Language Models with Conventional Machine Learning for Non-Generative Clinical Prediction Tasks Yinghao Zhu^*, Junyi Gao^*, Zixiang Wang^*, Weibin Liao^*, Xiaochen Zheng, Lifang Liang, Miguel O. Bernabeu, Yasha Wang, Lequan Yu, Chengwei Pan^†, Ewen M. Harrison^†, Liantao Ma^† Preprint, 2024
PaperCodeWebsite
AICare: An AI-Clinician Interaction System for Transparent and Actionable Clinical Decision Support Junyi Gao, Zixiang Wang, Dehao Sui, Wen Tang, Yasha Wang, Ling Wang, Liantao Ma, Yinghao Zhu The Symposium on Artificial Intelligence in Learning Health Systems (SAIL), Best abstract nominee, 2025
PaperWebsite
Foundation models and intelligent decision-making: Progress, challenges, and perspectives Jincai Huang, Yongjun Xu, Qi Wang, et al. The Innovation, 2025
Paper
Learnable Prompt as Pseudo-Imputation: Rethinking the Necessity of Traditional EHR Data Imputation in Downstream Clinical Prediction Weibin Liao, Yinghao Zhu, Zhongji Zhang, Yuhang Wang, Zixiang Wang, Xu Chu, Yasha Wang^†, Liantao Ma^† ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2025
PaperCode
Revolutionizing Newcomers' Onboarding Process in OSS Communities: The Future AI Mentor Xin Tan, Xiao Long, Yinghao Zhu, Lin Shi, Xiaoli Lian, Li Zhang^† ACM International Conference on the Foundations of Software Engineering (FSE), 2025
PaperCode
ColaCare: Enhancing Electronic Health Record Modeling through Large Language Model-Driven Multi-Agent Collaboration Zixiang Wang^*, Yinghao Zhu^*, Huiya Zhao^*, Xiaochen Zheng, Tianlong Wang, Wen Tang, Yasha Wang^†, Chengwei Pan, Ewen M. Harrison, Junyi Gao^†, Liantao Ma^† ACM International World Wide Web Conference (WWW), 2025
PaperCodeWebsite
Adaptive Activation Steering: A Tuning-Free LLM Truthfulness Improvement Method for Diverse Hallucinations Categories Tianlong Wang^*, Xianfeng Jiao^*, Yinghao Zhu, Zhongzhi Chen, Yifan He, Xu Chu, Junyi Gao, Yasha Wang, Liantao Ma^† ACM International World Wide Web Conference (WWW), 2025
PaperCode
Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models Xijie Huang^*, Xinyuan Wang^*, Hantao Zhang^*, Yinghao Zhu^*, Jiawen Xi, Jingkun An, Hao Wang, Hao Liang, Chengwei Pan^† Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2025
PaperCode
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation Jingkun An^*, Yinghao Zhu^*, Zongjian Li^*, Enshen Zhou, Haoran Feng, Xijie Huang, Bohua Chen, Yemin Shi, Chengwei Pan^† Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2025
PaperCodeDatasetWebsite
Protocol for Processing Multivariate Time-series Electronic Health Records of COVID-19 Patients Zixiang Wang^*, Yinghao Zhu^*, Dehao Sui, Tianlong Wang, Yuntao Zhang, Yasha Wang, Chengwei Pan, Junyi Gao^†, Liantao Ma^†, Ling Wang^†, Xiaoyun Zhang^† STAR Protocols, 2025
PaperCode
Exploring the Relationship Between Dietary Intake and Clinical Outcomes in Peritoneal Dialysis Patients Stratified by Serum Albumin Levels Yueying Wu^*, Junyi Gao^*, Wen Tang^†, Chunyan Su, Yinghao Zhu, Tianlong Wang, Ling Wang^†, Weibin Liao, Xu Chu, Yasha Wang^†, Xinju Zhao, Tao Wang, Ewen M. Harrison, Liantao Ma^† Health Data Science, 2025
PaperCode
Evaluation of radiomics as an assistant tool for radiologists in the diagnosis of necrotizing enterocolitis Chaogang Lu, Mingshu Yang, Yinghao Zhu, Yaqin Xia, Siqi Luo, Guang Yang, Mei Bai^†, Zhongwei Qiao^† Translational Pediatrics, 2025
Paper
EMERGE: Enhancing Multimodal Electronic Health Records Predictive Modeling with Retrieval-Augmented Generation Yinghao Zhu^*, Changyu Ren^*, Zixiang Wang, Xiaochen Zheng, Shiyun Xie, Junlan Feng, Xi Zhu, Zhoujun Li, Liantao Ma, Chengwei Pan^† ACM International Conference on Information and Knowledge Management (CIKM), 2024
PaperCodeVideo
PRISM: Mitigating EHR Data Sparsity via Learning from Missing Feature Calibrated Prototype Patient Representations Yinghao Zhu, Zixiang Wang, Long He, Shiyun Xie, Xiaochen Zheng, Liantao Ma^†, Chengwei Pan^† ACM International Conference on Information and Knowledge Management (CIKM), 2024
PaperCodeVideo
A Comprehensive Benchmark For COVID-19 Predictive Modeling Using Electronic Health Records in Intensive Care Junyi Gao^*, Yinghao Zhu^*, Wenqing Wang^*, Zixiang Wang, Guiying Dong, Wen Tang, Hao Wang, Yasha Wang, Ewen M. Harrison, Liantao Ma^† Cell Patterns, 2024
PaperCodeWebsite
Protocol to process follow-up electronic medical records of peritoneal dialysis patients to train AI models Tianlong Wang^*, Yinghao Zhu^*, Zixiang Wang, Wen Tang^†, Xinju Zhao, Tao Wang, Yasha Wang, Junyi Gao^†, Liantao Ma^†, Ling Wang^† STAR Protocols, 2024
PaperCode
Prediction of feeding difficulties in neonates with hypoxic-ischemic encephalopathy using magnetic resonance imaging-derived radiomics features Yaqin Xia, Mingshu Yang, Tianyang Qian, Jiayu Zhou, Mei Bai, Siqi Luo, Chaogang Lu, Yinghao Zhu, Laishuan Wang, Zhongwei Qiao^† Pediatric Radiology, 2024
Paper
EHRFlow: A Large Language Model-Driven Iterative Multi-Agent Electronic Health Record Data Analysis Workflow Hao Wu^*, Yinghao Zhu^*, Zixiang Wang, Xiaochen Zheng, Ling Wang, Wen Tang, Yasha Wang, Chengwei Pan, Ewen M. Harrison, Junyi Gao^†, Liantao Ma^† Artificial Intelligence and Data Science for Healthcare: Bridging Data-Centric AI and People-Centric Healthcare (KDD 2024 AIDSH Workshop), Oral, 2024
PaperCode
RetCare: Towards Interpretable Clinical Decision Making through LLM-Driven Medical Knowledge Retrieval Zixiang Wang^*, Yinghao Zhu^*, Junyi Gao, Xiaochen Zheng, Yuhui Zeng, Yifan He, Bowen Jiang, Wen Tang, Ewen M. Harrison, Chengwei Pan, Liantao Ma^†, Ling Wang^† Artificial Intelligence and Data Science for Healthcare: Bridging Data-Centric AI and People-Centric Healthcare (KDD 2024 AIDSH Workshop), 2024
PaperCode
DeepEST: A Python Library for Spatio-Temporal Epidemiology Prediction Yuhang Wang, Yinghao Zhu, Lifang Liang, Yasha Wang, Ewen M. Harrison, Liantao Ma, Junyi Gao^† Artificial Intelligence and Data Science for Healthcare: Bridging Data-Centric AI and People-Centric Healthcare (KDD 2024 AIDSH Workshop), 2024
PaperCode
PIGWN: Physics-Informed Graph WaveNet for Airport Flight Traffic Flow Prediction Zhichao Yang^*, Yinghao Zhu^*, Ziyue Niu, Yanru Huang, Chengwei Pan^†, Xiwang Dong International Conference on Industrial Artificial Intelligence (IAI), 2024
PaperCode
SuperGS: Super-Resolution 3D Gaussian Splatting Enhanced by Variational Residual Features and Uncertainty-Augmented Learning Shiyun Xie, Zhiru Wang, Xu Wang, Yinghao Zhu, Chengwei Pan^†, Xiwang Dong Preprint, 2024
PaperCode
Prompting Large Language Models for Zero-Shot Clinical Prediction with Structured Longitudinal Electronic Health Record Data Yinghao Zhu^*, Zixiang Wang^*, Junyi Gao, Yuning Tong, Jingkun An, Weibin Liao, Ewen M. Harrison, Liantao Ma^†, Chengwei Pan^† Preprint, 2024
PaperCode
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation Weibin Liao, Yinghao Zhu, Xinyuan Wang, Chengwei Pan, Yasha Wang^†, Liantao Ma^† Preprint, 2024
PaperCode
How far are AI-powered programming assistants from meeting developers' needs? Xin Tan, Xiao Long, Xianjun Ni, Yinghao Zhu, Jing Jiang, Li Zhang^† Preprint, 2024
Paper
Mortality Prediction with Adaptive Feature Importance Recalibration for Peritoneal Dialysis Patients Liantao Ma^*, Chaohe Zhang^*, Junyi Gao^*^†, Xianfeng Jiao, Zhihao Yu, Yinghao Zhu, Tianlong Wang, Xinyu Ma, Yasha Wang^†, Wen Tang^†, Xinju Zhao, Wenjie Ruan, Tao Wang Cell Patterns, Cover, 2023
PaperCode
M3Fair: Mitigating Bias in Healthcare Data through Multi-Level and Multi-Sensitive-Attribute Reweighting Method Junyi Gao^*, Yinghao Zhu^*, Wenqing Wang^*, Zixiang Wang, Guiying Dong, Wen Tang, Hao Wang, Yasha Wang, Ewen M. Harrison, Liantao Ma^† Beijing Health Data Science Summit 2023, Health Data Science (HDSS), Abstract, 2023
PaperCode
A Comprehensive Benchmark for COVID-19 Predictive Modeling Using Electronic Health Records in Intensive Care: Choosing the Best Model for COVID-19 Prognosis Junyi Gao^*, Yinghao Zhu^*, Wenqing Wang^*, Yasha Wang, Wen Tang, Liantao Ma^† American Medical Informatics Association (AMIA) Informatics Summit, Podium Abstract Track, Oral, 2023
PaperCode
Exploration of the feasibility of using examination time order to split small sample size data for radiomics Mingshu Yang, Zhongwei Qiao, Yinghao Zhu, Chaogang Lu, Yaqin Xia The Asian and Oceanic Society for Paediatric Radiology (AOSPR), Oral, 2023
Assessing the value of the radiomics model based on MRI of the wrist joint in predicting the use of biologics in JIA Mingshu Yang, Zhongwei Qiao, Yinghao Zhu, Chaogang Lu, Yaqin Xia The Asian and Oceanic Society for Paediatric Radiology (AOSPR), Oral, 2023
Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets Zhongji Zhang, Yuhang Wang, Yinghao Zhu, Xinyu Ma, Tianlong Wang, Chaohe Zhang, Yasha Wang^†, and Liantao Ma^† Preprint, 2023
PaperCode
M3Care: Learning with Missing Modalities in Multimodal Healthcare Data Chaohe Zhang^*, Xu Chu^*, Liantao Ma, Yinghao Zhu, Yasha Wang^†, Jiangtao Wang, Junfeng Zhao ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2022
PaperCode
Python Data Analysis Yunxiang Lyu, Zhipeng Wang, Lihua Xu, Zhaoyi Wang, Yinghao Zhu, Kun Yan, Shanzhao Qiu, Jiawei Tang, Kaiwen Feng, Wei Chen, Tianyi Chen, Zhendong Hong, Yunfei Yang, Jinman Xie, Zeliang Yao, Yangang Han, Yihang Wu Tsinghua University Press, 2023
Book
Big Data Visualization Techniques Yunxiang Lyu, Zeliang Yao, Jili Xie, Yinghao Zhu, Shanzhao Qiu, Yangang Han, Zehuan Huang Tsinghua University Press, 2023
Book
Theory and Practice of Artificial Intelligence Yunxiang Lyu, Luting Huang, Zezhong Liang, Wenzhi Yin, Xueting Han, Yinghao Zhu, Miaoran Chen Tsinghua University Press, 2022
Book

Projects

PyEHR: A Predictive Modeling Toolkit for Electronic Health Records Yinghao Zhu, Wenqing Wang, Junyi Gao, Liantao Ma GitHub Project
Code
Envisioning the Future Through AI: Perspectives on Global Landscapes and Lifestyles Yinghao Zhu, Ziyi Wang, Caixin Kang, Hao Li, Jingkun An, Enshen Zhou, Haoran Feng, Bo Hou, Long He, Xinlei Bao, Zihao Li, Chuang Wang, Xinyuan Wang Computer Vision and Pattern Recognition (CVPR) Art Gallery, 2023
Video

Awards

Outstanding Graduate of Beijing Beijing Municipal Education Commission, 2025
Detecting Active Tuberculosis Bacilli Yinghao Zhu, Junyi Gao, Liantao Ma Top 4 out of all teams, Nightingale Open Science and Wellgen Medical, 2024
Bias Detection Tools for Clinical Decision Making Challenge Yinghao Zhu, Jingkun An, Enshen Zhou, Hao Li, Haoran Feng Third Place Prize, NIH/NCATS, 2023
CodeProjectVideo
Alibaba Tianchi UNiLAB Algorithm Competition Yinghao Zhu, Zhihao Yu, Xianfeng Jiao Encouragement Award, Top 11/230 & Top 10/324, 2023
"Challenge Cup" Competition of Science Achievement in China Special Prize (Top 1), China Association for Science and Technology, etc, 2023
High Risk Breast Cancer Prediction Contest 1 Yinghao Zhu, Junyi Gao, Xinze Li, Yifan He, Wenqing Wang, Liantao Ma Top 3 out of all teams, Nightingale Open Science, AHLI, and Providence St. Joseph Health, 2022
Code
Outstanding Graduate of Beihang University Beihang University, 2022
"Feng Ru Cup" Competition of Academic and Technological Works First Prize (Top 1%), Beihang University, 2021, 2022

Talks

Traceable and Reliable PubMed Literature Retrieval Based onDeepSeek Department of Obstetrics, Beijing University Third Hospital & Beijing Tiantan Hospital, 2025.04.18, 2025.04.20
Building accessible and trustworthy clinical AI in the era of LLM Department of Nephrology, Beijing University Third Hospital & Beijing University Cancer Hospital & Department of Obstetrics, Beijing University Third Hospital, 2025.02.19,20,21
Enhancing Electronic Health Record Modeling through Large Language Model-Driven Multi-Agent Collaboration Seminar on Advancing Trustworthy and Accessible Healthcare Informatics at Peking University & Cell Press, 2024.10.31
What Makes a Next-Generation AI-Powered Healthcare System? University of Zurich & University Hospital Zurich, 2024.07.08
Deep learning interpretable analysis of multivariate time-series electronic medical record data HIT Webinar, 2023.01.06
Video
Invited talk for the High Risk Breast Cancer Prediction Challenge Machine Learning for Health (ML4H), 2022.11.28
Video

Services

Reviewer

NeurIPS, ICLR, ICML, KDD, WWW, AMIA, etc. ▼

NeurIPS Main Track
2024, 2025
NeurIPS Datasets and Benchmarks Track
2023, 2024, 2025
NeurIPS TSALM & OWA & FM4Science Workshop
2024
ICML Conference
2025
ICML FMSD & MAS Workshop
2025
ICLR Conference
2025
ACMMM Conference
2025
CVPR SynData4CV Workshop
2025
KDD Research Track
2024, 2025
KDD AIDSH Workshop
2024
TheWebConf (WWW) Conference
2025
AISTATS Conference
2025
CHIL Conference
2025
IJCNN Conference
2025
ICASSP Conference
2025
ML4H Conference
2024
AMIA Annual Symposium
2023, 2024, 2025
AMIA Clinical Informatics Conference
2024, 2025
AMIA Informatics Summit
2025
ACM Transactions on Knowledge Discovery from Data (TKDD)
2025
PeerJ Computer Science
2025
Journal of Data-centric Machine Learning Research (DMLR)
2023

Volunteer

ICLR 2025 Workshop on AI for Children ▼

ICLR 2025 Workshop on AI for Children
2025.04.27

Teaching Assistant

Algorithms, OS, Discrete Maths, etc. ▼

Fundamentals of Programming and Computer Science
Spring 2023
Design and Analysis of Algorithms
Spring 2022, Autumn 2022
Operating System
Autumn 2021
Network Storage
Autumn 2021
System Programming
Spring 2021
Object-oriented Programming
Spring 2021
Discrete Mathematics
Spring 2020, Autumn 2020, Spring 2021