Jiaqi Gu's Homepage

Jiaqi Gu (顾佳琦)

CV / GitHub / Google Scholar / Zhihu / Email: vadin@zju.edu.cn | gujiaqi.gjq@alibaba-inc.com

I am currently an Senior Algorithm Engineer at Data to Intelligence Lab, Alibaba Cloud. I received my master's degree in Computer Vision from Zhejiang University in 2022, advised by Prof. Zhiyu Xiang. I got my bachelor's degree also from Zhejiang University in 2019.

Research

I specialize in multi-modal large language models (MLLMs) and various vision application in 3D computer vision. My current work focuses on multi-modal reasoning, particularly in areas such as multi-modal Chain-of-Thought (CoT) and spatial reasoning within MLLMs. Previously, I have worked extensively on 3D vision derived from 2D images, encompassing 3D visual localization, 3D scene understanding, and the development of 3D vision-language models.

Publications

Knowledge-based Visual Question Answering with Multimodal Processing, Retrieval and Filtering

Yuyang Houg*, Jiaqi Gu*, Qi Yang, Lubin Fan, Yue Wu, Kun Ding, Shiming Xiang, Jieping Ye
NeurIPS 2025 [paper]

* Equal contributions

HybridGS: Decoupling Transients and Statics with 2D and 3D Gaussian Splatting

Jingyu Lin*, Jiaqi Gu*, Lubin Fan, Bojian Wu, Yujing Lou, Renjie Chen, Ligang Liu, Jieping Ye
CVPR 2025 [paper]

* Equal contributions

PTZ-Calib: Robust Pan-Tilt-Zoom Camera Calibration

Jinhui Guo*, Lubin Fan, Bojian Wu, Jiaqi Gu, Shen Cao, Jieping Ye
ICRA 2025 [paper]

Learning Neural Volumetric Pose Features for Camera Localization

Jingyu Lin*, Jiaqi Gu*, Bojian Wu, Lubin Fan, Renjie Chen, Ligang Liu, Jieping Ye
ECCV 2024 [paper]

* Equal contributions

CVFNet: Real-time 3D Object Detection by Learning Cross View Features

Jiaqi Gu, Zhiyu Xiang, Pan Zhao, Tingming Bai, Lingxuan Wang, Xijun Zhao, Zhiyuan Zhang
IROS 2022 [paper]

Homography Loss for Monocular 3D Object Detection

Jiaqi Gu, Bojian Wu, Lubin Fan, Jianqiang Huang, Shen Cao, Zhiyu Xiang, Xian-sheng Hua
CVPR 2022 [paper] [code]

DenseLiDAR: A Real-Time Pseudo Dense Depth Guided Depth Completion Network

Jiaqi Gu, Zhiyu Xiang, Yuwen Ye, Lingxuan Wang
RA-L with ICRA 2021 Option [paper]

SDP-Net : Scene Flow Based Object Detection and Prediction from Sequential 3D Point Clouds

Yi Zhang*, Yuwen Ye*, Zhiyu Xiang, Jiaqi Gu
ACCV2020 [paper]

* Equal contributions