Pengxiang Li's picture

1 9 13

Pengxiang Li PRO

PengxiangLi

·

AI & ML interests

None yet

Recent Activity

published a model about 1 month ago

PengxiangLi/fintuned-uitars

updated a dataset about 2 months ago

PengxiangLi/pass32_osworldnew_tmp07

published a dataset about 2 months ago

PengxiangLi/pass32_osworldnew_tmp07

View all activity

Organizations

None yet

authored a paper 2 months ago

Efficient Multi-turn RL for GUI Agents via Decoupled Training and Adaptive Data Curation

Paper • 2509.23866 • Published Sep 28 • 13

authored a paper 6 months ago

Chain-of-Focus: Adaptive Visual Search and Zooming for Multimodal Reasoning via RL

Paper • 2505.15436 • Published May 21 • 2

authored a paper 10 months ago

InfiR : Crafting Effective Small Language Models and Multimodal Small Language Models in Reasoning

Paper • 2502.11573 • Published Feb 17 • 9

authored a paper 11 months ago

Multi-modal Agent Tuning: Building a VLM-Driven Agent for Efficient Tool Usage

Paper • 2412.15606 • Published Dec 20, 2024 • 2

authored 2 papers over 1 year ago

FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models

Paper • 2407.11522 • Published Jul 16, 2024 • 9

Task-oriented Sequential Grounding in 3D Scenes

Paper • 2408.04034 • Published Aug 7, 2024 • 8