cheng's picture

cheng

littlebird13

·

AI & ML interests

None yet

Recent Activity

updated a Space 3 days ago

Qwen/Qwen3-Omni-Demo

liked a model 4 days ago

Qwen/Qwen3-Next-80B-A3B-Instruct-GGUF

published a model 4 days ago

Qwen/Qwen3-Next-80B-A3B-Instruct-GGUF

View all activity

Organizations

upvoted a paper 4 days ago

Qwen3-VL Technical Report

Paper • 2511.21631 • Published 11 days ago • 110

upvoted a paper 5 days ago

Stabilizing Reinforcement Learning with LLMs: Formulation and Practices

Paper • 2512.01374 • Published 7 days ago • 78

upvoted a paper 4 months ago

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 263

upvoted 2 papers 7 months ago

Parallel Scaling Law for Language Models

Paper • 2505.10475 • Published May 15 • 83

Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 317

upvoted a collection 9 months ago

Qwen2.5-Omni

End-to-End Omni (text, audio, image, video, and natural speech interaction) model based Qwen2.5 • 7 items • Updated Jul 21 • 160

upvoted a paper 12 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376

upvoted a collection over 1 year ago

Qwen1.5

Qwen1.5 is the improved version of Qwen, the large language model series developed by Alibaba Cloud. • 55 items • Updated Jul 21 • 211