Blog posts

2025

More Is Not Always Better

1 minute read

Published: May 20, 2025

DATE: May 20, 2025

2024

Star Attention: Efficient LLM Inference Over Long Sequences

2 minute read

Published: December 04, 2024

Abstract
Introduction
Thoughts

Preface

1 minute read

Published: November 27, 2024

I am on a train from Beijing to Wuxin right now. Sometimes I believe one’s life is just like traveling on a train…