How Kimi K2 achieves efficient RL parameter updates | Dark Hacker News