dare专题

大模型融合方法-DARE

LLM在SFT之后会产生大量的冗余参数(delta参数)，阿里团队提出DARE方法来消除delta参数，并将其合并到PRE模型中，从而实现多源模型能力的吸收。 DARE无需GPU重新训练，其思路非常简单，就跟dropout类似： m t ∼ Bernoulli ⁡ ( p ) δ ~ t = ( 1 − m t ) ⊙ δ t δ ^ t = δ ~ t / ( 1 − p ) θ D A R

Ludum Dare 41 作品《Moth and Bat》

第二次参加Game Jam，第一次参加Ludum Dare。在开发该游戏时，我学习游戏开发110天了。项目源码：https://github.com/SamuelQZQ/Ludum-Dare-41-Double-Fly 项目游戏主页：https://ldjam.com/events/ludum-dare/41/double-fly 我们最终的得分如下。看了一下，Jam组排名内的一共约1200