这不是一个排序公式仓库,而是一套从候选召回、内容理解、Transformer 排序,到广告混排与服务编排的推荐系统样本。
仓库主体由 Rust 服务编排与 Python/JAX 模型代码组成,另有约 3GB Phoenix 模型 artifact 通过 Git LFS 分发。
README 明确说:系统消除了每一个手工内容相关特征和大部分启发式逻辑,让 Grok-based Transformer 从用户互动序列里学习相关性。
第一段用 two-tower 把百万级候选缩到几百;第二段用 Transformer 对候选逐个预测 favorite / reply / repost / click / dwell 等多行动概率。
最值得注意的是 Candidate Isolation:候选可以看用户与历史,但候选之间不能互相 attention。这样单条内容的分数不依赖同批次里其他内容,更稳定,也更利于缓存。
开源内容展示的是系统骨架与小模型快照,不等于完整线上生产系统;但它清楚暴露了方向:实时互动数据、内容理解、候选隔离排序、广告安全混排,正在被统一到同一条 pipeline。
不要把它看成公式。把它看成一张信息流工厂蓝图。
重点看四件事:候选从哪里来、用户上下文怎么补、模型预测哪些行为、最终如何过滤与混排。掌握这四层,基本就抓住了 X For You 算法的主干。