Skip to content

能否支持在 Experience 缓冲区中存储 Policy 末端隐含层输出 #383

@SYSUzhouting

Description

@SYSUzhouting

作者您好,

我正在基于 Trinity‑RFT 框架开展  Experience 分析工作。希望在 Policy 交互/生成阶段,除了保存生成的 Token,还能获取该 Policy 模型在生成过程末端的隐含层向量,以便后续分析。

但是当前使用 vLLM 的标准 generate 路径(通过 RequestOutput)只返回 logits/Tokens,不包含隐含层张量,并且无法使用 task=“embed” 模式,因为该模式不支持文本生成,且需要独立的引擎实例,与当前 Trinity‑RFT 架构中的 rollout 阶段不兼容。

请问能否可以提供 Trinity‑RFT 框架中用于扩展该功能的接口示例呢?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions