GCRL Workshop/ NIPS 2023 paper
Intro
Goal-conditioned RL 结合 Transformer 应用在Offline RL的设定下。
Method tranformer网络参数通过最小化MSE损失函数优化: arg min ϕ ∑ τ ∈ D L ϕ ( W ϕ ( s t , ω ) , s t K ) \arg\min_\phi\sum_{\tau\in\mathcal{…
Doc2X | 专注学术文档翻译 支持 PDF 转 Word、多栏识别和沉浸式双语翻译,为您的论文处理和学术研究提供全方位支持。 Doc2X | Academic Document Translation Expert Support PDF to Word, multi-column recognition, and immersive bilingual translation for comp…