Language : 中文
王瑞

Research Projects

融合多任务奖励信号与难度分级机制的RLVR框架及其在飞浆与文心平台的实现

Hits:

Leading Scientist:王瑞

Classification of Disciplines:信息科学与系统科学基础学科

Date of Project Initiation:2025-12-01

Date of Project Completion:2026-12-01

Recommend this Article

 沪ICP备05052060 版权所有©上海交通大学

Click: