Search Results - (((("a general coding algorithm") OR ("a general rl algorithms"))) OR ("_ section bee algorithm")) :: K.UTB vyhledávací portál

Vyzkoušejte nový nástroj s podporou AI Summon Research Assistant BETA

Improved Demonstration-Knowledge Utilization in Reinforcement Learning

by Liu, Yanyu, Zeng, Yifeng, Ma, Biyang, Pan, Yinghui, Gao, Huifan, Zhang, Yuting
Published in IEEE transactions on artificial intelligence (01.05.2024)

Get full text

Journal Article

Loading…

DGRO: Enhancing LLM Reasoning via Exploration-Exploitation Control and Reward Variance Management

by Su, Xuerui, Guo, Liya, Wang, Yue, Zhu, Yi, Ma, Zhiming, Wang, Zun, Liu, Yuting
Year of Publication 19.05.2025

Get full text

Journal Article

Improved Demonstration-Knowledge Utilization in Reinforcement Learning

DGRO: Enhancing LLM Reasoning via Exploration-Exploitation Control and Reward Variance Management

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database