王志
近期热点
资料介绍
个人简历
教育及工作经历:2015年于南京大学工程管理学院获工学学士学位,2019年于香港城市大学系统工程及工程管理学系获哲学博士学位,2019年11月起加入南京大学工程管理学院控制与系统工程系任教,曾于2019年8月至10月赴澳大利亚新南威尔士大学做短期访问研究。研究成果发表在 IEEE Transactions on Neural Networks and Learning Systems, IEEE/ASME Transactions on Mechatronics, IEEE Transactions on Cybernetics, IEEE Transactions on Systems, Man, and Cybernetics: Systems 等国际期刊和 AAAI Conference on Artificial Intelligence 等国际会议上。教学及人才培养:目前承担《深度强化学习》、《自动化导论》等本科生、研究生课程。研究领域
强化学习(Reinforcement Learning, RL)1. 迁移强化学习(Transfer RL): 运用贝叶斯推理(Bayesian inference)、分层贝叶斯模型(Hierarchical Bayesian model)、隐变量模型(Latent variable model)、自适应权重(Adaptive re-weighting)、元学习(Meta-learning)等原理和方法,实现强化学习智能体之间知识的有效迁移。与之相近或交叉的学习模式有增量式学习(Incremental learning)、多任务学习(Multi-task learning)、持续学习(continual learning)、终身学习(lifelong learning)等。2. 分层强化学习(Hierarchical RL): 运用模型集成(Model ensemble)、多专家模型(Mixture-of-experts)、贝叶斯推理(Bayesian inference)等原理和方法,在基于半马尔科夫决策过程(Semi-Markov decision process)的选项(Option)框架下实现高效而实用的决策分层机制。3. 基于演化计算的强化学习(Evolutionary computation for RL): 运用高度可并行化的演化算法,如演化策略(Evolution strategies, ES)、进化算法(Genetic algorithms, GA)等,为强化学习问题提供可扩展性强、运算时间短的解决方案。4. 基于规则的强化学习(Rule-based RL): 运用规则信息(Rules)、专家知识(Expert knowledge)、人类经验(Human demonstrations)等仿生学原理和方法,来改善强化学习的性能,使之更为接近人类学习的模式。5. 多智能体强化学习(Multi-agent RL): 运用深度卷积(Depthwise convolution)、平均场近似(Mean-field approximation)、博弈论(Game theory)等原理和方法,提高多智能体之间实时通信与协同决策能力。""近期论文
[1] Zhi Wang, Chunlin Chen*, and Daoyi Dong, \ 相关热点
最新收录
- 椛岛光 06-01
- 星乃梦奈(ほしの ゆな 06-01
- 沖田奈奈 沖田奈々(Nana 06-01
- 藤仁依那 藤にいな(Niina 06-01
- 矢田步美 矢田あゆみ(Ay 06-01
- 妹岳夏目 妹岳なつめ(Na 06-01
- 麻仓香穗里 麻仓かほり 06-01
- 立花广美 (立花ひろみ H 05-31
- 里中瑞穗(里中みずほ Mi 05-31
- 结月莉亚(結月りあ) 05-31