題目:基于強化學習的離散時間均值-方差策略
報告人: 李迅
時間:2024年11月22日(周五),上午10:00-11:00
報告地點: 理學院1-301會議室(騰訊會議:609-272-073)
報告摘要:本報告研究了一種基于強化學習的離散時間均值-方差模型。與Wang-Zhou (2020)的連續時間模型相比,離散時間模型對資產收益分布的假設更為廣泛。通過使用熵來衡量探索成本,推導出最優投資策略,其密度函數同樣為高斯類型。此外,設計了相應的強化學習算法。模擬實驗和實證分析表明,離散時間模型在分析實際數據時,相較于連續時間模型具有更好的適用性。
報告人簡介:
李迅,于1992年獲上??萍即髮W數學系學士學位,1995年獲上海大學數學系碩士學位。2000年在香港中文大學系統工程與工程管理學系獲得博士學位,并于2001年在該系擔任博士后研究員。從2001年至2003年,他在卡爾加里大學數學與計算金融實驗室擔任博士后研究員。2003年至2007年,他是新加坡國立大學數學系的訪問學者。2007年起,他加入香港理工大學應用數學系,擔任助理教授,2013年晉升為副教授,目前為教授。其主要研究領域為隨機控制與金融應用中的應用概率,已在SIAM Journal on Control and Optimization、Annals of Applied Probability、IEEE Transactions on Automatic Control、Automatica、Journal of Differential Equations、Mathematical Finance、Finance and Stochastics以及Quantitative等期刊發表論文。
中國·浙江 湖州市二環東路759號(313000) 浙ICP備10025412號 浙公網安備 33050202000195號 版權所有:黨委宣傳部