<tt id="i6rwf"></tt>
  1. <i id="i6rwf"><address id="i6rwf"></address></i>

    <i id="i6rwf"><address id="i6rwf"></address></i>

    1. 非線性期望在強化學習和多臂老虎機中的應用

      發布者:文明辦作者:發布時間:2022-11-23瀏覽次數:10

      主講人:陳增敬 山東大學教授


      時間:2022年11月25日15:00


      地點:騰訊會議 603 883 366


      舉辦單位:數理學院


      主講人介紹:陳增敬,山東大學教授,博士生導師。國家杰出青年科學基金獲得者,第十四屆孫冶方經濟科學獎獲得者。作為獨立完成人完成的項目“資產定價理論中的非線性期望方法”榮獲2015年度國家自然科學二等獎。主要研究方向包括金融數學,倒向隨機微分方程,計量經濟學等。與美國藝術與科學院士、著名經濟學家Epstein合作發表在國際頂級經濟刊 Econometrica上的論文是大陸學者第一篇發表在該頂級期刊的論文。得到了被稱為Chen-Epstein的資產定價公式,被諾貝爾經濟獎獲得者Sargent和Hansen等國際著名專家引用或推廣。


      內容介紹:本報告將介紹強化學習以及老虎機問題的模型和方法,并考慮幾個關于老虎機問題的策略極限定理:包括策略大數定律、策略大偏差原理和策略中心極限定理。

      两个?一个吃小黄段

        <tt id="i6rwf"></tt>
      1. <i id="i6rwf"><address id="i6rwf"></address></i>

        <i id="i6rwf"><address id="i6rwf"></address></i>