发布时间:2019-12-21浏览次数:次
讲座题目:Sequential Batch Learning in Linear Contextual Bandits
报 告 人:周正元
报告时间:2019年12月23日下午2点
地 点:南校区5号楼B318
摘 要:
个性化在线决策问题是运筹学中一类具有广泛应用的问题:决策者根据用户的个体信息和在线反馈作出动态的决策。这类问题主要的应用场景在于个性化推荐系统,精准医疗治疗方案推荐,用户广告投放等等。传统的方法在解决这个问题时总是假设反馈的及时性,也就是决策者给出一个推荐决策后能够立刻收到关于这个决策的反馈,从而立即运用的下一个决策的选择中。然后实际应用中这个假设往往是不成立的。在这个工作中,我们讨论非及时反馈情形下决策者应该如何设计算法从而到达最优抉择结果。我们给出两类算法--每类算法分别对应于一个不同场景--并且给出每个算法效果上的刻画并且建立每个算法的最优性。
周正元教授个人简介:
周正元,本科于2013年毕业于加州大学伯克利分校,获取了电子信息工程和数学双学位。博士于2019年毕业于斯坦福大学电子工程专业,并同时在斯坦福获取计算机硕士、统计学硕士和经济学硕士,以及数学专业辅修和管理与工程专业辅修。
周正元博士是纽约大学Stern商学院运筹系的助理教授,并获得IBM Research 2019-2020 年的Goldstine Fellowship。他在工业界有着广泛的经验,先后访问过Google、Microsoft Research和Oracle. 主要的研究兴趣包括机器学习、应用概率、在线学习和决策、博弈论与控制。