2023-09-16
编程
00

前言

最近在申请Ph.D, 有幸和导师还算聊得来,老师让我先去研究一下他的官网上关于在线决策的课程,因为这对我来说是个全新的领域,所以我参考了网上关于MAB问题的一些教程和老师给的官方课件,写了一篇总结,和兄弟们一起学习一下。

⚠️:很多观点来源于本人对课件以及教程的理解,很多地方还不够严谨,甚至有些部分可能是完全错误的,希望大家读的时候可以带着审视的视角,有什么问题可以在下方留言或者直接联系本人(simolark318@gmail.com

9.26更新: 初版没有重视数学公式的一些理论推导与证明,重新从头推导一遍后发现了一些问题,对部分细节内容以及公式进行了修改。

10.15更新:对部分公式进行了重新修改,改正了一些不应该的失误,对比较重要的几个地方重新进行了推导

2023-05-30
杂事
00

想写这个话题其实蛮久了,算是早有预谋吧,毕竟对这个问题的思考,自高中而始,但即使到现在也看不到终点,可以料想到,这个问题将持续很久,我一直觉得,或许只有当我真正想明白的时候,我的人生,才算刚刚开始。