该仓库包含基于 PyWebIO 的 UCB(上置信界)算法 在线演示,UCB 算法常用于多臂老虎机问题,以优化决策并最大化累积奖励。演示包括自动 UCB 算法模拟和交互式手动策略对比。
- 支持 LaTeX 公式渲染,帮助理解 UCB 算法。
- 实时模拟 UCB 算法,并以图表形式展示结果。
- 交互模式,手动选择拉动臂,并与 UCB 算法进行效果对比。
在运行演示之前,请确保已安装 Python 3.x。
-
克隆此仓库到本地:
git clone https://github.com/Evil0ctal/Upper-Confidence-Bound-Pywebio.git cd Upper-Confidence-Bound-Pywebio
-
使用
pip
安装所需依赖:pip install -r requirements.txt
该项目使用以下 Python 库:
pywebio
- 用于创建 Web 界面。matplotlib
- 用于绘制图表。numpy
- 用于数值计算。
你也可以手动安装依赖:
pip install pywebio matplotlib numpy
-
安装依赖后,使用以下命令运行演示:
python main.py
-
打开浏览器,并访问:
http://localhost:8080
你也可以使用提供的远程访问链接,从其他设备访问。
- UCB 算法模拟:运行多轮 UCB 算法,观察其表现,以及如何在探索和利用之间取得平衡。
- 手动策略对比:手动选择拉动臂,与 UCB 算法的表现进行对比。
此项目使用 MIT 许可证进行授权,详情请参见 LICENSE 文件。