跳转至

强化学习

1 强化学习问题定义

在强化学习中,学习信号以奖励形式出现

术语: - 智能体agent - 环境environment - 状态state

alt text