论文部分内容阅读
针对未知环境下机会频谱接入的信道选择问题进行研究。将智能控制中的Q—learning理论应用于信道选择问题,建立次用户信道选择模型,提出了一种基于Q—learning的信道选择算法。该算法通过不断与环境进行交互和学习,引导次用户尽量选择累积回报最大的信道,最大化次用户吞吐量。引入Boltzmann学习规则在信道探索与利用之间获得折中。仿真结果表明,与随机选择算法相比,该算法在不需要信道环境先验知识或预测模型下,能够自适应地选择可用性较好的信道,有效提高次用户吞吐量,且收敛速度较快。