使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于Online-GRU信道预测的星上自适应功率控制方法  PDF

  • 施文军
  • 朱立东
电子科技大学 通信抗干扰全国重点实验室,四川 成都 611731

中图分类号: TN927

最近更新:2024-04-03

DOI:10.11805/TKYDA2023439

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

针对传统卫星功率控制方法存在资源浪费、时延长的问题,提出一种基于在线-门控循环单元(Online-GRU)信道预测的星上自适应功率控制方法,通过在线训练更新网络参数来解决离线预测算法存在的累积误差的问题。仿真结果表明,提出的在线训练算法比离线算法预测精确度提升了38.30%,相比在线-长短期记忆网络(Online-LSTM)节约了63.21%的训练时间;提出的自适应功率控制方法比固定发射功率的方法节约了55.74%的发射功率;同时,相比基于地面定时反馈信道状态的自适应功率控制方法具备更好的鲁棒性。

近年来,以SpaceX为代表的低轨卫星互联网快速发展。由于星地信道条件是动态变化的,固定发射功率不能保证通信质量且功率利用率较低。在保证通信质量的前提下,根据信道状态和用户需求,需要动态调整卫星发射功率,达到最佳的功率控制效果,即自适应功率控[

1]。传统的卫星自适应功率控制实现方法通常是通过接收地面站反馈的信道状态信息,如信噪比和误码率等判断当前的信道质量,并根据信道状态和用户需求计算出最佳发射功[2-5]。文献[2]中,D H Jung等研究了一个基于DVB-RCS2(Digital Video Broadcasting-Return Channel via Satellite 2)的卫星通信系统,并提出了一种基于RCST的返回信道条件和功率余量的自适应编码调制(Adaptive Coding&Modulation,ACM)和功率控制方案,以最大化系统的传输速率。结果表明所提出的ACM和功率控制方案传输速率随着返回卫星信道终端(Return Channel Satellite Terminal,RCST)和卫星发射功率的增加或RCST的功率余量的增加而提高。为了获取更精确的信道状态信息,文献[4]提出了一种基于最小二乘法(Least Squares,LS)估计的卫星通信系统判决反馈信道估计方案,提升了卫星通信系统判决的误码性能。但对于低轨卫星通信下的高动态场景,星地链路造成的传播时延、接收的处理时延往往会使卫星得到的信道状态过时,导致卫星接收的信道质量和当前信道质量不匹配。同时,依靠地面站频繁反馈信道状态信息会导致星上资源过度浪费,并且当地面站无法反馈信道状态信息时,可能会导致发射功率设置过高或过低,造成资源浪费甚至通信中断。

目前链路中常用的自适应方法为自回归滑动平均(Auto Regressive Moving Average,ARMA)、自回归综合移动平均(Auto Regressive Integration Moving Average,ARIMA)、循环神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(LSTM)等时间序列模型,用于对信噪比和雨衰序列进行预[

6-8]。由于卫星信道的传播特性,传统的自回归平均模型不能很好地预测具有较强非线性变化的信道衰减,而LSTM等神经网络模型虽然能够适用于非线性序列,但完全依靠训练好的神经网络进行预测会导致误差积累,随着时间推移,预测效果逐渐减弱。为克服累计误差,有学者采用在线训练的方式更新LSTM网络参数,均值频谱效率提升了3.4%[8],但LSTM网络结构复杂,在线训练耗时较长。相比于LSTM,门控循环单元(GRU)优化了LSTM网络功能,网络结构更加简单,训练速度更快。因此,本文设计了一种Online-GRU信道多步预测模型,预测传播信道损耗,提前计算发射功率,同时在线训练并更新GRU神经网络参数,避免离线预测造成的误差积累。

1 卫星信道模型

与已有的大部分相关文献只考虑降雨衰减不[

5-6,8-11],本文使用国际电信联盟ITU-R P.618传播损耗模型设计地球空间链路,考虑大气衰减、气体衰减、云雾衰减、降雨衰减和对流层闪烁衰减模拟真实的卫星通信信道。

高频段卫星通信受降雨影响较大,根据ITU-R P.618建议书,降雨衰减Ar可用式(1)计算:

Ar=A0.01p0.01-0.655+0.033lnA0.01-β(1-p)sinθ (1)

式中:p0.001%,5%,为降雨预计衰减超过的年均百分比;A0.01=γRLE为超过年均0.01%的降雨预计衰减,γR为由频率相关系数和0.01%概率年均单点降雨量决定的特定衰减,LE为有效路径长度;若p1%或地面站纬度的绝对值φ36°时,β=0;若p<1%φ<36°且仰角θ25°时,β=-0.005φ-36;其他,β=-0.005φ-36+1.8-4.25sin θ

云雾引起的衰减Ac由ITU-R P.840建议书给出:

Ac=LredKlf,273.15sinθ (2)

式中:Lred为在云雾衰减平均年超额百分比p0.01%,99%时,温度降至273.15 K的液态水的总柱状含量;θ为仰角;Kl为云中液态水比衰减系数。

水蒸气和氧气导致的气体衰减Ag由ITU-R P.676建议书(建议书中将大气分成了指数级增长的层)给出:

Ag=i=1imaxaiγi (3)

式中:γi为第i层的比衰减;ai为通过第i层的路径长度。

对流层闪烁导致的衰减As由ITU-R P.618建议书给出:

As=apσ (4)

式中:ap为对流层闪烁平均年超额百分比p0.01%,50%的时间百分比系数;σ为路径上信号的标准差。

对于高频卫星通信系统,在低仰角时还须考虑多源同生大气衰减效应At

At=Ag+Ar+Ac2+As2 (5)

虽然星地传播信道质量随着环境动态变化,但雨衰、气体衰减、云雾衰减等衰减仍存在某种规律,可将其建模成时间序列进行处理。

2 信道预测网络

为解决近地轨道(Low Earth Orbit,LEO)卫星的高动态性和链路时延导致的星上接收信道信息“过时”问题,本文通过利用RNN类网络预测信道质量。RNN可以将神经元某一时刻的输出作为输入,再次输入给神经元,保留了数据之间的依赖关系,可用于处理时间序列数据。但对于较长的时间序列数据,RNN在序列交替的反向传播过程中容易出现梯度消失或梯度爆炸的问题,导致在训练过程中,梯度不能在较长序列中一直传递下[

12]

2.1 LSTM模型

LSTM是一种特殊的RNN,其核心思想是使用遗忘门ft、输入门it和输出门ot作为控制开关,实现对序列信息的提取和处理,解决传统RNN在训练长序列中存在的梯度消失和梯度爆炸问[

13]。LSTM神经网络单元结构见图1,遗忘门ft决定神经单元状态中需要丢弃的序列信息,决定上一时刻的单元状态ct-1有多少能够保留到当前时刻ct中。输入门it决定向单元状态中添加多少输入序列信息,输出门ot决定该时刻单元状态ct对输出预测序列ht的影响。

图1  LSTM模型结构图

Fig.1  Structure of LSTM model

2.2 GRU模型

LSTM解决了RNN无法进行长期记忆的问题,但LSTM网络结构复杂,网络训练耗时长,收敛速度慢。GRU网络优化了LSTM网络的功能,使网络结构变得简单,成为目前广泛使用的神经网[

14]。GRU模型结构见图2,GRU网络将LSTM网络中的遗忘门和输入门合成为一个新的更新门rt,用重置门zt替代LSTM中的输出门。同样克服了传统RNN的长期依赖问题,保证了预测准确性的同时,由于GRU网络门结构数量的减少,减少了网络训练时间。因此GRU相比于传统RNN和LSTM,更适合用于处理高动态移动场景下的卫星地球空间传播信道序列,简单的网络结构和快速的训练速度能够满足卫星通信实时性和星上资源受限的要求。

图2  GRU模型结构图

Fig.2  Structure of GRU model

3 基于Online-GRU信道预测的星上自适应功率控制

传统基于GRU/LSTM的信道多步离线预测方法的训练时间线见图3,训练完成后的GRU/LSTM每隔一段时间根据地面上传的序列数据更新网络状态,这样能够尽可能实现更长期的序列预测,但由于网络参数并没有发生变化,长期预测仍会导致误差积累,随着时间的增加,预测效果会越来越差。

图3  Offline-GRU/LSTM神经网络训练预测时间线图

Fig.3  Offline GRU/LSTM training for predicting timelines

为解决常规GRU/LSTM存在的长期误差积累问题,本文设计了一种Online-GRU/LSTM预测算法,其训练时间线见图4。该方法在预测的同时,根据地面站定期上传的信道序列数据进行在线训练,重新训练出一个新的预测网络模型,定期更新网络参数,消除累积误差。Online-GRU/LSTM预测算法能够适应不断变化的信道环境,使预测性能持续并具有效果。同时,由于网络结构特性,Online-GRU相比于Online-LSTM,在线训练速度更快,更适合高动态LEO卫星通信场景。

图4  Online-GRU/LSTM神经网络训练预测时间线图

Fig.4  Online GRU/LSTM training for predicting timelines

基于Online-GRU信道多步预测的星上自适应功率控制步骤为:

1) 归一化ITU-R P.618传播总损耗数据,并建模成时间序列st,序列长度为l

2) 设置地面站每隔n步反馈信道质量,为预测n步后的信道质量,分割时间序列成输入训练集s1:l-n和输出训练集sn+1:l,差分序列数据使其呈静态;同时将时间序列问题转化为监督学习问题;

3) 初始化GRU网络参数θ,输入训练集s1:l-nsn+1:l进行训练:

a) 计算重置门zt。GRU通过引入重置门决定是否忽略先前时刻的隐藏状态,

zt=σWzht-1,xt+bz (6)

式中:σ为Sigmoid激活函数;Wz为重置门的权重矩阵;bz为偏置项;ht-1为上一时刻的隐藏状态;xt为当前时刻的输入。

b) 计算更新门rt。GRU通过使用更新门决定当前时刻的新隐藏状态:

rt=σWrht-1,xt+br (7)

式中:Wr为更新门的权重矩阵;br为偏置项。

c) 计算候选隐藏状态h˜t

h˜t=tanhWh˜ztht-1,xt+bh˜ (8)

式中:tanh为激活函数;Wh˜为对应的权重矩阵;bh˜为偏置项;为元素级乘法。

d) 更新隐藏状态ht

ht=1-rtht-1+rth˜t (9)

4) 网络训练完成后,将训练集sl-n+1:l作为输入,预测n步后的信道质量数据,并反归一化得到n步后的ITU-R P.618传播总损耗数据s˜l+1:l+n

5) 根据预测结果提前计算卫星发射功率;

6) n步后根据地面站上传的数据sl+1:l+n更新GRU网络状态,得到更长序列的预测,并同时重新构建数据集s1:lsn+1:l+n

a) 用新的数据集s1:lsn+1:l+n在线训练新的GRU网络参数θ˜m步后训练收敛;

b) 将sl+1:l+m输入原GRU网络,直到新的GRU训练完成,得到预测序列s˜l+n+1:l+n+m

7) 更新GRU网络参数θ˜,将sl+m+1:l+n输入网络,得到预测序列s˜l+n+m+1:l+2n

8) 2n步后根据地面站上传的数据sl+n+1:l+2n更新GRU网络状态,将sl+n+1:l+n+m输入GRU网络得到预测序列s˜l+2n+1:l+2n+m,并重新构建数据集s1:l+nsn+1:l+2n,后续与步骤6)类似,此处不再赘述。

基于Online-GRU信道多步预测的星上自适应功率控制方法伪代码见表1

表1  基于Online-GRU信道多步预测的星上自适应功率控制方法
Table1  Satellite adaptive power control method based on Online-GRU channel prediction

algorithm 1:

input: channel loss sequence st

1: normalization processing of channel loss sequences st, the length of the channel loss sequence is l

2: set prediction steps n and training iterations k

3: set training sequence dataset s1:l-n and sn+1:l

4: initialize GRU network parameters θ, set training parameters and optimizer

5: training neural network:

6: for i=1:k

7: input training set s1:l-n, sn+1:l

8: for j=1:l-n

9: calculate the reset door zt using Equation (6)

10: calculate the update gate rt using Equation (7)

11: calculate candidate hidden states h˜t through equation (8)

12: update candidate status ht through equation (9)

13: end

14: end

15: set input sequence s=sl-n+1:l , s˜ is the predicted sequence

16: repeat

17: recurrent multi-step prediction:

18: for t=1:n

19: s˜t+n=predictAndUpdateState (θ,st), update network status and make predictions

20: calculate the transmission power at timet+n based on s˜

21: end

22: update input sequence s=sl+1:l+n and rebuild datasets s1:l and sn+1:l+n

23: retrain GRU network θ˜ every m steps, update network parameters θ=θ˜

24: until end of mission

output: on board transmission power after n steps

4 性能仿真分析

为验证本文所提出的Online-GRU信道多步预测的自适应功率控制算法的性能,采用Matlab 2021a平台仿真了成都地区一段时间内可见卫星,仿真参数设置见表2,仿真时间为2023.8.18 23:05:00~2023.8.18 23:20。信道建模采用国际电信联盟建议的ITU-R P.618地球空间传播损耗模型,考虑大气衰落、云雾衰落、气体衰落、降雨衰落、对流层闪烁衰落等信道衰落,并考虑发射机与接收机之间的天线指向随机损耗,模拟真实的卫星信道场景。信道建模具体参数见表3,生成的信道各类损耗数据见图5。Online-GRU多步预测神经网络参数见表4。由图6和图7可知,GRU离线预测在预测初期预测精确度尚可,但随着时间增长,其预测误差逐渐积累,预测精确度逐渐下降,预测误差越来越大;而Online-GRU方法由于在预测的同时,根据地面站定期上传的信道序列数据进行在线训练,定期更新网络参数消除累计误差,能够适应不断变化的信道环境,预测精确度较高且长时间预测误差较低。

图 5  各类信道损耗仿真图

Fig.5  Various channel losses

图 6  信道传播损耗预测结果

Fig.6  Prediction results of channel propagation loss

图 7  Offline-GRU和Online-GRU预测结果绝对误差图

Fig.7  Absolute error of channel propagation loss prediction results for Offline-GRU and Online-GRU

表2  卫星及用户仿真参数
Table2  Satellite and user simulation parameters
inclination/(°)longitude of ascending node/(°)eccentricity/(°)argument of periapsis/(°)mean anomaly/(°)

period/

(circle/day)

ground user latitude/(°)ground user longitude/(°)ground user altitude/mmin elevation/(°)
87.90 208.9 0.000 199 3 73.72 286.4 13.11 31.57 105.1 485.0 10.00
表3  信道模型参数
Table3  Channel model parameters
rain annual exceedance/%gas annual exceedance/%cloud annual exceedance/%scintillation annual exceedance/%

total annual

exceedance/%

receiver height/m

water vapor density/

(g/m3)

integrated water vapor content/

(kg/m2)

wet surface refractivity/%antenna random pointing error variance/dBmean random pointing error of antenna/dB
1.0 1.0 1.0 0.50 0.0010 0.50 2.8 1.4 1.2 0.097 0.072
表4  神经网络参数
Table4  Neural network parameters
input feature dimensionoutput feature dimensionhidden layer unitsoptimizergradient thresholdlearning ratelearning rate drop cycle roundslearning rate drop factorprediction stepsonline training cycle
1 1 128 adam 1 0.01 50 0.5 1 000 6 000

表5中Online-GRU相比于Offline-GRU预测精确度提升了38.30%,GRU类预测算法和LSTM类预测算法精确度相近。本文统计了GRU和LSTM对于相同长度的信道训练序列在同一CPU上的训练时间,结果表明GRU比LSTM节约了63.21%的训练时间。

表5  不同算法预测精度表
Table5  Prediction accuracy for different algorithms
algorithmRMSE
Offline-GRU 0.175 7
Offline-LSTM 0.190 5
Online-GRU 0.108 4
Online-LSTM 0.101 7

本文对比了基于固定发射功率、地面站定时反馈的自适应功率控制及基于Online-GRU信道预测的星上自适应功率控制3种方法。其中收发两端的仿真参数见表6,仿真时间为2023.8.18 23:05:00―2023.8.18 23:20:30,预测时间为2023.8.18 23:16:38―2023.8.18 23:20:30,调制类型采用8PSK。为保证能够应对复杂的空间电磁环境,设置仿真时间内链路余量要求为5 dB以上。LEO卫星往返传播时延只有数十毫秒量级,若每隔几十毫秒反馈一次信道状态,则会导致较多的通信开销。本文采样时间设置为0.01 s,GRU预测步长为1 000,可以预测10 s后的信道质量。因此为了节约反馈信道状态信息占用的开销,设置地面站每隔10 s反馈一次信道状态。

图 8  不同功率控制方法的链路余量

Fig.8  Link margin for different power control methods

图8中,基于信道质量最差条件下,固定发射功率方法的星地链路余量均达到了5 dB以上,发射功率为660.69 W,此方法对通信资源造成了一定的浪费。基于Online-GRU信道预测的自适应功率控制的链路余量也均达到了5 dB以上,平均发射功率为292.42 W,相比固定发射功率的方法节约了55.74%。这是因为基于此方法的自适应功率控制充分利用了通信资源,不会导致较高的功率浪费。而基于地面定时反馈信道状态的自适应功率控制方法虽然其平均发射功率为285.10 W,但从图中可以看出,地面反馈的信道状态随着时间的变化,之前的发射功率与后续的信道质量并不匹配,故虽然功率资源消耗较小,但并没有达到5 dB以上链路余量的要求,当受到干扰或信道急剧恶化时,有可能会造成接收的Eb/N0无法达到解调门限,导致通信链路中断。因此该方法效果不佳,且鲁棒性较差。

5 结论

为解决传统卫星功率控制方法存在资源浪费和时延长的问题,保证在复杂的空天电磁环境中卫星通信质量,本文设计了一种基于Online-GRU信道预测的星上自适应功率控制方法。该算法通过星上在线训练更新网络参数,解决离线预测算法的积累误差;同时利用GRU网络结构代替常规的LSTM网络提升在线训练速度。仿真实验中,采用ITU-R P.618地球空间传播损耗模型设计星地链路,模拟真实的卫通场景。结果表明,Online-GRU相比于离线预测,精确度提升了38.30%;同时GRU比LSTM节约了63.21%的训练时间;本文提出的自适应功率控制方法比固定发射功率的方法节约了55.74%的发射功率,且相比基于地面定时反馈信道状态的自适应功率控制方法,具备更好的鲁棒性。

参考文献

1

WANG Shuo,XU Xiaofei,YANG Penghui,et al. Research on rain attenuation model and compensation method of Ka band satellite-to-ground data transmission link[C]//2022 the 7th International Conference on Computer and Communication Systems (ICCCS). Wuhan,China:IEEE, 2022:582-586. doi:10.1109/ICCCS55155.2022.9846112. [百度学术] 

2

JUNG D H,SHIN M S,RYU J G. Adaptive Coding and Modulation(ACM) and power control scheme for return link of DVB-RCS2 satellite system[C]// Proceedings of the 37th International Communications Satellite Systems Conference(ICSSC-2019). Okinawa,Japan:IEEE, 2019:1-10. doi:10.1049/cp.2019.1231. [百度学术] 

3

曹鹤先,朱立东. 基于自适应功率控制的卫星系统间频率共享[C]// 第十七届卫星通信学术年会. 北京:中国通信学会, 2021:10-16. [百度学术] 

CAO Hexian,ZHU Lidong. Frequency sharing between satellite systems based on adaptive power control[C]// The 17th Academic Annual Conference on Satellite Communications. Beijing:China Institute of Communications, 2021:10-16. doi:10.26914/c.cnkihy.2021.032781. [百度学术] 

4

李欣. 卫星通信系统中功率控制方法的研究[D]. 北京:北京邮电大学, 2017. [百度学术] 

LI Xin. Research on power control methods in satellite communication systems[D]. Beijing:Beijing University of Posts and Telecommunications, 2017. [百度学术] 

5

王生辉. Ka频段卫星通信自适应传输技术研究[D]. 西安:西安电子科技大学, 2012. [百度学术] 

WANG Shenghui. Research on adaptive transmission technology for Ka band satellite communication[D]. Xi'an,China:Xidian University, 2012. doi:10.7666/d.D365451. [百度学术] 

6

钟怀东,徐慨,侯柳英. Ka频段卫星通信上行链路自适应功率控制[J]. 计算机工程, 2009,35(10):107-108,117. [百度学术] 

ZHONG Huaidong,XU Kai,HOU Liuying. Uplink adaptive power control in Ka band satellite communication[J]. Computer Engineering, 2009,35(10):107-108,117. doi:10.3969/j.issn.1000-3428.2009.10.035. [百度学术] 

7

唐一强,杨霄鹏,朱圣铭. 基于注意力机制的混合CNN-BiLSTM低轨卫星信道预测算法[J]. 系统工程与电子技术, 2022,44(12):3863-3870. [百度学术] 

TANG Yiqiang,YANG Xiaopeng,ZHU Shengming. Low-orbit satellite channel prediction algorithm based on the hybrid CNN-BiLSTM using attention mechanism[J]. Systems Engineering and Electronics, 2022,44(12):3863-3870. doi:10.12305/j.issn.1001-506X.2022.12.32. [百度学术] 

8

梁雪源. 基于信道预测和强化学习的卫星自适应传输技术研究[D]. 成都:电子科技大学, 2020. [百度学术] 

LIANG Xueyuan. Research on satellite adaptive transmission technology based on channel prediction and reinforcement learning[D]. Chengdu,China:University of Electronic Science and Technology of China, 2020. [百度学术] 

9

张晖,王磊,陈昊. Ka频段通信卫星自适应功率控制抗雨衰研究[C]// 2015年全国天线年会. 南昌:中国电子学会天线分会, 2015:4. [百度学术] 

ZHANG Hui,WANG Lei,CHEN Hao. Research on adaptive power control in anti-rain-attenuation of Ka-band satellite communications[C]// 2015 National Antenna Annual Conference. Nanchang,China:Antenna Branch of China Electronics Society, 2015:4. doi:10.26914/c.cnkihy.2015.004170. [百度学术] 

10

FUKUCHI H. Quantitative analysis of the effect of adaptive satellite power control as a rain attenuation countermeasure[C]//Proceedings of IEEE Antennas and Propagation Society International Symposium and URSI National Radio Science Meeting. Seattle,WA,USA:IEEE, 1994:1332-1335. doi:10.1109/APS.1994.407843. [百度学术] 

11

CHODKAVEEKITYADA P,FUKUCHI H. Combination benefits of short-time diversity and adaptive satellite power control[C]//2015 International Symposium on Antennas and Propagation(ISAP). Hobart,TAS,Australia:IEEE, 2015:1-2. [百度学术] 

12

何雨桐,朱立东,施文军. 基于GRU神经网络的自适应跳频技术研究[J]. 无线电通信技术, 2022,48(6):1074-1079. [百度学术] 

HE Yutong,ZHU Lidong,SHI Wenjun. Research on adaptive frequency hopping technology based on GRU neural network[J]. Radio Communications Technology, 2022,48(6):1074-1079. doi:10.3969/j.issn.1003-3114.2022.06.015. [百度学术] 

13

吴楠,谷万博,王旭东. 基于深度LSTM辅助卷积网络的新型自动调制分类(英文)[J]. 太赫兹科学与电子信息学报, 2021,19(2):235-243. [百度学术] 

WU Nan,GU Wanbo,WANG Xudong. A novel automatic modulation classification based on deep LSTM assisted convolutional networks[J]. Journal of Terahertz Science and Electronic Information Technology, 2021,19(2):235-243. doi:10.11805/TKYDA2020034. [百度学术] 

14

施文军,朱立东. 基于GRU的卫星轨道智能外推方法[C]// 第十八届卫星通信学术年会. 北京:中国通信学会, 2022:11. [百度学术] 

SHI Wenjun,ZHU Lidong. The intelligent extrapolation method for satellite orbits based on GRU[C]// The 18th Academic Annual Conference on Satellite Communications. Beijing:China Institute of Communications, 2022:11. doi:10.26914/c.cnkihy.2022.057856. [百度学术]