Towards scalable and channel-robust radio frequency fingerprint identification for LoRa

File:: Shen 等, 2022
Style:: IF 6.3 SCI Q1 CCF A 中科院 工程技术2区 Author:: Guanxiong Shen; Junqing Zhang; Alan Marshall; Joseph R. Cavallaro
Year:: 2022
DOI:: 10.1109/TIFS.2022.3152404

文章基本框架

背景

deep learning-based RFFI的逻辑是,接收数据-训练模型-识别,所以是闭集的,存在两个问题:

  • 合法设备加入和离开时需要重新训练网络?

  • 恶意设备的特征会被网络尽量识别成最相似的合法设备

<img alt="" data-attachment-key="G8R76QTY" width="951" height="643" src="attachments/G8R76QTY.png" ztype="zimage">

目的

引入注册阶段,用k-NN代替softmax层做识别

结论

  • 设计了一个基于深度度量学习的RFF提取器的可扩展RFFI框架,该框架使设备无需重新训练即可加入和离开。它通过使用预先训练的RFF提取器注册新设备或删除离开设备的记录来维护RFF数据库。

核心创新点

只把神经网络当成RFF提取器,然后维护一个RFF库,进行注册识别,识别用k-NN算法。这样做的好处是不用反复训练神经网络,只要训练一个能提取RFF的网络一直用就可以
首次使用多普勒频移来模拟真实信道并评估其性能。

方案概述

构建信道无关的频谱图减轻信道效应,设计数据增强应对多径和多普勒频移的真实信道条件

<img alt="" data-attachment-key="W4AZX5Q6" width="923" height="567" src="attachments/W4AZX5Q6.png" ztype="zimage">

技术细节

信号预处理

这里是LoRA信号。包括同步、载波频率偏移补偿和归一化。具体实现参见(Shen 等, 2021)

  1. 同步,同步定位传输起点
  2. preamble提取,不学习整个包,有身份信息
  3. CFO偏移,RFFI的必要步骤,会降低系统性能
  4. 归一化,归一化防止系统学习非特定于设备的接收功率。前导部分通过除以其均方根(RMS)进行归一化。

信道无关频谱图

频谱图受到无线信道的影响,可以通过划分相邻列来减轻这种影响。STFT可以被认为是将s[n]分割成n个样本的M个片段,然后对每个片段执行FFT。硬件失真对频域中传输信号的总体影响表示为F(·)。因此,STFT复矩阵S可以排列为

<img alt="" data-attachment-key="EYHXU6WT" data-annotation="%7B%22attachmentURI%22%3A%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FE7UBRHI8%22%2C%22annotationKey%22%3A%22VWJCJXRT%22%2C%22color%22%3A%22%23ffd400%22%2C%22pageLabel%22%3A%224%22%2C%22position%22%3A%7B%22pageIndex%22%3A3%2C%22rects%22%3A%5B%5B49.233%2C42.5%2C301.233%2C111.5%5D%5D%7D%2C%22citationItem%22%3A%7B%22uris%22%3A%5B%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FMYKUBMQ4%22%5D%2C%22locator%22%3A%224%22%7D%7D" width="420" height="115" src="attachments/EYHXU6WT.png" ztype="zimage">

然后表示成

<img alt="" data-attachment-key="HNFKXMT2" data-annotation="%7B%22attachmentURI%22%3A%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FE7UBRHI8%22%2C%22annotationKey%22%3A%22NHYGVTYQ%22%2C%22color%22%3A%22%23ffd400%22%2C%22pageLabel%22%3A%224%22%2C%22position%22%3A%7B%22pageIndex%22%3A3%2C%22rects%22%3A%5B%5B312.733%2C653.7%2C564.733%2C670.7%5D%5D%7D%2C%22citationItem%22%3A%7B%22uris%22%3A%5B%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FMYKUBMQ4%22%5D%2C%22locator%22%3A%224%22%7D%7D" width="420" height="28" src="attachments/HNFKXMT2.png" ztype="zimage">

该实验中相邻信号段的时间间隔为128μs,可以假设Hm=Hm1H_m=H_{m-1}是合理的,因为无线信道在这么短的时间内不会显著变化,所以可以用第m列除以第m+1列来消除信道的信息

Q=[F(X2)/F(X1),F(X3)/F(X2)F(XM)/F(XM1)].Q= [ F (X2)/ F (X1), F (X3)/ F (X2) · · · F (XM )/ F (XM−1) ] .

数据增强

数据增强的信道效应包括多径和多普勒频移

多径由Power Delay Profile(PDP)描述,离散模型为

P(p)=1τdepTs/τd,p=0,1,,pmaxP (p) = \frac{1}{τ_d} e^{−pT_s/τ_d} , p = 0, 1, · · · , p_{max} ,其中τd是RMS延迟扩展,pmax是最后一条路径的索引。

还考虑了多普勒频移,以前的工作假设信道在分组时间内恒定,不适用LoRa

<img alt="" data-attachment-key="9RURVYT4" data-annotation="%7B%22attachmentURI%22%3A%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FE7UBRHI8%22%2C%22annotationKey%22%3A%22VCVSUIR4%22%2C%22color%22%3A%22%23ffd400%22%2C%22pageLabel%22%3A%224%22%2C%22position%22%3A%7B%22pageIndex%22%3A3%2C%22rects%22%3A%5B%5B34.3%2C494.7%2C302.8%2C735.7%5D%5D%7D%2C%22citationItem%22%3A%7B%22uris%22%3A%5B%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FMYKUBMQ4%22%5D%2C%22locator%22%3A%224%22%7D%7D" width="448" height="402" src="attachments/9RURVYT4.png" ztype="zimage">

网络

改造CNN,由九个卷积层、一个平均池化层和一个512个神经元的密集层组成,还采用了残差结构。

<img alt="" data-attachment-key="8DGFPDUT" data-annotation="%7B%22attachmentURI%22%3A%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FE7UBRHI8%22%2C%22annotationKey%22%3A%22UD7LZK8U%22%2C%22color%22%3A%22%23ffd400%22%2C%22pageLabel%22%3A%225%22%2C%22position%22%3A%7B%22pageIndex%22%3A4%2C%22rects%22%3A%5B%5B331.8%2C228.95%2C525.8%2C466.45%5D%5D%7D%2C%22citationItem%22%3A%7B%22uris%22%3A%5B%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FMYKUBMQ4%22%5D%2C%22locator%22%3A%225%22%7D%7D" width="323" height="395" src="attachments/8DGFPDUT.png" ztype="zimage">

深度度量学习?

输入数据投影到一个空间中,相似样本彼此靠近,不同样本远离

每一步从训练集中选择由锚、阳性和阴性样本组成的三元组。具体到RFFI,锚和阳性样本是来自同一设备的数据包,阴性样本来自不同的设备。计算三重态损耗。三重态损失的目标是最小化锚点和正样本之间的欧几里德距离,同时最大化锚点和负样本之间的距离

实验

实现路径/框架

注册

k-NN分类器的训练阶段,简单记忆所有训练样本。每个合法设备需要先发100个数据包进行注册

识别

1)恶意设备检测:异常检测问题。通过基于距离的k-NN异常检测算法实现的。提取接收到的数据包的RFF,并计算到RFF数据库中其K个最近邻居的平均距离作为检测分数,其数学表达式为

Davg=1K=DiD_{avg} = \frac{1}{ K}∑=D_i

评估指标是接收器工作特性(ROC)曲线。它揭示了在不同阈值设置下假阳性率(FPR)和真阳性率(TPR)之间的权衡。根据ROC曲线计算的曲线下面积(AUC)是另一个重要的评估指标。越接近1,检测性能越好。

2)设备分类:设备分类系统采用多数投票k-NN算法实现。首先提取接收到的数据包的RFF,并根据欧几里德距离从数据库中选择其K个最近邻。然后将此数据包分配给K个邻居中最频繁的标签。

评估指标是混淆矩阵和总体准确度,其定义为正确分类的样本除以测试样本的总数。对于流氓设备检测和设备分类,邻居数量K都设置为15。

实验组

<img alt="" data-attachment-key="FSV2ULQU" data-annotation="%7B%22attachmentURI%22%3A%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FE7UBRHI8%22%2C%22annotationKey%22%3A%22E7MVJVEZ%22%2C%22color%22%3A%22%23ffd400%22%2C%22pageLabel%22%3A%227%22%2C%22position%22%3A%7B%22pageIndex%22%3A6%2C%22rects%22%3A%5B%5B52.25%2C347.15%2C291.25%2C604.65%5D%5D%7D%2C%22citationItem%22%3A%7B%22uris%22%3A%5B%22http%3A%2F%2Fzotero.org%2Fusers%2F13027531%2Fitems%2FMYKUBMQ4%22%5D%2C%22locator%22%3A%227%22%7D%7D" width="398" height="429" src="attachments/FSV2ULQU.png" ztype="zimage">
很典型的对照实验。E1用的数据量最多,作为标准参照模型;DUT的设置还考虑了来自不同厂商的硬件。E6的设置是为什么?

测试时,DUT1-10在E1-3里都用了,所以评估提取已知设备性能。

效果图/结果

记录文章的效果图或结果, 如模型效果图、实验结果、实验数据等

源码

  • 作者源码地址: 仓库链接

  • 数据集名称: LoRa_RFFI_dataset

    • 数据集描述:  射频信号采集自 60 个现成的商用 LoRa 设备。 提供了数据包前导部分和设备标签。 数据集由 19 个子数据集组成

    • 作者数据集下载地址: https://github.com/gxhen/LoRa_RFFI

思考总结

涉及了设备加入离开的可扩展性;考虑了恶意设备存在的安全性;进行了数据增强使方案具备信道鲁棒性。