关键词:
形式化方法
动态系统
李雅普诺夫屏障证书
混合整数规划
摘要:
信息物理系统(Cyber-Physical Systems,CPS)是一类集成了计算、通信、控制和传感技术的复杂系统,广泛应用于智能交通、工业制造、航空航天、智能家居等领域。动态系统理论提供了一种数学建模的方法,可以用来描述CPS或其子系统的运动状态和变化趋势,并实现控制和优化。通过动态系统建模,研究人员能够更清楚地了解系统的行为和特征,探索系统的内在规律和机制,从而为系统的设计和控制提供参考和指导,提高系统的可靠性、安全性和效率。但由于动态系统行为的复杂性和不确定性,传统的建模方法面临准确性、效率和可扩性方面的挑战。深度学习技术为动态系统提供了简单、灵活的建模方案,然而其难以解释的特点限制了它在安全攸关领域的应用。形式化方法能在一定程度上弥补深度学习技术的缺陷,该方法通过数学计算和逻辑推理来分析系统的设计并检测潜在的错误和缺陷,为计算机软件系统的正确性提供严格保证。本文针对具有安全性和可达性的动态系统提出了形式化学习方法,该方法结合了深度学习强大的建模能力和形式化方法的严密逻辑来自动学习和验证动态系统模型,确保它们符合预定义的规约——安全性和可达性。其中,安全性是指对于给定系统的初始状态,系统在随时间演化的过程中不会进入不安全状态集;可达性是指系统状态随着时间的推移总能进入目标状态集。本文的研究内容如下:·研究了面向离散系统的形式化学习方法。设计了离散系统的神经网络李雅普诺夫屏障证书(Lyapunov Barrier Certificate,LBC)及其训练方式,LBC是表明系统具有安全性和可达性的通用证书。训练得到的神经网络证书通过混合整数线性规划技术得到验证,这种优化技术可用于解决涉及连续变量和离散变量的数学优化问题。通过将神经网络的验证问题表述为具有二值变量的优化问题并求解,即可判定模型和神经网络证书是否满足规约。实验结果表明,该方法能够成功合成离散系统的LBC,且与DDPG(Deep Deterministic Policy Gradient)相比有更好的长期预测效果。·研究了面向连续系统的形式化学习方法。由于连续系统和离散系统具有不同形式,这导致了李雅普诺夫屏障证书的形式也不同,因此需针对性地设计损失函数。为了验证连续形式下的LBC中的李导数条件,需要采用混合整数二次规划,这种规划技术用于解决包含线性约束和二次约束的优化问题。在实验中,应用这一形式化学习方法成功合成了神经网络证书,且准确地重建了系统的向量场。·对上述两种方法实现了一个形式化学习框架FLMSR。该框架由三个交互部分组成:Learner、Seeker和Verifier。其中Learner用于联合学习动态系统模型和神经网络证书,Seeker对系统状态空间进行采样,通过仿真寻找反例,反例会在下一次迭代中用于更新模型和证书。Seeker寻找反例的方式是算力节约型的,如果这种方式未能找到反例,Verifier将对模型和证书进行验证,以对模型的安全性和可达性提供形式化保证。