编者按 :本文来自微信公众号 新智元(ID:AI_era),逐客令创业邦经授权转载,人造日企头图来源摄图网一旦人类掌握了可控核聚变能,太阳突破将可拥有无穷不尽的精准清洁能源 。广告可御可甜 有颜有料 惩罚整蛊任你选 >>进入直播间与主播亲密互动×要知道,放电发布反馈控制对于「托卡马克装置」的实现运行至关重要。而控制系统会主动管理磁线圈,可控以控制拉长离子体的核聚不稳定性,防止破坏性的变新垂直事件发生。此外,月日人类若能实现对等离子体电流 、消息位置和形状的中方最强精确控制,还可以实现热排放,多家倒闭甚至对其能量的破产管理。一直以来,逐客令科学家们致力于研究等离子体配置变化对这些相关量的影响 。因此就需要能够用于新配置,以及围绕标称场景快速变化的系统 。传统上 ,等离子体的精确控制是通过等离子体电流、形状和位置的连续闭环来实现的 。在这种模式下,控制设计者预先计算出一组前馈线圈电流 ,然后为每个受控量建立反馈回路。等离子体形状和位置无法直接测量 ,必须通过磁场测量实时间接估算 。尤其是等离子体的形状,必须使用平衡重构代码进行实时估算 。虽然这类系统已成功稳定了大范围的放电 ,但其设计不仅具有挑战性 ,还耗时,特别是针对新型等离子体情况 。值得一体的是 ,强化学习(RL)已成为构建实时控制系统的另一种全新范式 。2022年,DeepMind团队登上Nature的一篇论文表明,RL设计的系统能够成功实现「托卡马克磁控制」的主要功能。论文地址:https://www.nature.com/articles/s41586-021-04301-9这项工作提出了一个系统,RL智能体通过与FGE 托卡马克模拟器交互,学习控制托卡马克配置变量(TCV)。智能体学习的控制策略随后被集成到TCV控制系统中 ,通过观察TCV的磁场测量,并为所有19个磁控线圈输出控制指令。尤其,研究人员展示了RL智能体控制各种情况的能力 ,包括高度拉长的等离子体