原标题:LLNL研发新型深度学习算法提升防核扩散分析能力

图片 1

为加快防止核扩散分析的速度及增加分析所需的数据集,美国劳伦斯利弗莫尔国家实验室(LLNL)正在研发新的深度学习和高性能计算算法,可提升对有关核扩散活动证据大量数据的分析能力。

一、研究背景

人工神经网络已深度嵌入互联网日常功能,如帮助电子邮件程序过滤掉垃圾邮件等。神经网络也可在国家安全中发挥关键作用,帮助开展防止核扩散活动分析,阻止个别国家或行为体建造核武器。

LLNL的数据科学副主任吉姆·布雷斯表示,其目标是汇集能源部实验室各种新型数据科学能力,帮助解决核不扩散中所面临的挑战。

二、研究成果

(1)“语义轮”深度学习框架。项目的核心是LLNL研发的深度学习框架,名为“语义轮”(Semantic
Wheel)。该框架使用神经网络将多模态数据(即图像、文本和视频)“映射”到特征空间,在这些特征空间中它们的彼此相对接近度由其内涵意义的紧密度决定,类似用于多模态数据的“杜威十进制系统”。

LLNL计算机科学家巴里·陈表示,人类无法关注到所有数据,但如果可以教电脑过滤无用信息,分析人员就能更快、更彻底地对关键指标进行分析。陈所研究的深度学习系统能根据数据和武器建造过程的关系,对图像视频以及任何类型的输入数据进行分类,并进行初始筛选。然后,分析人员可查看那些系统建议与武器化过程相关的数据,并评估当前有多少证据表明有关行为体能完成这些武器建造步骤。

例如,“语义轮”可使防止核扩散分析人员使用简单文本来查询“铀浓缩”,并找到与“铀浓缩”相关的先前未标记的图像和视频。为完成该搜索,“语义轮”将在特征空间中返回与“铀浓缩”文本短语相近的数据。这将有助于分析人员快速找到相关的铀浓缩图像和视频,而无需手动查看数百万张图像或花费大量时间观看视频。

研究人员表示,“语义轮”显著的优势是可以找到概念相关的数据,即使这些数据缺少关键词标签。鉴于大多数数据都属于未标记数据,因此这一点非常关键。它还解决了机器学习研究人员训练AI系统所面临的一个关键挑战,即人类注释数据(如带有文本内容描述的的图像和视频)的有限可用性。

(2)自我监督学习方法。先进的神经网络亟需人类注释的数据,并需数百万个样本用于“受监督”学习算法。为应对这一挑战,LLNL团队研发了新的“自我监督”学习算法,不需人工标记数据。这使研究人员能够利用几乎无限的未标记数据来训练神经网络。

通过自我监督学习,该神经网络可自动学习哪些特征有助于其“查看”和“读取”每种数据类型。之后,研究团队将训练更多的“映射”神经网络,将相关概念的图像、视频和文本特征映射到“语义轮”特征空间的近端位置。最后一步则需人工注释的数据,但是研究人员注意到,具有单峰特征的自我监督学习极大地减少了系统学习映射网络和检索跨模态数据所需的数据量。研究人员表示,LLNL的自我监督学习方法在广泛的图像识别任务中表现卓越,在精确度方面全面优于其他无监督深度学习系统。

三、研究意义

LLNL开展了一项为期三年的“实验室定向研发(LDRD)战略计划”项目。作为该项目的一部分,“语义轮”旨在“推动深度学习和高性能超级计算机的极限”。研究团队计划通过增加更多数据进一步改进神经网络。同时,新的研究方法将为美国国家核安全管理局(NNSA)未来开发和应用数据分析、改进核扩散活动的探测奠定基础。

该项目防止核扩散分析负责人雅娜·费尔德曼表示,通过该系统,分析人员能够系统地搜索有关潜在核扩散活动证据的更多数据,包括图像和视频。

来源:美国劳伦斯利弗莫尔国家实验室网站/图片来自互联网

申 淼

如需转载请注明出处:“国防科技要闻”(ID:CDSTIC)

人工智能

陆军

海军

空军

航天

网络空间

电子信息

核武器

精确打击

新概念武器

基础科学

技术

与能源

与制造返回搜狐,查看更多

责任编辑:

相关文章