机器学习成为材料科学中复杂数据分析和信息挖掘的有力武器

导语
探索相变和构建相图对于凝聚态物理和材料科学至关重要,是理论和实验领域广泛研究的焦点。相变研究通常需要运用散射、热力学、模拟等综合手段描述相变时序参量的变化,对于序参量未知的体系,传统方法十分局限。最近西安交通大学杨耀东课题组的李玲龙与橡树岭国家实验室kalinin小组合作,在新发表的science advances文章中创新性地提出运用机器学习算法,对扫描探针尖端探测体积下压电弛豫的动力学响应进行数据挖掘,在序参量未知的情况下,确定了纳米尺度的结构相变。这一研究成果实现了序参量缺失情况下的相变表征,为材料科学中高维复杂数据的信息挖掘、分析提供了新颖独特的解决方案。
对于使用机器学习算法构筑相图的设想,研究人员首先在二维ising模型中,构建了该系统在撤去激励磁场后随时间弛豫的多维度数据集,并采用k-means算法处理得到分类簇,发现其以顺磁-铁磁相界分为三个簇,如图一所示。由此,其可行性在模拟数据集中得以证实。
图一k-means聚类算法处理ising模型数据集。
a:三个簇k=0,1,2中数据向量的数量随温度的变化。b:簇中心的向量。c:簇中数据向量数构建的铁磁-顺磁转变相图。
随后在实验研究中,研究人员通过扫描探针加载脉冲电压,以激励弛豫铁电体pmn-pt中微区压电响应的弛豫信号(激励电压波形如图二a所示),并根据不同脉冲偏压和温度,使用频带激励信号增强技术获得多维度的压电弛豫信号数据集。主成分分析(pca)作为一种无监督学习算法,能有效针对高维数据进行降维处理。研究人员使用pca算法,分别获得了数据集的特征值和特征向量。在特征值的突变界面(图二c的黑色虚线),明确指出了相变发生的信号。
图二 频带激励压电力显微镜获得多维度的压电响应弛豫数据集,以及其主成分分析结果。
a:用于压电弛豫测量的波形。b:pca得到的特征向量。c:pca得到的特征值。
进一步使用k-means算法处理偏压-温度多维度数据,根据每一条数据在簇分类中的落点以及簇中包含数据向量的数量,得到偏压-温度维度的相图,如图三b所示。在临界温度70℃左右,落在簇k=0和簇k=1的数据向量的数量发生明显改变,直接对应着材料的两种单斜相mb-mc相变。
图三 k-means聚类结果。a:簇中心向量。b:根据簇中数据落点量构建的偏压-温度相图。
研究工作创新性地采用无监督机器学习算法分析电压-热激励下压电弛豫的高维数据集,自动识别材料的相变过程,构建了弛豫铁电晶体的电压-温度相图。尤其在面向序参量缺失(或不可知)的体系时,相较传统的曲线拟合方法,为微观(电场)-宏观(温度)的实验数据集的分析提供了更普适的、全局的方法。更重要的是,这一研究方法不受限于数据维度和测量手段,使得机器学习成为材料科学中复杂数据分析和信息挖掘的有力武器。

Miso Robotics公司将推出第一个农业机器人
5G FWA的概念与优势,部署场景有哪些特点?
多年来看似“均衡”的代工业格局看来要“失衡”了
华为平板M6高能版搭载麒麟980平台和6GB+128GB运存拥有强劲的游戏性能
基于区块链技术的全球文体娱乐数字资产交易平台HOTchain热度链介绍
机器学习成为材料科学中复杂数据分析和信息挖掘的有力武器
机器学习、高速网络和大内存在这个数据时代并列称王
三星开始量产车载超低功耗UFS 3.1闪存:最大512GB
fireflyCORE-3399主板JD4--Linux开发简介
列举一些成熟软件中C语言常用的宏定义
土壤温度水分盐分ph速测仪的性能指标说明
接口与类的相同点与区别
同在2500价位,小米6和荣耀V9谁更值得买?小米6和荣耀v9评测对比
中国集成电路正待“黑马”奔腾 珠海未来不可限量
服务器数据恢复—XFS文件系统数据恢复案例
解读数商云供应链系统的优势能力,打造医疗器械行业数字化转型新生态
高通让手机快充效率再提升30% 实现15W以上无线充电功率
知行科技为何能在资本寒冬的2018获得投资机构的亲睐
使用HyperLynx修复和解决信号完整性问题
保千里机器人发布会即将举行:2017年1月6日,深圳爆发机器人大战