介绍¶
Featurebox 包含了一些工具,用于材料特征的 生成 和 选择 。其中 生成 工具通用于批量产生特征及相关辅助工具,筛选 工具通用于特征筛选。
此外,包含一种通过命令行调用的性质 提取 工具,用于处理需要一定的后续复杂计算,或第三方软件参与计算的某些特殊性质。此工具目前主要针对vasp第一性原理计算分析,其他软件支持陆续开发中。
总之, Batching
是 featurebox 的核心思想, 从频繁的重复性操作中解放双手,更好的关注于数据本身。
特征生成成工具¶
名称 |
应用 |
获取化合物的每个元素数据特征。 |
|
获取化合物的局域环境特征。 |
|
获得化合物整体的状态特征。 |
|
|
转换键特征。 |
生成特征的一键式”傻瓜“工具。 |
|
将复杂的纯文本化学式名称分割成元素比例表格。 |
|
pymatgen API 数据工具。 |
所有的特征产生工具,使用 convert
方法处理单一数据。并且使用 fit_transform
方法批量处理数据列表。
指南: 数据类型
绑定选择工具¶
名称 |
应用 |
|
前进后退筛选 |
|
相关系数筛选 |
|
穷举筛选 |
|
遗传算法筛选 |
所有的选择类工具为 sklearn-type
,有 fit
,fit_transform
等方法。
备注
其中绑定意味着将绑定特征视为一个整体,并同步筛选或删除绑定特征。
指南: 绑定筛选
性质批量提取器¶
名称 |
应用 |
bader 电荷 |
|
COHP 成键 |
|
能带中心(d,p) |
|
态密度 |
|
更多 … |
所有的特征提取工具,使用 convert
方法处理单一数据。并且使用 fit_transform
方法批量处理数据列表。
指南: 性质提取器
备注
建议使用 命令行
方式调用提取器,当然,也能使用python交互模式完成更多复杂功能。
备注
旧的神经网络部分 Graph neural network 已经被移到 pyg_extension
包, 神经网络的输入建立在特征生成成工具的基础上,使用其中的 envir , bond , atom 等生成。