介绍

_images/img.jpg

Featurebox 包含了一些工具,用于材料特征的 生成选择 。其中 生成 工具通用于批量产生特征及相关辅助工具,筛选 工具通用于特征筛选。

此外,包含一种通过命令行调用的性质 提取 工具,用于处理需要一定的后续复杂计算,或第三方软件参与计算的某些特殊性质。此工具目前主要针对vasp第一性原理计算分析,其他软件支持陆续开发中。

总之, Batching 是 featurebox 的核心思想, 从频繁的重复性操作中解放双手,更好的关注于数据本身。

特征生成成工具

名称

应用

featurebox.featurizers.atom.mapper

获取化合物的每个元素数据特征。

featurebox.featurizers.envir

获取化合物的局域环境特征。

featurebox.featurizers.state

获得化合物整体的状态特征。

featurebox.featurizers.bond.expander

转换键特征。

featurebox.featurizers.batch_feature

生成特征的一键式”傻瓜“工具。

featurebox.data.namesplit.NameSplit

将复杂的纯文本化学式名称分割成元素比例表格。

featurebox.data.mp_access.MpAccess

pymatgen API 数据工具。

所有的特征产生工具,使用 convert 方法处理单一数据。并且使用 fit_transform 方法批量处理数据列表。

指南: 数据类型

绑定选择工具

名称

应用

featurebox.selection.backforward.BackForward

前进后退筛选

featurebox.selection.corr.Corr

相关系数筛选

featurebox.selection.exhaustion.Exhaustion

穷举筛选

featurebox.selection.ga.GA

遗传算法筛选

所有的选择类工具为 sklearn-type,有 fitfit_transform 等方法。

备注

其中绑定意味着将绑定特征视为一个整体,并同步筛选或删除绑定特征。

指南: 绑定筛选

性质批量提取器

名称

应用

featurebox.cli.vasp_bader

bader 电荷

featurebox.cli.vasp_cohp

COHP 成键

featurebox.cli.vasp_dbc

能带中心(d,p)

featurebox.cli.vasp_dos

态密度

featurebox.cli

更多

所有的特征提取工具,使用 convert 方法处理单一数据。并且使用 fit_transform 方法批量处理数据列表。

指南: 性质提取器

备注

建议使用 命令行 方式调用提取器,当然,也能使用python交互模式完成更多复杂功能。

备注

旧的神经网络部分 Graph neural network 已经被移到 pyg_extension 包, 神经网络的输入建立在特征生成成工具的基础上,使用其中的 envir , bond , atom 等生成。