测试样本和背景¶

测试样本¶

下载必要的测试数据： Structure List .

使用方法：

>>> import pandas as pd
>>> from pymatgen.core import Structure
>>> structures = structure_list = pd.read_pickle("sample_data.pkl_pd")
>>> structure = structurei = structure_list[0]

背景¶

pymatgen 中的 Structure 是代表晶体结构数据的一个类，包含原子及其位置的所有信息。细节参考网址: pymatgen Structure 。

从这个数据中，使用以下代码，我们能提取出很多原子/元素的序号和名称信息。

比如，对于单个数据 (已经内置于 convert ) ：

>>> structure_1 = structure_list[0]
>>> name_1 = [{str(i.symbol): 1} for i in structure_1.species]
>>> number_1 = [i.specie.Z for i in structure_1]

比如，对于批量数据 (已经内置于 transform ) ：

>>> name_list = [[{str(i.symbol): 1} for i in si.species] for si in structure_list]
>>> number_list = [[i.specie.Z for i in si] for si in structure_list]

在这个包中，transform 原生接受类似 name_list , number_list 类型的数据，同时，由于上述代码已经内置在包中，因此可以直接使用 structure_list 直接输入数据。

备注

此外 ase.Atoms 数据类型可以通过 AseAtomsAdaptor 先转换为 structure 再进一步处理。并且 name_dict_data , number_data 可以自己生成，无论何种来源只要格式对应均可。