测试样本和背景

测试样本

下载必要的测试数据: Structure List .

使用方法:

>>> import pandas as pd
>>> from pymatgen.core import Structure
>>> structures = structure_list = pd.read_pickle("sample_data.pkl_pd")
>>> structure = structurei = structure_list[0]

背景

pymatgen 中的 Structure 是代表晶体结构数据的一个类,包含原子及其位置的所有信息。细节参考网址: pymatgen Structure

从这个数据中,使用以下代码,我们能提取出很多原子/元素的序号和名称信息。

比如,对于单个数据 (已经内置于 convert ) :

>>> structure_1 = structure_list[0]
>>> name_1 = [{str(i.symbol): 1} for i in structure_1.species]
>>> number_1 = [i.specie.Z for i in structure_1]

比如,对于批量数据 (已经内置于 transform ) :

>>> name_list = [[{str(i.symbol): 1} for i in si.species] for si in structure_list]
>>> number_list = [[i.specie.Z for i in si] for si in structure_list]

在这个包中,transform 原生接受类似 name_list , number_list 类型的数据,同时,由于上述代码已经内置在包中,因此可以直接使用 structure_list 直接输入数据。

备注

此外 ase.Atoms 数据类型可以通过 AseAtomsAdaptor 先转换为 structure 再进一步处理。并且 name_dict_data , number_data 可以自己生成,无论何种来源只要格式对应均可。