从蛋白质数据库(protein data Bank, PDB)检索蛋白质结构数据
PDBStruct
= getpdb (PDBid
)PDBStruct
= getpdb (PDBid
……去整理的,ToFileValue
,……)PDBStruct
= getpdb (PDBid
……“SequenceOnly”,SequenceOnlyValue
,……)
PDBid |
指定PDB数据库中蛋白质结构记录的唯一标识符的字符向量或字符串。请注意PDB数据库中的每个结构都由一个四个字符的字母数字标识符表示。例如, |
ToFileValue |
字符向量或字符串,指定用于保存pdb格式数据的文件名或路径和文件名。如果只指定一个文件名,则该文件将保存在MATLAB中®当前文件夹。 |
SequenceOnlyValue |
只控制蛋白质序列的返回。的选择是真正的 或假 (默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,则将它们作为单元格数组返回。 |
PDBStruct |
MATLAB结构包含一个字段为每个PDB记录。 |
蛋白质数据库(PDB)数据库是一个由实验确定的三维生物大分子结构数据的存档。getpdb
从蛋白质数据库(protein data Bank, PDB)中检索蛋白质结构数据,该数据库包含三维生物大分子结构数据。
在PDB数据库中搜索标识符指定的蛋白质结构记录PDBStruct
= getpdb (PDBid
)PDBid
并返回MATLAB结构PDBStruct
,其中包含每个PDB记录的字段。下表总结了MATLAB结构中可能的PDB记录和对应的字段PDBStruct
:
PDB数据库记录 | 在MATLAB结构中的字段 |
---|---|
头 |
头 |
OBSLTE |
过时了 |
标题 |
标题 |
警告 |
警告 |
COMPND |
复合 |
源 |
源 |
KEYWDS |
关键字 |
EXPDTA |
ExperimentData |
作者 |
作者 |
REVDAT |
RevisionDate |
SPRSDE |
取代 |
JRNL |
杂志 |
备注1 |
Remark1 |
备注N
请注意N等于2到999。 |
备注n
请注意n等于2到999。 |
DBREF |
DBReferences |
SEQADV |
SequenceConflicts |
SEQRES |
序列 |
FTNOTE |
脚注 |
MODRES |
ModifiedResidues |
HET |
异基因 |
HETNAM |
HeterogenName |
HETSYN |
HeterogenSynonym |
制定 |
公式 |
螺旋 |
螺旋 |
表 |
表 |
转 |
转 |
SSBOND |
SSBond |
链接 |
链接 |
HYDBND |
HydrogenBond |
SLTBRG |
SaltBridge |
CISPEP |
CISPeptides |
网站 |
网站 |
CRYST1 |
Cryst1 |
ORIGXn |
OriginX |
SCALEn |
规模 |
MTRIXn |
矩阵 |
TVECT |
TranslationVector |
模型 |
模型 |
原子 |
原子 |
SIGATM |
AtomSD |
ANISOU |
AnisotropicTemp |
SIGUIJ |
AnisotropicTempSD |
的怪兽 |
终端 |
HETATM |
HeterogenAtom |
连接 |
连接 |
调用PDBStruct
= getpdb (PDBid
,……”PropertyName
”,PropertyValue
,……)getpdb
可选属性使用属性名/属性值对。您可以以任意顺序指定一个或多个属性。每一个PropertyName
必须用单引号括起来,不区分大小写。这些属性名/属性值对如下所示:
将从数据库返回的数据保存为pdb格式的文件,PDBStruct
= getpdb (PDBid
……去整理的,ToFileValue
,……)ToFileValue
.
只控制蛋白质序列的返回。的选择是PDBStruct
= getpdb (PDBid
……“SequenceOnly”,SequenceOnlyValue
,……)真正的
或假
(默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,则将它们作为单元格数组返回。
的序列
Field也是一个包含以下子字段中的序列信息的结构:
NumOfResidues
ChainID
ResidueNames
-包含序列残基的三个字母代码。
序列
-包含序列残基的单字母代码。
如果序列有修饰残基,则ResidueNames
Subfield可能不符合标准的三字母氨基酸编码。在这种情况下,序列
子字段将在相应的位置包含修改后的剩余代码。修改后的剩余代码在ModifiedResidues
字段。
的模型
Field也是包含坐标信息的结构或结构数组。如果MATLAB结构包含一个模型,则模型
字段是包含该模型坐标信息的结构。如果MATLAB结构包含多个模型,则模型
Field是包含每个模型坐标信息的结构数组。的模型
字段包含以下子字段:
原子
AtomSD
AnisotropicTemp
AnisotropicTempSD
终端
HeterogenAtom
的原子
Field也是一个包含以下子字段的结构数组:
AtomSerNo
AtomName
altLoc
resName
chainID
resSeq
iCode
X
Y
Z
入住率
tempFactor
segID
元素
负责
AtomNameStruct
—包含3个子字段:chemSymbol
,remoteInd
,分支
.
检索PDB标识符为的电子传递(血红素)蛋白的结构信息5 cyt
,将信息读入MATLAB结构pdbstruct
,并保存为pdb格式的文件electron_transport.pdb
在MATLAB当前文件夹。
pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')