getpdb

从蛋白质数据库(protein data Bank, PDB)检索蛋白质结构数据

语法

PDBStruct= getpdb (PDBid
PDBStruct= getpdb (PDBid……去整理的,ToFileValue,……)
PDBStruct= getpdb (PDBid……“SequenceOnly”,SequenceOnlyValue,……)

输入参数

PDBid 指定PDB数据库中蛋白质结构记录的唯一标识符的字符向量或字符串。

请注意

PDB数据库中的每个结构都由一个四个字符的字母数字标识符表示。例如,4 hhb是血红蛋白的标识符。

ToFileValue 字符向量或字符串,指定用于保存pdb格式数据的文件名或路径和文件名。如果只指定一个文件名,则该文件将保存在MATLAB中®当前文件夹。

提示

将蛋白质结构记录保存到本地pdb格式的文件后,可以使用pdbread函数将文件读入MATLAB软件离线或使用molviewer功能来显示和操作结构的三维图像。

SequenceOnlyValue 只控制蛋白质序列的返回。的选择是真正的(默认)。

如果有一个序列,它将作为字符数组返回。如果有多个序列,则将它们作为单元格数组返回。

输出参数

PDBStruct MATLAB结构包含一个字段为每个PDB记录。

描述

蛋白质数据库(PDB)数据库是一个由实验确定的三维生物大分子结构数据的存档。getpdb从蛋白质数据库(protein data Bank, PDB)中检索蛋白质结构数据,该数据库包含三维生物大分子结构数据。

PDBStruct= getpdb (PDBid在PDB数据库中搜索标识符指定的蛋白质结构记录PDBid并返回MATLAB结构PDBStruct,其中包含每个PDB记录的字段。下表总结了MATLAB结构中可能的PDB记录和对应的字段PDBStruct

PDB数据库记录 在MATLAB结构中的字段
OBSLTE 过时了
标题 标题
警告 警告
COMPND 复合
KEYWDS 关键字
EXPDTA ExperimentData
作者 作者
REVDAT RevisionDate
SPRSDE 取代
JRNL 杂志
备注1 Remark1
备注N

请注意

N等于2到999。

备注n

请注意

n等于2到999。

DBREF DBReferences
SEQADV SequenceConflicts
SEQRES 序列
FTNOTE 脚注
MODRES ModifiedResidues
HET 异基因
HETNAM HeterogenName
HETSYN HeterogenSynonym
制定 公式
螺旋 螺旋
SSBOND SSBond
链接 链接
HYDBND HydrogenBond
SLTBRG SaltBridge
CISPEP CISPeptides
网站 网站
CRYST1 Cryst1
ORIGXn OriginX
SCALEn 规模
MTRIXn 矩阵
TVECT TranslationVector
模型 模型
原子 原子
SIGATM AtomSD
ANISOU AnisotropicTemp
SIGUIJ AnisotropicTempSD
的怪兽 终端
HETATM HeterogenAtom
连接 连接

PDBStruct= getpdb (PDBid,……”PropertyName”,PropertyValue,……)调用getpdb可选属性使用属性名/属性值对。您可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来,不区分大小写。这些属性名/属性值对如下所示:

PDBStruct= getpdb (PDBid……去整理的,ToFileValue,……)将从数据库返回的数据保存为pdb格式的文件,ToFileValue

提示

将蛋白质结构记录保存到本地pdb格式的文件后,可以使用pdbread函数将文件读入MATLAB软件离线或使用molviewer功能来显示和操作结构的三维图像。

PDBStruct= getpdb (PDBid……“SequenceOnly”,SequenceOnlyValue,……)只控制蛋白质序列的返回。的选择是真正的(默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,则将它们作为单元格数组返回。

序列字段

序列Field也是一个包含以下子字段中的序列信息的结构:

  • NumOfResidues

  • ChainID

  • ResidueNames-包含序列残基的三个字母代码。

  • 序列-包含序列残基的单字母代码。

请注意

如果序列有修饰残基,则ResidueNamesSubfield可能不符合标准的三字母氨基酸编码。在这种情况下,序列子字段将在相应的位置包含修改后的剩余代码。修改后的剩余代码在ModifiedResidues字段。

模型域

模型Field也是包含坐标信息的结构或结构数组。如果MATLAB结构包含一个模型,则模型字段是包含该模型坐标信息的结构。如果MATLAB结构包含多个模型,则模型Field是包含每个模型坐标信息的结构数组。的模型字段包含以下子字段:

  • 原子

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • 终端

  • HeterogenAtom

原子场

原子Field也是一个包含以下子字段的结构数组:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • 入住率

  • tempFactor

  • segID

  • 元素

  • 负责

  • AtomNameStruct—包含3个子字段:chemSymbolremoteInd,分支

例子

检索PDB标识符为的电子传递(血红素)蛋白的结构信息5 cyt,将信息读入MATLAB结构pdbstruct,并保存为pdb格式的文件electron_transport.pdb在MATLAB当前文件夹。

pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')

R2006a之前介绍