ilmnbslookup
查找Illumina公司BeadStudio目标(探测)序列和注释信息
语法
AnnotStruct
= ilmnbslookup (AnnotationFile
,ID
)AnnotStruct
= ilmnbslookup (AnnotationFile
,ID
“LookUpField”,LookUpFieldValue
)
输入参数
AnnotationFile |
指定文件名或Illumina的路径和文件名的字符向量或字符串®注释文件(CSV / BGX / TXT格式)。如果您只指定一个文件名,则该文件必须在MATLAB中®搜索路径或在当前文件夹。 提示 您可以下载Illumina注释文件,例如 |
ID |
代表Illumina微阵列上一个或多个目标(探针)的唯一标识符的字符向量、字符串、字符串向量或单元格数组。 提示 默认情况下, |
LookUpFieldValue |
场 提示 设置此属性,使其对应于 |
输出参数
AnnotStruct |
方法指定的一个或多个目标(探测)的探测序列和注释信息
|
描述
返回AnnotStruct
= ilmnbslookup (AnnotationFile
,ID
)AnnotStruct
所指定的一个或多个目标(探测)的探测序列和注释信息ID
,通过AnnotationFile
,即Illumina注释文件(CSV、BGX或TXT格式)。
AnnotStruct
包含相同的字段AnnotationFile
.下面两个表中描述了这些字段。
结构创建的Illumina公司CSV文件注释
场 | 描述 |
---|---|
Search_key |
目标的内部标识符,用于自定义设计数组 |
目标 |
目标的唯一标识符 |
ProbeId |
Illumina公司调查标识符 |
Gid |
基因库®基因标识符 |
成绩单 |
Illumina内部转录标识符 |
加入 |
该基因的GenBank登录号 |
象征 |
通常是基因符号 |
类型 |
探测类型 |
开始 |
GenBank记录中探针序列的起始位置 |
Probe_Sequence |
探针序列 |
定义 |
定义字段来自GenBank记录 |
本体 |
与基因相关的基因本体术语 |
同义词 |
基因的同义词(来自GenBank记录) |
从BGX或TXT注释文件创建的结构
场 | 描述 |
---|---|
加入 |
该基因的GenBank登录号 |
Array_Address_Id |
译码器标识符 |
染色体 |
基因所在的染色体 |
Cytoband |
与靶基因相关的染色体上的细胞遗传学带区 |
定义 |
定义字段来自GenBank记录 |
Entrez_Gene_ID |
Entrez基因的基因数据库标识符 |
胃肠道 |
基因的GenBank标识符 |
ILMN_Gene |
Illuminainternal基因符号 |
Obsolete_Probe_Id |
BGX注释文件之前的探测标识符 |
Ontology_Component |
基因本体与基因相关的细胞成分 |
Ontology_Function |
基因本体与基因相关的分子功能 |
Ontology_Process |
基因本体论与基因相关的生物过程 |
Probe_Chr_Orientation |
探针在NCBI基因组构建上的定位 |
Probe_Coordinates |
探针在NCBI基因组构建上的基因组位置 |
Probe_Id |
Illuminaprobe标识符 |
Probe_Sequence |
探针序列 |
Probe_Start |
探头相对于5的起始位置' 源转录本序列结束 |
Probe_Type |
关于调查目标的信息 |
Protein_Product |
NCBI蛋白登录号 |
RefSeq_ID |
来自NCBI RefSeq数据库的标识符 |
Reporter_Composite_map |
与控制探测相关联的信息 |
Reporter_Group_Name |
与控制探测相关联的信息 |
Reporter_Group_id |
与控制探测相关联的信息 |
Search_Key |
目标的内部标识符,用于自定义设计数组 |
源 |
获得转录本序列的来源 |
Source_Reference_ID |
源的标识符 |
物种 |
与该基因相关的物种 |
象征 |
通常是基因符号 |
同义词 |
基因的同义词(来自GenBank记录) |
成绩单 |
Illuminainternal记录标识符 |
Unigene_ID |
来自NCBI UniGene数据库的标识符 |
查找AnnotStruct
= ilmnbslookup (AnnotationFile
,ID
“LookUpField”,LookUpFieldValue
)ID
的字段中的注释文件中LookUpFieldValue
.默认的是Search_key
字段。
例子
请注意
基因表达文件,TumorAdjacent-probe-raw.txt
,注释文件,HumanRef-8_V3_0_R0_11282963_A.bgx
生物信息学工具箱™软件并不提供以下示例中使用的生物信息学工具箱™。
读取从Illumina BeadStudio™软件导出到MATLAB结构的制表符分隔文件的内容。
ilmnStruct = ilmnbsread(' tumor邻接-probe-raw.txt') ilmnStruct = Header: [1x1 struct] TargetID: {22184x1 cell} ColumnNames: {1x37 cell} Data: [22184x37 double] TextColumnNames: {1x23 cell} TextData: {22184x23 cell}
找到的号码
Search_key
列TextColumnNames
单元格数组中返回的ilmnStruct
结构的ilmnbsread
函数。srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames)
查找注释文件中第10个条目的探测序列和注释信息,
HumanRef-8_V3_0_R0_11282963_A.bgx
.注释= ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…ilmnStruct.TextData{10,srchCol}) annotation = Accession: 'NM_144670.2' Array_Address_Id: '0004050154'染色体:'12'胞带:'12p13.31b'定义:'智人α -2-巨球蛋白样1 (A2ML1), mRNA.'Entrez_Gene_ID: '144568' GI: '74271844' ILMN_Gene: 'A2ML1' Obsolete_Probe_Id: " Ontology_Component: " Ontology_Function: '内肽酶抑制剂活性[goid 4866] [evidence IEA]' Ontology_Process: " Probe_Chr_Orientation: '+' Probe_Coordinates: '8920412-8920461' Probe_Id: 'ILMN_2136495' Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT' Probe_Start: '4889' Probe_Type: 'S' Protein_Product: 'NP_653271.2' RefSeq_ID: 'NM_144670.2' Reporter_Composite_map: '" Reporter_Group_Name: " Reporter_Group_id: " Search_Key: 'ILMN_17375' Source: 'RefSeq' Source_Reference_ID: 'NM_144670.2'物种:'智人'符号:'A2ML1'同义词:[1x141 char] Transcript: 'ILMN_17375' Unigene_ID: "
使用ilmnbslookup
函数与“LookUpField”
属性查找注释文件中位于12号染色体上的所有目标的注释信息,HumanRef-8_V3_0_R0_11282963_A.bgx
.
chr12annotation = ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…'12','LookUpField','染色体')chr12annotation = Accession: {1x1186 cell} Array_Address_Id: {1x1186 cell}胞带:{1x1186 cell}定义:{1x1186 cell} Entrez_Gene_ID: {1x1186 cell} GI: {1x1186 cell} ILMN_Gene: {1x1186 cell} Obsolete_Probe_Id: {1x1186 cell} ontology y_component: {1x1186 cell} ontology y_function: {1x1186 cell} ontology y_process: {1x1186 cell} Probe_Chr_Orientation: {1x1186 cell} Probe_Id: {1x1186 cell} Probe_Sequence:{1x1186 cell} Probe_Start: {1x1186 cell} Probe_Type: {1x1186 cell} Protein_Product: {1x1186 cell} RefSeq_ID: {1x1186 cell} Reporter_Composite_map: " Reporter_Group_Name: " Reporter_Group_id: " Search_Key: {1x1186 cell} Source: {1x1186 cell} Source_Reference_ID: {1x1186 cell} Species: {1x1186 cell} Symbol: {1x1186 cell}代名词:{1x1186 cell} Transcript: {1x1186 cell} Unigene_ID: {1x1186 cell}
输出结构显示在12号染色体上有1186个靶标。
版本历史
介绍了R2008a