ilmnbslookup

查找Illumina公司BeadStudio目标(探测)序列和注释信息

语法

AnnotStruct= ilmnbslookup (AnnotationFile，ID） AnnotStruct= ilmnbslookup (AnnotationFile，ID“LookUpField”,LookUpFieldValue）

输入参数

`AnnotationFile`	指定文件名或Illumina的路径和文件名的字符向量或字符串^®注释文件(CSV / BGX / TXT格式)。如果您只指定一个文件名，则该文件必须在MATLAB中^®搜索路径或在当前文件夹。提示您可以下载Illumina注释文件，例如`HumanRef-8_V3_0_R0_11282963_A.bgx`,从Illumina公司网站．
`ID`	代表Illumina微阵列上一个或多个目标(探针)的唯一标识符的字符向量、字符串、字符串向量或单元格数组。提示默认情况下,`ID`必须匹配`Search_key`场`AnnotationFile`．中的任意字段对应的标识符`AnnotationFile`，然后设置`“LookUpField”`适当的属性。例如，如果您只想查询7号染色体上的目标(探测)的注释信息，请设置`ID`来`“7”`,然后设置`LookUpFieldValue`来`“染色体”`．中的所有字段的列表`AnnotationFile`，见下表。
`LookUpFieldValue`	场`AnnotationFile`在哪里`ilmnbslookup`查找指定的`ID`．默认的是`Search_key`字段。提示设置此属性，使其对应于`ID`作为输入。

输出参数

AnnotStruct

方法指定的一个或多个目标(探测)的探测序列和注释信息ID,通过AnnotationFile，一个Illumina注释文件。

AnnotStruct包含相同的字段AnnotationFile．下面两个表中描述了这些字段。

描述

AnnotStruct= ilmnbslookup (AnnotationFile，ID）返回AnnotStruct所指定的一个或多个目标(探测)的探测序列和注释信息ID,通过AnnotationFile，即Illumina注释文件(CSV、BGX或TXT格式)。

AnnotStruct包含相同的字段AnnotationFile．下面两个表中描述了这些字段。

结构创建的Illumina公司CSV文件注释

场	描述
`Search_key`	目标的内部标识符，用于自定义设计数组
`目标`	目标的唯一标识符
`ProbeId`	Illumina公司调查标识符
`Gid`	基因库^®基因标识符
`成绩单`	Illumina内部转录标识符
`加入`	该基因的GenBank登录号
`象征`	通常是基因符号
`类型`	探测类型
`开始`	GenBank记录中探针序列的起始位置
`Probe_Sequence`	探针序列
`定义`	定义字段来自GenBank记录
`本体`	与基因相关的基因本体术语
`同义词`	基因的同义词(来自GenBank记录)

从BGX或TXT注释文件创建的结构

场	描述
`加入`	该基因的GenBank登录号
`Array_Address_Id`	译码器标识符
`染色体`	基因所在的染色体
`Cytoband`	与靶基因相关的染色体上的细胞遗传学带区
`定义`	定义字段来自GenBank记录
`Entrez_Gene_ID`	Entrez基因的基因数据库标识符
`胃肠道`	基因的GenBank标识符
`ILMN_Gene`	Illuminainternal基因符号
`Obsolete_Probe_Id`	BGX注释文件之前的探测标识符
`Ontology_Component`	基因本体与基因相关的细胞成分
`Ontology_Function`	基因本体与基因相关的分子功能
`Ontology_Process`	基因本体论与基因相关的生物过程
`Probe_Chr_Orientation`	探针在NCBI基因组构建上的定位
`Probe_Coordinates`	探针在NCBI基因组构建上的基因组位置
`Probe_Id`	Illuminaprobe标识符
`Probe_Sequence`	探针序列
`Probe_Start`	探头相对于5的起始位置`＇`源转录本序列结束
`Probe_Type`	关于调查目标的信息
`Protein_Product`	NCBI蛋白登录号
`RefSeq_ID`	来自NCBI RefSeq数据库的标识符
`Reporter_Composite_map`	与控制探测相关联的信息
`Reporter_Group_Name`	与控制探测相关联的信息
`Reporter_Group_id`	与控制探测相关联的信息
`Search_Key`	目标的内部标识符，用于自定义设计数组
`源`	获得转录本序列的来源
`Source_Reference_ID`	源的标识符
`物种`	与该基因相关的物种
`象征`	通常是基因符号
`同义词`	基因的同义词(来自GenBank记录)
`成绩单`	Illuminainternal记录标识符
`Unigene_ID`	来自NCBI UniGene数据库的标识符

AnnotStruct= ilmnbslookup (AnnotationFile，ID“LookUpField”,LookUpFieldValue）查找ID的字段中的注释文件中LookUpFieldValue．默认的是Search_key字段。

例子

请注意

基因表达文件，TumorAdjacent-probe-raw.txt，注释文件，HumanRef-8_V3_0_R0_11282963_A.bgx生物信息学工具箱™软件并不提供以下示例中使用的生物信息学工具箱™。

18例。查询单个目标(探针)的注释信息

读取从Illumina BeadStudio™软件导出到MATLAB结构的制表符分隔文件的内容。

ilmnStruct = ilmnbsread(' tumor邻接-probe-raw.txt') ilmnStruct = Header: [1x1 struct] TargetID: {22184x1 cell} ColumnNames: {1x37 cell} Data: [22184x37 double] TextColumnNames: {1x23 cell} TextData: {22184x23 cell}

找到的号码Search_key列TextColumnNames单元格数组中返回的ilmnStruct结构的ilmnbsread函数。
```
srchCol = find(strcmpi('Search_Key'，ilmnStruct.TextColumnNames)
```

查找注释文件中第10个条目的探测序列和注释信息，HumanRef-8_V3_0_R0_11282963_A.bgx．

注释= ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…ilmnStruct.TextData{10,srchCol}) annotation = Accession: 'NM_144670.2' Array_Address_Id: '0004050154'染色体:'12'胞带:'12p13.31b'定义:'智人α -2-巨球蛋白样1 (A2ML1)， mRNA.'Entrez_Gene_ID: '144568' GI: '74271844' ILMN_Gene: 'A2ML1' Obsolete_Probe_Id: " Ontology_Component: " Ontology_Function: '内肽酶抑制剂活性[goid 4866] [evidence IEA]' Ontology_Process: " Probe_Chr_Orientation: '+' Probe_Coordinates: '8920412-8920461' Probe_Id: 'ILMN_2136495' Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT' Probe_Start: '4889' Probe_Type: 'S' Protein_Product: 'NP_653271.2' RefSeq_ID: 'NM_144670.2' Reporter_Composite_map: '" Reporter_Group_Name: " Reporter_Group_id: " Search_Key: 'ILMN_17375' Source: 'RefSeq' Source_Reference_ID: 'NM_144670.2'物种:'智人'符号:'A2ML1'同义词:[1x141 char] Transcript: 'ILMN_17375' Unigene_ID: "

示例19。查找目标(探测)子集的注释信息

使用ilmnbslookup函数与“LookUpField”属性查找注释文件中位于12号染色体上的所有目标的注释信息，HumanRef-8_V3_0_R0_11282963_A.bgx．

chr12annotation = ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…'12'，'LookUpField'，'染色体')chr12annotation = Accession: {1x1186 cell} Array_Address_Id: {1x1186 cell}胞带:{1x1186 cell}定义:{1x1186 cell} Entrez_Gene_ID: {1x1186 cell} GI: {1x1186 cell} ILMN_Gene: {1x1186 cell} Obsolete_Probe_Id: {1x1186 cell} ontology y_component: {1x1186 cell} ontology y_function: {1x1186 cell} ontology y_process: {1x1186 cell} Probe_Chr_Orientation: {1x1186 cell} Probe_Id: {1x1186 cell} Probe_Sequence:{1x1186 cell} Probe_Start: {1x1186 cell} Probe_Type: {1x1186 cell} Protein_Product: {1x1186 cell} RefSeq_ID: {1x1186 cell} Reporter_Composite_map: " Reporter_Group_Name: " Reporter_Group_id: " Search_Key: {1x1186 cell} Source: {1x1186 cell} Source_Reference_ID: {1x1186 cell} Species: {1x1186 cell} Symbol: {1x1186 cell}代名词:{1x1186 cell} Transcript: {1x1186 cell} Unigene_ID: {1x1186 cell}

输出结构显示在12号染色体上有1186个靶标。

版本历史

介绍了R2008a

另请参阅

ilmnbsread