主要内容

ilmnbslookup

查找Illumina公司BeadStudio目标(探测)序列和注释信息

语法

AnnotStruct= ilmnbslookup (AnnotationFileID
AnnotStruct= ilmnbslookup (AnnotationFileID“LookUpField”,LookUpFieldValue

输入参数

AnnotationFile

指定文件名或Illumina的路径和文件名的字符向量或字符串®注释文件(CSV / BGX / TXT格式)。如果您只指定一个文件名,则该文件必须在MATLAB中®搜索路径或在当前文件夹。

提示

您可以下载Illumina注释文件,例如HumanRef-8_V3_0_R0_11282963_A.bgx,从Illumina公司网站

ID

代表Illumina微阵列上一个或多个目标(探针)的唯一标识符的字符向量、字符串、字符串向量或单元格数组。

提示

默认情况下,ID必须匹配Search_keyAnnotationFile.中的任意字段对应的标识符AnnotationFile,然后设置“LookUpField”适当的属性。例如,如果您只想查询7号染色体上的目标(探测)的注释信息,请设置ID“7”,然后设置LookUpFieldValue“染色体”.中的所有字段的列表AnnotationFile,见下表。

LookUpFieldValue

AnnotationFile在哪里ilmnbslookup查找指定的ID.默认的是Search_key字段。

提示

设置此属性,使其对应于ID作为输入。

输出参数

AnnotStruct

方法指定的一个或多个目标(探测)的探测序列和注释信息ID,通过AnnotationFile,一个Illumina注释文件。

AnnotStruct包含相同的字段AnnotationFile.下面两个表中描述了这些字段。

描述

AnnotStruct= ilmnbslookup (AnnotationFileID返回AnnotStruct所指定的一个或多个目标(探测)的探测序列和注释信息ID,通过AnnotationFile,即Illumina注释文件(CSV、BGX或TXT格式)。

AnnotStruct包含相同的字段AnnotationFile.下面两个表中描述了这些字段。

结构创建的Illumina公司CSV文件注释

描述
Search_key 目标的内部标识符,用于自定义设计数组
目标 目标的唯一标识符
ProbeId Illumina公司调查标识符
Gid 基因库®基因标识符
成绩单 Illumina内部转录标识符
加入 该基因的GenBank登录号
象征 通常是基因符号
类型 探测类型
开始 GenBank记录中探针序列的起始位置
Probe_Sequence 探针序列
定义 定义字段来自GenBank记录
本体 与基因相关的基因本体术语
同义词 基因的同义词(来自GenBank记录)

从BGX或TXT注释文件创建的结构

描述
加入 该基因的GenBank登录号
Array_Address_Id 译码器标识符
染色体 基因所在的染色体
Cytoband 与靶基因相关的染色体上的细胞遗传学带区
定义 定义字段来自GenBank记录
Entrez_Gene_ID Entrez基因的基因数据库标识符
胃肠道 基因的GenBank标识符
ILMN_Gene Illuminainternal基因符号
Obsolete_Probe_Id BGX注释文件之前的探测标识符
Ontology_Component 基因本体与基因相关的细胞成分
Ontology_Function 基因本体与基因相关的分子功能
Ontology_Process 基因本体论与基因相关的生物过程
Probe_Chr_Orientation 探针在NCBI基因组构建上的定位
Probe_Coordinates 探针在NCBI基因组构建上的基因组位置
Probe_Id Illuminaprobe标识符
Probe_Sequence 探针序列
Probe_Start 探头相对于5的起始位置源转录本序列结束
Probe_Type 关于调查目标的信息
Protein_Product NCBI蛋白登录号
RefSeq_ID 来自NCBI RefSeq数据库的标识符
Reporter_Composite_map 与控制探测相关联的信息
Reporter_Group_Name 与控制探测相关联的信息
Reporter_Group_id 与控制探测相关联的信息
Search_Key 目标的内部标识符,用于自定义设计数组
获得转录本序列的来源
Source_Reference_ID 源的标识符
物种 与该基因相关的物种
象征 通常是基因符号
同义词 基因的同义词(来自GenBank记录)
成绩单 Illuminainternal记录标识符
Unigene_ID 来自NCBI UniGene数据库的标识符

AnnotStruct= ilmnbslookup (AnnotationFileID“LookUpField”,LookUpFieldValue查找ID的字段中的注释文件中LookUpFieldValue.默认的是Search_key字段。

例子

请注意

基因表达文件,TumorAdjacent-probe-raw.txt,注释文件,HumanRef-8_V3_0_R0_11282963_A.bgx生物信息学工具箱™软件并不提供以下示例中使用的生物信息学工具箱™。

18例。查询单个目标(探针)的注释信息
  1. 读取从Illumina BeadStudio™软件导出到MATLAB结构的制表符分隔文件的内容。

    ilmnStruct = ilmnbsread(' tumor邻接-probe-raw.txt') ilmnStruct = Header: [1x1 struct] TargetID: {22184x1 cell} ColumnNames: {1x37 cell} Data: [22184x37 double] TextColumnNames: {1x23 cell} TextData: {22184x23 cell}
  2. 找到的号码Search_keyTextColumnNames单元格数组中返回的ilmnStruct结构的ilmnbsread函数。

    srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames)
  3. 查找注释文件中第10个条目的探测序列和注释信息,HumanRef-8_V3_0_R0_11282963_A.bgx

    注释= ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…ilmnStruct.TextData{10,srchCol}) annotation = Accession: 'NM_144670.2' Array_Address_Id: '0004050154'染色体:'12'胞带:'12p13.31b'定义:'智人α -2-巨球蛋白样1 (A2ML1), mRNA.'Entrez_Gene_ID: '144568' GI: '74271844' ILMN_Gene: 'A2ML1' Obsolete_Probe_Id: " Ontology_Component: " Ontology_Function: '内肽酶抑制剂活性[goid 4866] [evidence IEA]' Ontology_Process: " Probe_Chr_Orientation: '+' Probe_Coordinates: '8920412-8920461' Probe_Id: 'ILMN_2136495' Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT' Probe_Start: '4889' Probe_Type: 'S' Protein_Product: 'NP_653271.2' RefSeq_ID: 'NM_144670.2' Reporter_Composite_map: '" Reporter_Group_Name: " Reporter_Group_id: " Search_Key: 'ILMN_17375' Source: 'RefSeq' Source_Reference_ID: 'NM_144670.2'物种:'智人'符号:'A2ML1'同义词:[1x141 char] Transcript: 'ILMN_17375' Unigene_ID: "
示例19。查找目标(探测)子集的注释信息

使用ilmnbslookup函数与“LookUpField”属性查找注释文件中位于12号染色体上的所有目标的注释信息,HumanRef-8_V3_0_R0_11282963_A.bgx

chr12annotation = ilmnbslookup(“HumanRef-8_V3_0_R0_11282963_A.bgx”,…'12','LookUpField','染色体')chr12annotation = Accession: {1x1186 cell} Array_Address_Id: {1x1186 cell}胞带:{1x1186 cell}定义:{1x1186 cell} Entrez_Gene_ID: {1x1186 cell} GI: {1x1186 cell} ILMN_Gene: {1x1186 cell} Obsolete_Probe_Id: {1x1186 cell} ontology y_component: {1x1186 cell} ontology y_function: {1x1186 cell} ontology y_process: {1x1186 cell} Probe_Chr_Orientation: {1x1186 cell} Probe_Id: {1x1186 cell} Probe_Sequence:{1x1186 cell} Probe_Start: {1x1186 cell} Probe_Type: {1x1186 cell} Protein_Product: {1x1186 cell} RefSeq_ID: {1x1186 cell} Reporter_Composite_map: " Reporter_Group_Name: " Reporter_Group_id: " Search_Key: {1x1186 cell} Source: {1x1186 cell} Source_Reference_ID: {1x1186 cell} Species: {1x1186 cell} Symbol: {1x1186 cell}代名词:{1x1186 cell} Transcript: {1x1186 cell} Unigene_ID: {1x1186 cell}

输出结构显示在12号染色体上有1186个靶标。

版本历史

介绍了R2008a

另请参阅