主要内容

上下文

在文档中搜索上下文中出现的单词或n-gram

描述

例子

T=上下文(文档单词在中搜索单个单词的出现次数文档并返回一个表,其中显示单词上下文和它的位置。缺省情况下,该函数区分大小写。

例子

T=上下文(文档n搜索中出现的n-gram文档.缺省情况下,该函数区分大小写。

例子

T=上下文(___contextLength.指定使用以前的任何语法返回的上下文的长度。

例子

T=上下文(___名称、值使用一个或多个名称-值对参数(使用以前的任何语法)指定其他选项。

例子

全部崩溃

加载示例数据。该文件十四行诗预处理.txt包含了经过预处理的莎士比亚十四行诗。该文件每行包含一首十四行诗,单词之间用空格分隔。将文本从十四行诗预处理.txt,将文本以换行符分割为文档,然后标记文档。

文件名=“十四行诗预处理.txt”;str = extractFileText(文件名);textData =分裂(str,换行符);文件= tokenizedDocument (textData);

搜索“生命”这个词。

台=上下文(文档,“生活”);头(台)
ans=8×3表上下文文件词________________________________________________ ____ _____________你是自我单身人生啊,你发行的伪造线生命修复时间铅笔“16 35”铅笔蛹“16 36”天堂知道坟墓显示半部件写B“17 17”他的眼睛长寿赋予生命,给人“18 69”招标大使馆爱你的生命让生活四人两个单独沉没“45 23”虽然情侣生活美容应该是黑色线条“63 50”秃头Live Edifient Editys Emeyys“68 27

查看字符串数组中的出现次数。

资源描述。上下文
ans=23x1字符串“消费主义者自己的单身人生啊,你是没有伪造的线条生命修复时间铅笔”“D假冒线条生活维修时间铅笔蛹”“”天堂知道坟墓隐藏生活显示半部分写作“”他的眼睛长期以来一直留下眼睛留意生活你“招标大使馆爱你的生活造成了四个独自沉沦”“虽然情侣生活美女应该是黑色线条”“哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇“ST Bail将携带寿命偏爱救生员”“艺术你失去了渣滓猎物猎物猎物身体死牛”“思想食物生活Sweetseasond Showers Gro”“TTIN名称因此不朽的生活虽然曾经已经消失了给生命带来坟墓生命生命生命“”生活带来坟墓生命生活公平的眼睛诗人赞美D“”“偷走自己的学期生活你好艺术放心我的Li”“Fe thou art保证矿山生活越来越多的爱情留下的人”最少生活最终更好的状态是“”一个st vex不动情的思维生活你的反叛Doth谎言啊“”更快的时间浪费生活你可以防止镰刀“”有害行为更美好的生活提供公众意味着酒吧“”吃了仇恨扔掉了救球人士“”“很多若虫誓言生活保留来绊倒了Maide“

加载示例数据。该文件十四行诗预处理.txt包含了经过预处理的莎士比亚十四行诗。该文件每行包含一首十四行诗,单词之间用空格分隔。将文本从十四行诗预处理.txt,将文本以换行符分割为文档,然后标记文档。

文件名=“十四行诗预处理.txt”;str = extractFileText(文件名);textData =分裂(str,换行符);文件= tokenizedDocument (textData);

搜索双字词“dost”。

ngram=[“多斯特”“你”];台=上下文(文档、ngram);头(台)
ans=8×3表UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU你为什么滥用慷慨的施舍?你是一个无利可图的高利贷者?为什么你有大笔的钱,却能在疲惫的夜晚睁开沉重的眼皮欲望沉睡破碎甜蜜可爱的你羞耻得像溃烂的“95 3 4”为什么含苞待放的名字啊甜心你的罪恶围住了舌头“95 19 20”露丝美丽的爱情依附于此你有尊严地做一个“101 16 17”你瞎了眼的傻子爱你我的眼睛看知道吗

查看字符串数组中的出现次数。

资源描述。上下文
ans=10x1串“不持续的可爱,为什么要在自己的自我上度过”“ee美丽的黑鬼为什么要滥用冒险的大理”为什么vere profless usurer为什么笨拙的咖啡师“”Eavy眼皮疲惫的夜晚Dost你的愿望拖着的人“甜蜜的可爱的dost你让耻辱像溃疡f“”hy budding name o sweet drost thy thy thy thy thy thy thy thy舌头“”露齿般的美丽爱情取决于你有尊严的让你有尊严的制作“你是我的眼睛,你的眼睛看起来很明显”权力数组为什么Dosu Pine遭受弱点涂料“”Y大的成本短暂租赁DOST你在你的渐渐豪宅“

加载示例数据。该文件十四行诗预处理.txt包含了经过预处理的莎士比亚十四行诗。该文件每行包含一首十四行诗,单词之间用空格分隔。将文本从十四行诗预处理.txt,将文本以换行符分割为文档,然后标记文档。

文件名=“十四行诗预处理.txt”;str = extractFileText(文件名);textData =分裂(str,换行符);文件= tokenizedDocument (textData);

搜索单词“life”,并返回每一个出现的单词,前后要有15个字符的上下文。

台=上下文(文档,“生活”15);头(台)
ans=8×3表上下文文档词  ____________________________________ ________ ____ " 自己单身生活啊你为什么issuel“9 10“nterfeit行生活生命修复ti“16 35”eit行生活修复乘以p 16 36“ows墓藏生活显示一半par”17日14“ng生活给你“18 69”组件爱你生活了四两个“45 23”尽管恋人生活的美丽应该“63 50”生活第二生命第二头“68 27”

查看字符串数组中的出现次数。

资源描述。上下文
ans=23x1字符串“我的单身生活啊,你发行了”interfeit line life-life-repair ti“eit line life-repair times p”ows坟墓隐藏生命显示一半生命给你生命“assy”爱你生命造了四个两个“虽然爱人生命美可以活第二次生命第二次头,让爱甚至生命腐烂,以免wis”都带走生命因此,不朽的生命将尽管他人给予生命,却能带来坟墓的生活,坟墓的生活,美丽的眼睛,诗人,自我远离,长期的生活,你保证,我的生命更长,你的爱,你的错误最少,生命结束得更好,不要介意生命,你的反抗点时间浪费生命你阻止“我做更好的生活提供公众”的方式扔掉savd生活说“他发誓贞洁的生活保持旅行”

指定要显示上下文的源文本。

加载sonnets.txt.数据,并将其分割成单独的文档。

txt = extractfiletext(“sonnets.txt”);段落= split(txt,[newline newline]);

摘录十四行诗段落.第一首十四行诗是段落的第五个元素,其余的十四行诗出现在后面的第二个元素中。

Sonnets =段落(5:2:结束);文档=令叫象征(Sonnets);

将文本规范化,然后搜索“生命”这个词。

documentsNormalized = normalizeWords(文件);T =上下文(documentsNormalized,“生活”
T =23×3表上下文文档字_________________________________________________________“SINGL生活中的SUCSST THY SECRES?啊!如果你是不是”9 18“:那么生命的生活线路应该修复,哪个”16 73“LD生活修复的生活线路,which thi , tim" 16 75 "s a tomb which hide your life , and show not half your" 17 34 " live thi , and thi give life to thee . " 18 128 "ssi of love to thee , my life , be made of four , with" 45 53 "eauti , though my lover' life : hi beauti shall in the" 63 100 " awai , to live a second life on second head ; er beau" 68 59 "t your love even with my life decai ; lest the wise wo" 71 118 "shall carri me awai , my life hath in thi line some in" 74 18 "ast but lost the dreg of life , the prei of worm , my " 74 83 "to my thought as food to life , or as sweet-season'd s" 75 10 "ur name from henc immort life shall have , though i , " 81 42 " , when other would give life , and bring a tomb . the" 83 108 "a tomb . there live more life in on of your fair ey th" 83 118 "yself awai , for term of life thou art assur mine ; an" 92 13 ⋮

由于单词是规范化的,上下文可能不容易阅读。要使用原始文本数据查看上下文,请使用“来源”选项。

T =上下文(documentsNormalized,“生活”“来源”,十四行诗)
T =23×3表上下文文档词  ________________________________________________________ ________ ____ " 嗯你也受苦自己单身生活?啊!你若无子女的年代“9 18”:应该的生活,生命修复,“73”d的生活生活修复,这,时间“75”坟墓里隐藏了你的生活,和一半你的“17 34”类型,并且赐给你生命。向你献上我的爱,我的生命,四人组成,机智美,我爱人的生命:他的美将在第二个头上过第二人生;在此之前,你的爱,连我的生命也不会腐朽;以免智者磨破“71 118”带着我走,我的生活已经在这条线我“74年18”圣但失去生命的渣滓,蠕虫的猎物,我的b“74”83年啊,我的想法为食物的生活,或者是sweet-season从因此sh“75”10名不朽的生命,虽然我在“81 42”,当别人给予的生活,带来了坟墓。有“83 108”一座墓。在你的一双美丽的眼睛里,又多了一条生命,因为我已把你的生命托付给我;“92 13⋮

输入参数

全部崩溃

输入文档,指定为令人畏缩的鳕文数组。

要在上下文中查找的单词,指定为字符串标量、字符向量或包含字符向量的标量单元格数组。

数据类型:char|字符串|细胞

要在上下文中查找的N-gram,指定为字符串数组或字符向量的单元格数组。

n有尺寸1-经过-N哪里N是n-gram中的单词数。的价值ngram (j)是个jn-gram的第个字。

函数忽略后面的空字符串n

数据类型:字符串|细胞

上下文长度,指定为正整数。

名称-值对参数

指定可选的逗号分隔的对名称、值论点。的名字参数名和价值是相应的价值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:name1,value1,...,namen,valuen

例子:“解算器”、“avb”指定使用近似变分贝叶斯作为解算器。

源文本,指定为逗号分隔对,由“来源”以及字符向量的字符串数组或单元格数组。如果输入文档经过预处理,并且您拥有源文本,则可以使用此选项使输出更具可读性。

源文本的大小必须与文档

选项忽略大小写,指定为逗号分隔的对,由“IgnoreCase”以及以下其中之一:

  • 假的–搜索与单词或n-gram完全匹配的匹配项。

  • 真的- 搜索符合Word或N-Gram忽略案例的出现。

输出参数

全部崩溃

具有这些列的上下文表:

上下文 在上下文中包含查询词或n-gram的字符串
文档 包含单词或n-gram的文档的数字索引
单词 文档中单词或n-gram的数字索引

介绍了R2017b