文档帮助中心文档
正确拼写单词
updatedDocuments =用语(文档)
用语updatedWords =(单词)
更新字=纠正率(单词,“语言”,语言)
[___用语,unknownWords] = (___)
___=用语(___、名称、值)
用用语纠正字符串数组或文档中的单词拼写。
用语
该功能支持英语,德语和韩文万博1manbetx文本。
例子
updatedDocuments=用语(文件)纠正拼写单词令人畏缩的鳕文数组文件.
updatedDocuments=用语(文件)
updatedDocuments
文件
令人畏缩的鳕文
更新字=用语(单词)纠正拼写单词细绳向量单词.
更新字=用语(单词)
更新字
单词
细绳
更新字=用语(单词“语言”,语言)也指定语言的单词在细绳向量单词.
更新字=用语(单词“语言”,语言)
语言
[___,unknownWords] =矫正力量(___)还返回输入中没有在字典中找到且没有找到任何建议的单词向量。
[___,unknownWords] =矫正力量(___)
unknownWords
___=用语(___,名称,值)使用一个或多个名称值对参数指定其他选项。
___=用语(___,名称,值)
名称,值
全部折叠
创建令牌化文档阵列。
str = [“一份包含一些拼错单词的文件。”“又一份有拼写错误的文件。”];文件= tokenizedDocument (str);
使用。修改文档中单词的拼写用语函数。
UpdatedDocuments = 2x1嘟嘟ddocument:7个令牌:包含一些拼写错误单词的文档。5令牌:包含拼写错误的另一个文档。
创建字符串数组。
话说= [“一个”“strng”“数组”“包含”“拼错”“担心”“。”];
属性来纠正字符串数组中单词的拼写用语函数。
updatedWords =1 x7字符串列1到6“字符串”“阵列”“包含”拼写“”单词“列7”。“
str = [“使用MATLAB分析文本数据。”“又一份有拼写错误的文件。”];文件= tokenizedDocument (str);
UpdatedDocuments = 2x1 tokenizeddocument:7令牌:使用MAT实验室分析文本数据。5令牌:包含拼写错误的另一个文档。
注意,单词“MATLAB”被分成两个单词“MAT”和“LAB”。
修改文档的拼写,并指定“MATLAB”为已知单词'众所周知'选择。
'众所周知'
updatedDocuments =用语(文档,'众所周知',“MATLAB”)
updatedDocuments = 2x1 tokenizedDocument: 6 tokens:使用MATLAB分析文本数据。5令牌:包含拼写错误的另一个文档。
输入文档,指定为a令人畏缩的鳕文数组中。
输入字,指定为字符串向量、字符向量或字符向量的单元格数组。如果您指定单词作为字符向量,那么该函数将参数视为单个单词。
数据类型:细绳|字符|细胞
字符
细胞
'en'
'de'
'ko'
单词语言指定为以下内容之一:
'en'- 英语
'de'——德国语言
'ko'——韩国语言
如果未指定语言,则软件会自动检测语言。
数据类型:字符|细绳
指定可选的逗号分隔的对名称,值参数。姓名参数名和价值是相应的价值。姓名必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家.
姓名
价值
Name1, Value1,…,的家
用语(文档、“KnownWords”(“MathWorks”“MATLAB”))
[]
被视为正确的词语,指定为逗号分隔的对组成'众所周知'以及字符向量的字符串数组或单元格数组。
如果指定已知单词的列表,则当功能更正拼写时,这些单词保持不变。该软件还可以用来自已知单词列表的单词替换拼写错误的单词。
例子:[“Mathworks”“Matlab”]
[“Mathworks”“Matlab”]
数据类型:字符|细绳|细胞
“ExtensionDictionary”
”
Hunspell扩展词典文件(也称为个人字典文件),指定为逗号分隔对组成“ExtensionDictionary”Hunspell扩展名字典文件路径。
一个Hunspell扩展字典文件是.Dic.包含字典中的单词数的文件,后面跟着下列格式的单词列表:
.Dic.
word1 / commixword1 word2 / affixword2 ... wordn / commixwordn * forbiddonword1 * forbiddonword2 ... * forbiddenwordm
word1,word2、……wordN是要扩展HunSpell词典的列表单词。
word1
word2
wordN
缀废16.,缀入字、……贴签(可选的)指出在Hunspell字典中共享词缀的单词。通过用斜线将词缀与相应的单词连接来表示词缀(/).例如,条目exxxtreme /极端表示应用于该词的词缀“极端”也适用于习惯词“exxxtreme”.
缀废16.
缀入字
贴签
/
exxxtreme /极端
“极端”
“exxxtreme”
forbiddenWord1,forbiddenWord2、……forbiddenWordN是一份禁止用于拼写纠正的单词列表。用星号表示禁止使用的词语(*).
forbiddenWord1
forbiddenWord2
forbiddenWordN
*
Hunspell扩展字典文件中的条目可以以任何顺序出现。
例如,要创建一个Hunspell扩展名字典文件,指定:
这句话“MathWorks”,“MATLAB”, 和“exxxtreme”.
“MathWorks”
“MATLAB”
词缀应用于这个词的词缀“极端”也适用于这个词“exxxtreme”.
这个词“MATLOB”是一个禁忌词。
“MATLOB”
使用:
Mathworks Matlab exxxtreme / Extreme * Matlob
有关如何创建HunSpell扩展字典文件的示例,请参阅创建用于拼写校正的扩展字典.有关Hunspell字典文件选项的详细信息,请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html..
'字典'
Hunspell字典文件,指定为逗号分隔对,由'字典'Hunspell字典文件路径。
一个Hunspell字典文件是.Dic.包含字典中的单词数的文件,后面跟着下列格式的单词列表:
N word1/flags1 word2/flags2…wordN / flagsN
在哪里N为字典文件中的单词数,word1,word2、……wordN是N字典里的单词,还有旗帜1、……旗子指定与单词对应的可选标志word1,word2、……wordN,分别。使用标记来指定单词属性,例如词缀。要指定Hunspell后缀文件,请使用“词缀”选择。
N
旗帜1
旗子
“词缀”
例如,创建包含4个单词的Hunspell字典文件“MathWorks”,“MATLAB”,“用语”, 和“tokenizedDocument”, 用:
“用语”
“tokenizedDocument”
4 MathWorks MATLAB correctSpelling tokenizedDocument
有关Hunspell字典文件选项的详细信息,请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html..
Hunspell后缀文件,指定为逗号分隔对,由“词缀”和hunspell yifix文件的文件路径。
一个hunspell yifix文件是一个的.aff包含字典中的单词数的文件,后面跟着下列格式的单词列表:
的.aff
选项1 values1选项2 values2…optionM valuesM
在哪里米是后缀文件中选项的数量,option1,option2、……optionM是米选择,价值1、……价值指定与选项对应的值option1,option2、……optionM,分别。使用这些选项来指定附件。
米
option1
option2
optionM
价值1
要定义前缀规则,请使用可以选项与格式:
可以
PFX Flag横拓k PFX标志Stripping1 Prefix1条件1 ... PFX Flag Stripplek Prefixk Conditionk
国旗对应于Hunspell字典文件中使用的标志。
国旗
越卖表示前缀和后缀是否可以混合,指定为Y或者N.
越卖
Y
K为指定标志定义的前缀数量。
K
剥线1,剥离2.、……strippingK在应用前缀时指示要从单词中剥离的字符。如果剥离值是0,然后没有剥离。
剥线1
剥离2.
strippingK
0
前缀1,前缀、……前缀指定要使用的前缀。
前缀1
前缀
条件1,条件2、……条件指定应用前缀的可选条件前缀1,前缀、……前缀,分别。对于琐碎的条件,指定“。”.
条件1
条件2
条件
“。”
要定义后缀规则,请使用自解压选项与格式:
自解压
SFX flag stripping1 suffi1 condition1…SFX flag strippingK suffixK conditionK
suffix1
suffix2
suffixK
创建一个HunSpell yifix文件,定义以下附加规则:
国旗A:
前缀词与“重新”
“重新”
旗B:
后缀单词没有结尾“y”与“ed”.
“y”
“ed”
后缀单词以“y”与“简易爆炸装置”、删除“y”.
“简易爆炸装置”
使用hunspell yifix文件:
PFX A Y 1 PFX A 0 re。SFX B Y 1 SFX B 0 ed [^ Y] SFX B Y Y
要在Hunspell字典文件中使用这些标志,请使用“/”.对于每个单词,您可以指定多个标志。例如,要指定包含:的字典文件
“/”
这句话“PTEST”和“ptry”.
“PTEST”
“ptry”
对于这个词“PTEST”仅,还包括前缀“重新”使用旗帜一个.
一个
对于这两个单词,还包括后缀“ed”或者“简易爆炸装置”适当使用国旗B
B
有关HunSpell附件文件选项的详细信息,请参阅https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html..
'Retkensizizemethod'
'分裂'
“没有”
方法来重新标记文档,指定为由'Retkensizizemethod'以及以下其中之一:
'分裂'—通过拆分标记来纠正拼写。例如,拆分拼写错误的标记“Twowords”进入正确拼写的令牌“两个”和“字”.
“Twowords”
“两个”
“字”
“没有”—不要分割标记以进行拼写校正。
纠正文件,作为一个返回令人畏缩的鳕文数组中。如果'Retkensizizemethod'选择是'分裂',则每个更新文档中的字数可能与相应的输入文档不同。
如果有多个校正单词的候选者,则该函数自动选择单个单词以进行校正。
修正的单词,作为字符串向量返回。如果'Retkensizizemethod'选择是'分裂'然后,更新的单词的数量可以是不同的输入单词的数量。
未知的单词,作为串向量返回。字符串矢量unknownWords包含不在拼写校正字典中的输入单词,并没有找到任何建议。
editDistance|editDistanceSearcher|令人畏缩的鳕文
editDistance
editDistanceSearcher
您有此示例的修改版本。您是否希望使用您的编辑打开此示例?
你点击一个链接对应于这个MATLAB命令:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系