用语

正确拼写单词

页面上倒塌

语法

updatedDocuments =用语(文档)

用语updatedWords =(单词)

更新字=纠正率（单词，“语言”，语言）

［＿＿＿用语,unknownWords] = (＿＿＿）

＿＿＿=用语(＿＿＿、名称、值)

描述

用用语纠正字符串数组或文档中的单词拼写。

该功能支持英语，德语和韩文万博1manbetx文本。

例子

updatedDocuments=用语(文件）纠正拼写单词令人畏缩的鳕文数组文件．

例子

更新字=用语(单词）纠正拼写单词细绳向量单词．

更新字=用语(单词“语言”,语言）也指定语言的单词在细绳向量单词．

［＿＿＿，unknownWords] =矫正力量（＿＿＿）还返回输入中没有在字典中找到且没有找到任何建议的单词向量。

例子

＿＿＿=用语(＿＿＿，名称,值）使用一个或多个名称值对参数指定其他选项。

例子

全部折叠

文档中单词的正确拼写

打开直播脚本

创建令牌化文档阵列。

str = [“一份包含一些拼错单词的文件。”“又一份有拼写错误的文件。”];文件= tokenizedDocument (str);

使用。修改文档中单词的拼写用语函数。

updatedDocuments =用语(文档)

UpdatedDocuments = 2x1嘟嘟ddocument：7个令牌：包含一些拼写错误单词的文档。5令牌：包含拼写错误的另一个文档。

字符串数组中单词的正确拼写

打开直播脚本

创建字符串数组。

话说= [“一个”“strng”“数组”“包含”“拼错”“担心”“。”];

属性来纠正字符串数组中单词的拼写用语函数。

用语updatedWords =(单词)

updatedWords =1 x7字符串列1到6“字符串”“阵列”“包含”拼写“”单词“列7”。“

指定已知单词

打开直播脚本

创建令牌化文档阵列。

str = [“使用MATLAB分析文本数据。”“又一份有拼写错误的文件。”];文件= tokenizedDocument (str);

使用。修改文档中单词的拼写用语函数。

updatedDocuments =用语(文档)

UpdatedDocuments = 2x1 tokenizeddocument：7令牌：使用MAT实验室分析文本数据。5令牌：包含拼写错误的另一个文档。

注意，单词“MATLAB”被分成两个单词“MAT”和“LAB”。

修改文档的拼写，并指定“MATLAB”为已知单词'众所周知'选择。

updatedDocuments =用语(文档,'众所周知'，“MATLAB”）

updatedDocuments = 2x1 tokenizedDocument: 6 tokens:使用MATLAB分析文本数据。5令牌：包含拼写错误的另一个文档。

输入参数

全部折叠

`文件`- - - - - -输入文件
`令人畏缩的鳕文`数组

输入文档，指定为a令人畏缩的鳕文数组中。

`单词`- - - - - -输入单词
弦矢量|字符向量|字符向量的单元格阵列

输入字，指定为字符串向量、字符向量或字符向量的单元格数组。如果您指定单词作为字符向量，那么该函数将参数视为单个单词。

数据类型：细绳|字符|细胞

`语言`- - - - - -词的语言
`'en'`|`'de'`|`'ko'`

单词语言指定为以下内容之一：

'en'- 英语
'de'——德国语言
'ko'——韩国语言

如果未指定语言，则软件会自动检测语言。

数据类型：字符|细绳

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。姓名参数名和价值是相应的价值。姓名必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:用语(文档、“KnownWords”(“MathWorks”“MATLAB”))纠正单词的拼写文件并将“MathWorks”和“MATLAB”视为拼写正确的单词。

`'众所周知'`- - - - - -用词要被视为正确
`［］`（默认）|字符串数组|字符向量的单元格阵列

被视为正确的词语，指定为逗号分隔的对组成'众所周知'以及字符向量的字符串数组或单元格数组。

如果指定已知单词的列表，则当功能更正拼写时，这些单词保持不变。该软件还可以用来自已知单词列表的单词替换拼写错误的单词。

例子:[“Mathworks”“Matlab”]

数据类型：字符|细绳|细胞

`“ExtensionDictionary”`- - - - - -Hunspell扩展字典文件
`”`（默认）|文件路径

Hunspell扩展词典文件（也称为个人字典文件），指定为逗号分隔对组成“ExtensionDictionary”Hunspell扩展名字典文件路径。

一个Hunspell扩展字典文件是.Dic.包含字典中的单词数的文件，后面跟着下列格式的单词列表:

word1 / commixword1 word2 / affixword2 ... wordn / commixwordn * forbiddonword1 * forbiddonword2 ... * forbiddenwordm

地点:

word1，word2、……wordN是要扩展HunSpell词典的列表单词。
缀废16.，缀入字、……贴签(可选的)指出在Hunspell字典中共享词缀的单词。通过用斜线将词缀与相应的单词连接来表示词缀(/)．例如，条目exxxtreme /极端表示应用于该词的词缀“极端”也适用于习惯词“exxxtreme”．
forbiddenWord1，forbiddenWord2、……forbiddenWordN是一份禁止用于拼写纠正的单词列表。用星号表示禁止使用的词语(＊)．

Hunspell扩展字典文件中的条目可以以任何顺序出现。

例如，要创建一个Hunspell扩展名字典文件，指定:

这句话“MathWorks”，“MATLAB”，和“exxxtreme”．
词缀应用于这个词的词缀“极端”也适用于这个词“exxxtreme”．
这个词“MATLOB”是一个禁忌词。

使用:

Mathworks Matlab exxxtreme / Extreme * Matlob

有关如何创建HunSpell扩展字典文件的示例，请参阅创建用于拼写校正的扩展字典．有关Hunspell字典文件选项的详细信息，请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.．

数据类型：字符|细绳

`'字典'`- - - - - -Hunspell字典文件
`”`（默认）|文件路径

Hunspell字典文件，指定为逗号分隔对，由'字典'Hunspell字典文件路径。

一个Hunspell字典文件是.Dic.包含字典中的单词数的文件，后面跟着下列格式的单词列表:

N word1/flags1 word2/flags2…wordN / flagsN

在哪里N为字典文件中的单词数，word1，word2、……wordN是N字典里的单词，还有旗帜1、……旗子指定与单词对应的可选标志word1，word2、……wordN,分别。使用标记来指定单词属性，例如词缀。要指定Hunspell后缀文件，请使用“词缀”选择。

例如，创建包含4个单词的Hunspell字典文件“MathWorks”，“MATLAB”，“用语”，和“tokenizedDocument”，用：

4 MathWorks MATLAB correctSpelling tokenizedDocument

有关Hunspell字典文件选项的详细信息，请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.．

数据类型：字符|细绳

`“词缀”`- - - - - -hunspell yifix文件
`”`（默认）|文件路径

Hunspell后缀文件，指定为逗号分隔对，由“词缀”和hunspell yifix文件的文件路径。

一个hunspell yifix文件是一个的.aff包含字典中的单词数的文件，后面跟着下列格式的单词列表:

选项1 values1选项2 values2…optionM valuesM

在哪里米是后缀文件中选项的数量，option1，option2、……optionM是米选择,价值1、……价值指定与选项对应的值option1，option2、……optionM,分别。使用这些选项来指定附件。

前缀

要定义前缀规则，请使用可以选项与格式:

PFX Flag横拓k PFX标志Stripping1 Prefix1条件1 ... PFX Flag Stripplek Prefixk Conditionk

的价值观:

国旗对应于Hunspell字典文件中使用的标志。
越卖表示前缀和后缀是否可以混合，指定为Y或者N．
K为指定标志定义的前缀数量。
剥线1，剥离2.、……strippingK在应用前缀时指示要从单词中剥离的字符。如果剥离值是0，然后没有剥离。
前缀1，前缀、……前缀指定要使用的前缀。
条件1，条件2、……条件指定应用前缀的可选条件前缀1，前缀、……前缀,分别。对于琐碎的条件，指定“。”．

后缀

要定义后缀规则，请使用自解压选项与格式:

SFX flag stripping1 suffi1 condition1…SFX flag strippingK suffixK conditionK

在哪里suffix1，suffix2、……suffixK指定要使用的前缀、标志、叉乘、K、剥离值和条件值与前缀格式相同。

例子

创建一个HunSpell yifix文件，定义以下附加规则：

国旗A：
- 前缀词与“重新”
旗B：
- 后缀单词没有结尾“y”与“ed”．
- 后缀单词以“y”与“简易爆炸装置”、删除“y”．

使用hunspell yifix文件：

PFX A Y 1 PFX A 0 re。SFX B Y 1 SFX B 0 ed [^ Y] SFX B Y Y

要在Hunspell字典文件中使用这些标志，请使用“/”．对于每个单词，您可以指定多个标志。例如，要指定包含：的字典文件

这句话“PTEST”和“ptry”．
对于这个词“PTEST”仅，还包括前缀“重新”使用旗帜一个．
对于这两个单词，还包括后缀“ed”或者“简易爆炸装置”适当使用国旗B

有关HunSpell附件文件选项的详细信息，请参阅https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.．

数据类型：字符|细绳

`'Retkensizizemethod'`- - - - - -解除文档的方法
`'分裂'`（默认）|`“没有”`

方法来重新标记文档，指定为由'Retkensizizemethod'以及以下其中之一:

'分裂'—通过拆分标记来纠正拼写。例如，拆分拼写错误的标记“Twowords”进入正确拼写的令牌“两个”和“字”．
“没有”—不要分割标记以进行拼写校正。

输出参数

全部折叠

`updatedDocuments`——修正文件
`令人畏缩的鳕文`数组

纠正文件，作为一个返回令人畏缩的鳕文数组中。如果'Retkensizizemethod'选择是'分裂'，则每个更新文档中的字数可能与相应的输入文档不同。

如果有多个校正单词的候选者，则该函数自动选择单个单词以进行校正。

`更新字`——纠正话说
弦矢量

修正的单词，作为字符串向量返回。如果'Retkensizizemethod'选择是'分裂'然后，更新的单词的数量可以是不同的输入单词的数量。

如果有多个校正单词的候选者，则该函数自动选择单个单词以进行校正。

`unknownWords`——生词
弦矢量

未知的单词，作为串向量返回。字符串矢量unknownWords包含不在拼写校正字典中的输入单词，并没有找到任何建议。

另请参阅

editDistance|editDistanceSearcher|令人畏缩的鳕文

主题

介绍了R2020a

用语

语法

描述

例子

文档中单词的正确拼写

字符串数组中单词的正确拼写

指定已知单词

输入参数

`文件`- - - - - -输入文件
`令人畏缩的鳕文`数组

`单词`- - - - - -输入单词
弦矢量|字符向量|字符向量的单元格阵列

`语言`- - - - - -词的语言
`'en'`|`'de'`|`'ko'`

名称-值对的观点

`'众所周知'`- - - - - -用词要被视为正确
`［］`（默认）|字符串数组|字符向量的单元格阵列

`“ExtensionDictionary”`- - - - - -Hunspell扩展字典文件
`”`（默认）|文件路径

`'字典'`- - - - - -Hunspell字典文件
`”`（默认）|文件路径

`“词缀”`- - - - - -hunspell yifix文件
`”`（默认）|文件路径

前缀

后缀

例子

`'Retkensizizemethod'`- - - - - -解除文档的方法
`'分裂'`（默认）|`“没有”`

输出参数

`updatedDocuments`——修正文件
`令人畏缩的鳕文`数组

`更新字`——纠正话说
弦矢量

`unknownWords`——生词
弦矢量

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

用语

语法

描述

例子

文档中单词的正确拼写

字符串数组中单词的正确拼写

指定已知单词

输入参数

文件- - - - - -输入文件令人畏缩的鳕文数组

单词- - - - - -输入单词弦矢量|字符向量|字符向量的单元格阵列

语言- - - - - -词的语言'en'|'de'|'ko'

名称-值对的观点

'众所周知'- - - - - -用词要被视为正确［］（默认）|字符串数组|字符向量的单元格阵列

“ExtensionDictionary”- - - - - -Hunspell扩展字典文件”（默认）|文件路径

'字典'- - - - - -Hunspell字典文件”（默认）|文件路径

“词缀”- - - - - -hunspell yifix文件”（默认）|文件路径

前缀

后缀

例子

'Retkensizizemethod'- - - - - -解除文档的方法'分裂'（默认）|“没有”

输出参数

updatedDocuments——修正文件令人畏缩的鳕文数组

更新字——纠正话说弦矢量

unknownWords——生词弦矢量

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

`文件`- - - - - -输入文件
`令人畏缩的鳕文`数组

`单词`- - - - - -输入单词
弦矢量|字符向量|字符向量的单元格阵列

`语言`- - - - - -词的语言
`'en'`|`'de'`|`'ko'`

`'众所周知'`- - - - - -用词要被视为正确
`［］`（默认）|字符串数组|字符向量的单元格阵列

`“ExtensionDictionary”`- - - - - -Hunspell扩展字典文件
`”`（默认）|文件路径

`'字典'`- - - - - -Hunspell字典文件
`”`（默认）|文件路径

`“词缀”`- - - - - -hunspell yifix文件
`”`（默认）|文件路径

`'Retkensizizemethod'`- - - - - -解除文档的方法
`'分裂'`（默认）|`“没有”`

`updatedDocuments`——修正文件
`令人畏缩的鳕文`数组

`更新字`——纠正话说
弦矢量

`unknownWords`——生词
弦矢量