主要内容

knnsearch

通过编辑距离找到最近的邻居

描述

例子

idx= knnsearch (eds单词在编辑距离搜索器中查找最近邻居的索引eds每个元素单词

例子

idxd) = knnsearch (eds单词的元素之间的编辑距离单词和最近的邻居。

例子

idxd) = knnsearch (eds单词名称,值使用一个或多个名称-值对参数指定其他选项。

例子

全部折叠

创建一个编辑距离搜索器。

词汇量= (“文本”“分析”“工具箱”];eds = editDistanceSearcher(词汇,2);

找出最近的单词“测试”“分析”

话说= [“测试”“分析”];话说idx = knnsearch (eds)
idx =2×11 2

使用返回的索引从词汇表中获取单词。

nearestWords = eds.Vocabulary (idx)
nearestWords =1 x2字符串“文本”“分析”

创建一个编辑距离搜索器。

词汇量= (“MATLAB”“文本”“分析”“工具箱”];eds = editDistanceSearcher(词汇,2);

找出最近的单词和它们的编辑距离“测试”“分析”

话说= [“测试”“分析”];[idx d] = knnsearch (eds、单词)
idx =2×12 3
d =2×11 2

使用返回的索引从词汇表中获取单词。

nearestWords = eds.Vocabulary (idx)
nearestWords =1 x2字符串“文本”“分析”

改变世界“测试”“文本”需要一次编辑:替换。改变世界“分析”“分析”需要两种编辑:替换和插入。

创建一个编辑距离搜索器。

词汇量= (“MathWorks”“MATLAB”“分析”];eds = editDistanceSearcher(词汇,5);

找出两个最近的单词和它们的编辑距离“数学”“分析”

话说= [“数学”“分析”];idx = knnsearch (eds,话说,“K”,2)
idx =2×21 2 3 NaN

看两个最接近的词“数学”

: idxMath = idx (1);newWords = eds.Vocabulary (idxMath)
newWords =1 x2字符串MATLAB“MathWorks”

在最大编辑距离内只有一个单词“分析”,则函数返回对于其他索引。查看最近的带有有效索引的单词。

idxAnalysis = idx (2);idxAnalysis (isnan (idxAnalysis)) = [];newWords = eds.Vocabulary (idxAnalysis)
newWords = "分析"

输入参数

全部折叠

编辑距离搜索器,指定为editDistanceSearcher对象。

输入字,指定为字符串向量、字符向量或字符向量的单元格数组。如果您指定单词作为字符向量,函数将参数视为单个单词。

数据类型:字符串|字符|细胞

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:knnsearch (eds,话说,“K”,3)找到最近的三个邻居eds完全地单词

为每个元素查找的最近邻的数目单词,指定为正整数。

例子:“K”3

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

选项返回距离值相等的邻居,指定为真正的

如果“IncludeTies”,则函数返回K具有最短编辑距离的邻居,其中K为要查找的邻居数。在本例中,函数输出N——- - - - - -K矩阵,N为输入字的个数。指定K,可以使用“K”名称-值对的论点。

如果“IncludeTies”真正的,则该函数也返回距离等于K输出中最小的距离。在本例中,函数输出大小相同的单元格数组N1,N为输入字的个数。单元格数组的元素是至少具有K元素。函数按距离升序对每个向量中的邻居进行排序。

例子:“IncludeTies”,真的

数据类型:逻辑

输出参数

全部折叠

搜索器中最近邻的索引,以矩阵或向量单元数组的形式返回。

如果“IncludeTies”,则函数返回K具有最短编辑距离的邻居,其中K为要查找的邻居数。在本例中,函数输出N——- - - - - -K矩阵,N为输入字的个数。指定K,可以使用“K”名称-值对的论点。

如果“IncludeTies”真正的,则该函数也返回距离等于K输出中最小的距离。在本例中,函数输出大小相同的单元格数组N1,N为输入字的个数。单元格数组的元素是至少具有K元素。函数按距离升序对每个向量中的邻居进行排序。

数据类型:|细胞

编辑到邻居的距离,以矩阵或向量单元格数组的形式返回。

如果“IncludeTies”,则函数返回K具有最短编辑距离的邻居,其中K为要查找的邻居数。在本例中,函数输出N——- - - - - -K矩阵,N为输入字的个数。指定K,可以使用“K”名称-值对的论点。

如果“IncludeTies”真正的,则该函数也返回距离等于K输出中最小的距离。在本例中,函数输出大小相同的单元格数组N1,N为输入字的个数。单元格数组的元素是至少具有K元素。函数按距离升序对每个向量中的邻居进行排序。

数据类型:|细胞

介绍了R2019a