Text Analytics Toolbox™包括从设备日志,新闻源,调查,运营商报告和社交媒体等源处理原始文本的工具。使用这些工具从流行文件格式中提取文本,预处理原始文本,提取单个单词或多字短语(n-grams),将文本转换为数字表示,并构建统计模型。有关如何开始的示例,请参阅准备文本数据进行分析.
文本分析工具箱支持语言英语,日语,德语,和韩语万博1manbetx。大多数文本分析工具箱函数可以处理来自其他语言的文本。有关更多信息,请参见语言考虑因素.
此示例显示了如何从文本,HTML,Microsoft®Word,PDF,CSV和MicrosoftExcel®文件中提取文本数据,并将其导入Matlab®进行分析。
这个示例展示了如何解析HTML代码并从特定元素中提取文本内容。
发现各种文本分析任务的数据集。
这个例子展示了如何创建一个函数来清理和预处理文本数据以进行分析。
此示例显示如何分析包含EMOJIS的文本数据。
这个例子展示了如何使用Hunspell来纠正文档中的拼写。
此示例显示如何创建HunSpell扩展名称以拼写校正。
这个例子展示了如何使用编辑距离搜索器和已知单词的词汇表来纠正拼写。
有关使用其他语言的文本分析工具箱功能的信息。
关于文本分析工具箱中的日语支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析日语文本数据。
文本分析工具箱中德语支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析德语文本数据。