Text Analytics Toolbox™包括用于处理来自设备日志、新闻提要、调查、操作员报告和社交媒体等来源的原始文本的工具。使用这些工具从流行的文件格式中提取文本,预处理原始文本,提取单个单词或多词短语(n-gram),将文本转换为数字表示,并构建统计模型。有关如何开始的示例,请参见准备文本数据进行分析.
文本分析工具箱支持语言英语,日语,德语,和韩语万博1manbetx。大多数文本分析工具箱函数可以处理来自其他语言的文本。有关更多信息,请参见语言的注意事项.
这个例子展示了如何从文本、HTML、Microsoft®Word、PDF、CSV和Microsoft Excel®文件中提取文本数据,并将其导入MATLAB®进行分析。
这个示例展示了如何解析HTML代码并从特定元素中提取文本内容。
为各种文本分析任务发现数据集。
这个例子展示了如何创建一个函数来清理和预处理文本数据以进行分析。
这个例子展示了如何分析包含表情符号的文本数据。
这个例子展示了如何使用Hunspell来纠正文档中的拼写。
这个示例展示了如何创建一个Hunspell扩展字典来进行拼写校正。
这个例子展示了如何使用编辑距离搜索器和已知单词的词汇表来纠正拼写。
有关为其他语言使用文本分析工具箱功能的信息。
关于文本分析工具箱中的日语支持的信息。万博1manbetx
这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。
关于文本分析工具箱中的德语支持的信息。万博1manbetx
这个示例展示了如何使用主题模型导入、准备和分析德语文本数据。