文本数据准备
将文本数据导入MATLAB®并对其进行预处理以供分析
文本分析工具箱™包括用于处理来自设备日志,新闻提要,调查,运营商报告和社交媒体等来源的原始文本的工具。使用这些工具可以从流行的文件格式中提取文本、预处理原始文本、提取单个单词或多单词短语(n-gram)、将文本转换为数字表示,以及构建统计模型。有关演示如何开始的示例,请参见准备文本数据进行分析.
文本分析工具箱支持英语、日语、德语和韩语。万博1manbetx大多数文本分析工具箱功能都可以处理其他语言的文本。有关更多信息,请参见语言的注意事项.
实时编辑器任务
预处理文本数据 | 预处理和清理文本数据进行分析 |
功能
主题
进口
- 从文件中提取文本数据
本示例展示了如何从文本、HTML、Microsoft®Word、PDF、CSV和Microsoft Excel®文件中提取文本数据,并将其导入MATLAB®进行分析。 - 解析HTML和提取文本内容
这个示例展示了如何解析HTML代码并从特定元素中提取文本内容。 - 文本分析的数据集
为各种文本分析任务发现数据集。
预处理
- 在实时编辑器中预处理文本数据
探索文本预处理技术预处理文本数据实时编辑器任务。 - 准备文本数据进行分析
这个例子展示了如何创建一个函数来清理和预处理文本数据以供分析。 - 分析包含表情符号的文本数据
这个例子展示了如何分析包含表情符号的文本数据。 - 正确的文档拼写
这个例子展示了如何使用Hunspell纠正文档中的拼写。 - 创建扩展字典的拼写纠正
这个示例展示了如何创建用于拼写更正的Hunspell扩展字典。 - 使用编辑距离搜索器创建自定义拼写更正功能
这个示例展示了如何使用编辑距离搜索器和已知单词的词汇表来纠正拼写。 - 使用语法依存分析法分析句子结构
这个示例展示了如何使用语法依赖性解析从句子中提取信息。
语言支持万博1manbetx
- 语言的注意事项
有关使用其他语言的文本分析工具箱功能的信息。 - 日语支持万博1manbetx
关于文本分析工具箱中日语支持的信息。万博1manbetx - 分析日语文本数据
这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。 - 德语支持万博1manbetx
关于文本分析工具箱中德语支持的信息。万博1manbetx - 分析德文文本数据
这个示例展示了如何使用主题模型导入、准备和分析德语文本数据。