eraseTags

从文本中删除HTML和XML标记

语法

newStr = eraseTags (str)< / >

描述

newStr= eraseTags (str）的元素中删除HTML和XML注释和标记str．

该函数将删除带有标记名称的注释和标记一个，简写的，首字母缩写，b，bdi，bdo，大，代码，▽，dfn，新兴市场，字体，我，ins，kbd，马克，rp，rt，ruby，年代，小，跨度，罢工，强大的子，吃晚饭，tt，u，var和超级，并将所有其他标记替换为空格。

该函数不删除HTML和XML元素(标记以及开始和结束标记之间的任何内容)。例如,eraseTags(“x < > y < / >”)返回的字符串“xy”．它只删除标记<一>和< / >，并没有删除元素< / > < > y．

例子

全部折叠< / >

删除HTML和XML标签和注释< br >

打开生活的脚本< / >

从一些HTML代码中删除标记。函数替换< br >带空格的标记。

htmlCode =“一个。< br >两个“;newStr = eraseTags (htmlCode)

newStr = "。两个“

从一些XML代码中删除标记。函数删除子> <标记，不使用空格替换它们。

xmlCode =“H <子> 2子> < / O”;newStr = eraseTags (xmlCode)

newStr = "水"

输入参数

全部折叠< / >

`str`- - - - - -输入文本
字符串数组|特征向量|字符向量的单元数组

输入文本，指定为字符串数组、字符向量或字符向量的单元格数组。

例子:"一个短句的例子。";“第二句话。”］

数据类型:字符串|字符|细胞

输出参数

全部折叠< / >

`newStr`——输出文本< br >字符串数组|字符向量|单元格数组字符向量

输出文本，作为字符串数组、字符向量或字符向量的单元格数组返回。str和newStr具有相同的数据类型。

另请参阅

主题

为分析准备文本数据< / >

创建用于分类的简单文本模型< / >

介绍了R2017b

试用软件< / >

试用软件< / >

产品更新< / >

产品更新< / >

eraseTags

语法

描述

例子

删除HTML和XML标签和注释< br >

输入参数

`str`- - - - - -输入文本
字符串数组|特征向量|字符向量的单元数组

输出参数

`newStr`——输出文本< br >字符串数组|字符向量|单元格数组字符向量

另请参阅

主题

文本分析工具箱文档< / >

万博1manbetx

开始与文本分析在MATLAB< / >

eraseTags

语法

描述

例子

删除HTML和XML标签和注释< br >

输入参数

str- - - - - -输入文本字符串数组|特征向量|字符向量的单元数组

输出参数

newStr——输出文本< br >字符串数组|字符向量|单元格数组字符向量

另请参阅

主题

文本分析工具箱文档< / >

万博1manbetx

开始与文本分析在MATLAB< / >

`str`- - - - - -输入文本
字符串数组|特征向量|字符向量的单元数组

`newStr`——输出文本< br >字符串数组|字符向量|单元格数组字符向量