文档< / >帮助中心文档
从文本中删除HTML和XML标记
newStr = eraseTags (str)< / >
例子< / >
newStr= eraseTags (str)的元素中删除HTML和XML注释和标记str.
newStr= eraseTags (str)
newStr
str
该函数将删除带有标记名称的注释和标记一个,简写的,首字母缩写,b,bdi,bdo,大,代码,▽,dfn,新兴市场,字体,我,ins,kbd,马克,rp,rt,ruby,年代,小,跨度,罢工,强大的子,吃晚饭,tt,u,var和超级,并将所有其他标记替换为空格。
一个
简写的
首字母缩写
b
bdi
bdo
大
代码
▽
dfn
新兴市场
字体
我
ins
kbd
马克
rp
rt
ruby
年代
小
跨度
罢工
强大的
子
吃晚饭
tt
u
var
超级
该函数不删除HTML和XML元素(标记以及开始和结束标记之间的任何内容)。例如,eraseTags(“x < > y < / >”)返回的字符串“xy”.它只删除标记<一>和< / >,并没有删除元素< / > < > y.
eraseTags(“x < > y < / >”)
“xy”
<一>
< / >
< / > < > y
全部折叠< / >
从一些HTML代码中删除标记。函数替换< br >带空格的标记。
< br >
htmlCode =“一个。< br >两个“;newStr = eraseTags (htmlCode)
newStr = "。两个“
从一些XML代码中删除标记。函数删除子> <标记,不使用空格替换它们。
子> <
xmlCode =“H <子> 2子> < / O”;newStr = eraseTags (xmlCode)
newStr = "水"
输入文本,指定为字符串数组、字符向量或字符向量的单元格数组。
例子:"一个短句的例子。";“第二句话。”]
"一个短句的例子。";“第二句话。”]
数据类型:字符串|字符|细胞
字符串
字符
细胞
输出文本,作为字符串数组、字符向量或字符向量的单元格数组返回。str和newStr具有相同的数据类型。
decodeHTMLEntities|erasePunctuation|eraseURLs|较低的|tokenizedDocument|上
decodeHTMLEntities
erasePunctuation
eraseURLs
较低的
tokenizedDocument
上
您有这个示例的一个修改版本。要用编辑打开这个例子吗?
您点击了一个对应于这个MATLAB命令的链接:
通过在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站来获得可用的翻译内容,并看到当地的活动和提供。根据您所在的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
请选择表现最佳的中国网站(中文或英文)。MathWorks的其他国家网站并没有针对您所在位置的访问进行优化。
与当地办事处联系< / >