ASP过滤HTML中标签里的属性
在提取、采集、爬虫中批量过滤不需要的属性,降低数据库压力
function get_reg_tag(htmls,tagarr)
if instr(tagarr,",") = 0 then
tagarr=tagarr&",<wenzi"
end if
tag_arr=split(tagarr,",")
' 创建正则表达式对象
Dim regex
Set regex = Server.CreateObject("VBScript.RegExp")
regex.IgnoreCase = True'忽略大小写
regex.Global = True'设置为全文搜索
' 设置正则表达式模式,匹配需要删除的区间代码
Dim pattern
for i=0 to ubound(tag_arr)
tag_num=len(tag_arr(i))+1
regex.pattern = tag_arr(i)&"[^>]*?(.*?)>"
' 设置正则表达式选项
Dim options
options = "sgi" ' 忽略大小写和全局搜索
' 执行正则表达式匹配和替换
Dim matches
Set matches = regex.Execute(htmls)
For Each match In matches
matchcc = mid(match.Value,tag_num,len(match.Value)-tag_num)
htmls = Replace(htmls, matchcc, "")
Next
next
' 输出处理后的 HTML 字符串
get_reg_tag=replace(htmls,"<o:p></o:p>","")
end function
(作者:佚名 编辑:weio33)
文章热词:
上一篇:十大保命条例是来自血与泪的教训(视频)
下一篇:没有了
延伸阅读:
最新文章
-
十大保命条例是来自
一、严禁违章指挥和强令冒险作业......
-
人人讲安全,个个会应
暴雨、洪涝常识;雷电常识;燃气安......
-
安全生产举报渠道
全面贯彻落实习近平总书记指示精......
-
在线测试题库多版本
本题库和在线测试、......
-
金属非金属矿山安全
1至3......
推荐文章
-
人人讲安全,个个会应
暴雨、洪涝常识;雷电常识;燃气安......
-
安全生产举报渠道
全面贯彻落实习近平总书记指示精......
-
在线测试题库多版本
本题库和在线测试、......
-
深入学习贯彻十九届
深入学习贯彻十九届六中全会精神......
-
“学史立行,党团先行
11月29日践行我为职工办实事......
热门文章
-
人人讲安全,个个会应
暴雨、洪涝常识;雷电常识;燃气安......
-
十大保命条例是来自
一、严禁违章指挥和强令冒险作业......
-
深入学习贯彻十九届
深入学习贯彻十九届六中全会精神......
-
在线测试题库多版本
本题库和在线测试、......
-
金属非金属矿山安全
1至3......
网友评论