ASP过滤HTML中标签里的属性

时间:2023年09月26日信息来源:本站原创 点击: 收藏此文 【字体:

在提取、采集、爬虫中批量过滤不需要的属性,降低数据库压力

			
function get_reg_tag(htmls,tagarr) 
if instr(tagarr,",") = 0 then
tagarr=tagarr&",<wenzi"
end if
tag_arr=split(tagarr,",")

' 创建正则表达式对象  
Dim regex  
Set regex = Server.CreateObject("VBScript.RegExp")  
regex.IgnoreCase = True'忽略大小写
regex.Global = True'设置为全文搜索
' 设置正则表达式模式,匹配需要删除的区间代码  
Dim pattern  
for i=0 to ubound(tag_arr)
tag_num=len(tag_arr(i))+1
regex.pattern = tag_arr(i)&"[^>]*?(.*?)>"  
' 设置正则表达式选项  
Dim options  
options = "sgi" ' 忽略大小写和全局搜索  
' 执行正则表达式匹配和替换  
Dim matches  
Set matches = regex.Execute(htmls)  
For Each match In matches  
matchcc = mid(match.Value,tag_num,len(match.Value)-tag_num)
htmls = Replace(htmls, matchcc, "")  
Next  
next
' 输出处理后的 HTML 字符串  
get_reg_tag=replace(htmls,"<o:p></o:p>","")
end function
(作者:佚名 编辑:weio33)
文章热词:
延伸阅读:

网友评论

 以下是对 [ASP过滤HTML中标签里的属性] 的评论,总共:0条评论

最新文章

推荐文章

热门文章