btcq.net
当前位置:首页 >> 求高手帮我写一个获取网页内容的php正则表达式 >>

求高手帮我写一个获取网页内容的php正则表达式

如果你要和之间的所有源码,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的 标签中的内容,可以用preg_match_all//提取所有代码$pattern = '/(.+?)/is';preg_match($pattern, $string, $match);//$match[0] 即为和之间的所有源

调用函数RemoveHTML(strHTML)Function RemoveHTML(strHTML)Dim objRegExp,Match,Matches,kSet objRegExp = New RegexpobjRegExp.IgnoreCase = TrueobjRegExp.Global = TrueobjRegExp.Pattern = ""Set Matches = objRegExp.Execute(strHTML)strHTML = objRegExp.Replace(strHTML,"")RemoveHTML=strHTMLSet objRegExp = NothingEnd Function

如果你要<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的 <li></li>标签中的内容,可以用preg_match_all//提取所有代码$pattern = '/<div

“^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$”--这个是网址URL的正则表达式. “http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?”--这个是xxx.xxx.xxx. “^[A-Za-z0-9]+$”--这个是只允许字母和数字,大小写都可以的. “[u4e00-u9fa5]”--这是匹配中文字符的正则表达式. 就这些吧,希望能帮到您,谢谢.

preg_match_all("/<a class=\"sw-ui-photo100-box\"(?:[^<>]*?)href=\"([^\'\"]*?)\" target=\"_blank\">\s+<img (?:data-lazyload-)?src=\"([^\'\"]*?)\" border=\"0\" alt=\"([^\"\']*?)\">\s+<\/img>\s+<\/a>/is") 已测试,望采纳

这个你看可以去百度一下 很多现成的正则的验证,直接拿过来用就可以啊 ,如果想学的话就看看正则的书 这下面是一些常用的正则 限制输入6位数字 ^(\d{6})*$ 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内)

<?php $pattern="/http:\/\/.*\.youku.com\/.*\.*\/sid\/(.*)\/v.swf.*/";$str=" http://player.youku.com/player.php/sid/XNTg0NDExMzI=/v.swf[/flash]";if(preg_match_all($pattern, $str, $array)){ echo "匹配正确".'<br>'; echo $array[1][0];}else { echo "匹配不正确";}?> 结果如图:

这样写对,完整的程序如下:';preg_match('/<

我这边测试没有问题,代码如下: $aa = '<li> <a title="" target="_blank" href="http://sports.sina.com.cn/cba/2014-11-10/17327404918.shtml">马布里:连续客场非输球借口</a> </li>';$reg = '#<a title="" target="_blank" href="(.*?)">(.*?)</a>#si';$cnt = preg_match_all($reg, $aa, $matches);echo $cnt;var_dump($matches);

我写好了,用Dreamweaver调试过,可以匹配. 先用下面正则提取需要的代码段: Draw Result.+?>(\d{1,2})</td>.+?>(\d{1,2})</td>.+?>(\d{1,2})</td>.+?>(\d{1,2})</td>.+?>(\d{1,2})</td>.+?>(\d{1,2})</td>再用正则替换,把该内容中除了数字以外的代码去除: 替换成$1,$2,$3,$4,$5,$6 即可得到 4,7,8,33,36,43

相关文档
网站首页 | 网站地图
All rights reserved Powered by www.btcq.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com