获取网站在百度和搜狗搜索的收录量,可以采用以下简单方法:
# 百度搜索收录量
function getBaiduIndex($url) { $url = 'http://www.baidu.com/s?wd=' . urlencode($url); $content = file_get_contents($url); if (strpos($content, '约') !== false) { preg_match('/约(.*?)个结果/is', $content, $matches); $index = $matches[1]; } else { preg_match('/ Records/is', $content, $matches); $index = $matches[0]; $index = str_replace(' Records', '', $index); } return $index; } echo getBaiduIndex('https://www.xxx.com');
该方法通过访问百度搜索结果页,正则匹配获取返回的搜索结果数量,从而得到网站在百度的收录条数。
# 搜狗搜索收录量
function getSogouIndex($url) { $url = 'https://www.sogou.com/web?query=' . urlencode($url); $content = file_get_contents($url); preg_match("/找到相关网页约(.*?)个/is", $content, $matches); $index = $matches[1]; return $index; } echo getSogouIndex('https://www.xxx.com');
该方法原理与百度搜索相似,通过访问搜狗搜索结果页,正则匹配获取返回的搜索结果数量,得到网站在搜狗的收录量。
以上两个方法都是简单爬虫的思路,通过分析搜索引擎结果页的HTML内容来获取网站收录条数。
对于收录量较大的网站,结果可能有一定偏差,但总体来说能比较准确地反映网站的搜索收录情况。
通过定期获取数据变化,可以帮助我们分析网站是否出现 searcher 蜕皮现象或搜索收录有异常变化等情况。这对于SEO优化和运营来说具有一定的参考价值。
© 版权声明
本文刊载的所有内容,包括文字、图片、音频、视频、软件、程序、以及网页版式设计等部门来源于互联网,版权均归原作者所有!本网站提供的内容服务于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
联系信息:邮箱aoxolcom@163.com或见网站底部。
联系信息:邮箱aoxolcom@163.com或见网站底部。
THE END
请登录后发表评论
注册
社交帐号登录