PHP简单获取网站百度搜索和搜狗搜索收录量的方法-华尔子博-奥夏网

获取网站在百度和搜狗搜索的收录量,可以采用以下简单方法:

# 百度搜索收录量

function getBaiduIndex($url) {
    $url = 'http://www.baidu.com/s?wd=' . urlencode($url);
    $content = file_get_contents($url);
    if (strpos($content, '约') !== false) {
        preg_match('/约(.*?)个结果/is', $content, $matches);
        $index = $matches[1];
    } else {
        preg_match('/ Records/is', $content, $matches);
        $index = $matches[0];
        $index = str_replace(' Records', '', $index);
    }
    return $index;
}

echo getBaiduIndex('https://www.xxx.com');

该方法通过访问百度搜索结果页,正则匹配获取返回的搜索结果数量,从而得到网站在百度的收录条数。

# 搜狗搜索收录量

function getSogouIndex($url) {
    $url = 'https://www.sogou.com/web?query=' . urlencode($url);
    $content = file_get_contents($url);
    preg_match("/找到相关网页约(.*?)个/is", $content, $matches);
    $index = $matches[1];
    return $index; 
}

echo getSogouIndex('https://www.xxx.com');

该方法原理与百度搜索相似,通过访问搜狗搜索结果页,正则匹配获取返回的搜索结果数量,得到网站在搜狗的收录量。

以上两个方法都是简单爬虫的思路,通过分析搜索引擎结果页的HTML内容来获取网站收录条数。

对于收录量较大的网站,结果可能有一定偏差,但总体来说能比较准确地反映网站的搜索收录情况。

通过定期获取数据变化,可以帮助我们分析网站是否出现 searcher 蜕皮现象或搜索收录有异常变化等情况。这对于SEO优化和运营来说具有一定的参考价值。

本文刊载的所有内容，包括文字、图片、音频、视频、软件、程序、以及网页版式设计等部门来源于互联网，版权均归原作者所有！本网站提供的内容服务于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。
联系信息：邮箱aoxolcom@163.com或见网站底部。

THE END