Skip to content

爬虫

可以通过爬虫做资讯、商品或其它公开信息做自动化采集。

使用爬虫必须遵守法律法规,不得采集隐私信息,采集频次要有限制。

参考文档

使用爬虫

使用如下代码使用爬虫:

php
use QL\QueryList;

$source = QueryList::get('https://www.baidu.com')
  ->rules(
    //这里可以按具体规则进行采集
    [ 
      'title'=>array('h3','text'),
      'link'=>array('h3>a','href')
    ]
   )
  ->queryData();

比如我们要爬取所有的省份:

php
use QL\QueryList;

$ql = QueryList::getInstance();
$ql->bind('http', function ($url) {
    $html = file_get_contents($url);
    $this->setHtml($html);
    return $this;
});

$data = $ql->range('.provincetr td')->rules([
            'title' => ['a', 'text'],
            'link' => ['a', 'href']
        ])->http('http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2022/index.html')->query()->getData()->all();

var_dump($data);

广州大舟信息科技 版权所有