Appearance
爬虫
可以通过爬虫做资讯、商品或其它公开信息做自动化采集。
使用爬虫必须遵守法律法规,不得采集隐私信息,采集频次要有限制。
使用爬虫
使用如下代码使用爬虫:
php
use QL\QueryList;
$source = QueryList::get('https://www.baidu.com')
->rules(
//这里可以按具体规则进行采集
[
'title'=>array('h3','text'),
'link'=>array('h3>a','href')
]
)
->queryData();
比如我们要爬取所有的省份:
php
use QL\QueryList;
$ql = QueryList::getInstance();
$ql->bind('http', function ($url) {
$html = file_get_contents($url);
$this->setHtml($html);
return $this;
});
$data = $ql->range('.provincetr td')->rules([
'title' => ['a', 'text'],
'link' => ['a', 'href']
])->http('http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2022/index.html')->query()->getData()->all();
var_dump($data);