以下是一个简单的PHP爬虫实例,它演示了如何从一个静态网页中抓取数据。这个实例将使用PHP的cURL库来发送HTTP请求,并解析返回的HTML内容。
实例:使用PHP从网站获取标题列表
1. 配置环境
确保你的PHP环境中已经安装了cURL扩展。

2. PHP代码
```php
// 目标网站的URL
$url = 'http://example.com';
// 初始化cURL会话
$ch = curl_init($url);
// 设置cURL选项
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, false);
// 执行cURL会话
$response = curl_exec($ch);
// 检查是否有错误发生
if (curl_errno($ch)) {
echo 'cURL error: ' . curl_error($ch);
exit;
}
// 关闭cURL会话
curl_close($ch);
// 使用DOMDocument解析HTML
$dom = new DOMDocument();
@$dom->loadHTML($response);
// 获取所有的标题元素
$titles = $dom->getElementsByTagName('h1');
// 创建一个数组来存储标题
$titlesArray = [];
// 遍历所有标题并添加到数组中
foreach ($titles as $title) {
$titlesArray[] = $title->nodeValue;
}
// 输出标题列表
echo "







