php的curl携带header请求头信息实现http访问的方法

吾爱主题 阅读:200 2021-11-03 15:15:00 评论:0

 导读:

curl请求时添加请求头信息可以模拟真人操作,不容易被当成是爬虫机器人(采集),从而可以绕过Incapsula等安全验证机制。

1、首先使用浏览器(示例使用的是火狐浏览器)访问接口网址,使用F12调试,查看请求头信息,如下:

2、实现代码:

?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 <?php /**   * 开始访问请求   * @param $url   * @return bool|string   */ function fetch_url( $url ) {      $header = FormatHeader( $url );      $useragent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0' ;      $timeout = 120;      $ch = curl_init( $url );      curl_setopt( $ch , CURLOPT_FAILONERROR, true);      //设置请求头信息      curl_setopt( $ch , CURLOPT_HTTPHEADER, $header );      //不取得返回头信息       curl_setopt( $ch , CURLOPT_HEADER, 0);      // 关闭https验证      curl_setopt( $ch , CURLOPT_SSL_VERIFYPEER, false);      curl_setopt( $ch , CURLOPT_SSL_VERIFYHOST, false);      curl_setopt( $ch , CURLOPT_FOLLOWLOCATION, true );      curl_setopt( $ch , CURLOPT_ENCODING, "" );      curl_setopt( $ch , CURLOPT_RETURNTRANSFER, true );      curl_setopt( $ch , CURLOPT_AUTOREFERER, true );      curl_setopt( $ch , CURLOPT_CONNECTTIMEOUT, $timeout );      curl_setopt( $ch , CURLOPT_TIMEOUT, $timeout );      curl_setopt( $ch , CURLOPT_MAXREDIRS, 10 );      curl_setopt( $ch , CURLOPT_USERAGENT, $useragent );      $content = curl_exec( $ch );      if (curl_errno( $ch ))      {          echo 'Error:' . curl_error( $ch );      }      else      {          return $content ;         }      curl_close( $ch ); }   //添加请求头 function FormatHeader( $url ) {   // 解析url   $temp = parse_url ( $url );   $query = isset( $temp [ 'query' ]) ? $temp [ 'query' ] : '' ;   $path = isset( $temp [ 'path' ]) ? $temp [ 'path' ] : '/' ;   $header = array (   "POST {$path}?{$query} HTTP/1.1" ,   "Host: {$temp['host']}" ,   "Referer: http://{$temp['host']}/" ,   "Content-Type: text/xml; charset=utf-8" ,   'Accept: application/json, text/javascript, */*; q=0.01' ,   'Accept-Encoding:gzip, deflate, br' ,   'Accept-Language:zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2' ,   'Connection:keep-alive' ,   'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0' ,   'X-Requested-With: XMLHttpRequest' ,   );   return $header ; } ?>

3、调用示例:

?
1 2 3 4 5 <?php //lcg_value() 返回范围为 (0, 1) 的一个伪随机数 $url = "http://www.xxx.com/getdata.php?v=" .lcg_value(); //访问网址 $html = fetch_url( $url );

到此这篇关于php的curl携带header请求头信息实现http访问的方法的文章就介绍到这了,更多相关php的curl请求头信息实现http访问内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/qq15577969/article/details/110913311

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

【腾讯云】云服务器产品特惠热卖中
搜索
标签列表
    关注我们

    了解等多精彩内容