测评file_get_contents与curl 效率及稳定性

简介: 测评file_get_contents与curl 效率及稳定性

做过好多抓取别家网站内容的产品,习惯了使用方便快捷的file_get_contents函数,但是总是会遇到获取失败的问题,尽管按照手册中的例子设置了超时,可多数时候不会奏效:

$config['context'] = stream_context_create(array(‘http’ =< array(‘method’ =< “GET”,
   ’timeout’ =< 5//这个超时时间不稳定,经常不奏效
   )
  ));

这时候,看一下服务器的连接池,会发现一堆类似的错误,让你头疼万分:

file_get_contents(http://***): failed to open stream…

不得已,安装了curl库,写了一个函数替换:

function curl_file_get_contents($durl){
    $ch=curl_init();
    curl_setopt($ch, CURLOPT_URL,$durl);
    curl_setopt($ch, CURLOPT_TIMEOUT,5);
    curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);
    curl_setopt($ch, CURLOPT_REFERER,_REFERER_);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
    $r=curl_exec($ch);
    curl_close($ch);
    return $r;
}

如此,除了真正的网络问题外,没再出现任何问题。


这是别人做过的关于curl和file_get_contents的测试:


file_get_contents抓取google.com需用秒数:


2.31319094


2.30374217


2.21512604


3.30553889


2.30124092


curl使用的时间:


0.68719101


0.64675593


0.64326


0.81983113


0.63956594


差距很大吧?呵呵,从我使用的经验来说,这两个工具不只是速度有差异,稳定性也相差很大。建议对网络数据抓取稳定性要求比较高的朋友使用上面的curl_file_get_contents函数,不但稳定速度快,还能假冒浏览器欺骗目标地址哦!

相关文章
|
5月前
|
Java 开发者 运维
开发与运维测试问题之OpenJDK官方还未正式发布Compact Object Headers如何解决
开发与运维测试问题之OpenJDK官方还未正式发布Compact Object Headers如何解决
40 1
|
5月前
|
资源调度 前端开发 开发工具
阿里云云效操作报错合集之Node-Sass模块在构建过程中,出现报错"ENOENT: no such file or directory, scandir ",该如何处理
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
JSON 前端开发 JavaScript
php函数file_get_contents应对百度天气接口CORB跨域解决方案
php函数file_get_contents应对百度天气接口CORB跨域解决方案
92 0
|
Apache
【解决方案】No input file specified. Apache解决方案
【解决方案】No input file specified. Apache解决方案
207 0
【解决方案】No input file specified. Apache解决方案
|
Web App开发 存储 JSON
深聊性能测试,从入门到放弃之:Locust性能自动化(七)HAR-files→locustfiles自动转换 :Transformer的使用
深聊性能测试,从入门到放弃之:Locust性能自动化(七)HAR-files→locustfiles自动转换 :Transformer的使用
213 0
深聊性能测试,从入门到放弃之:Locust性能自动化(七)HAR-files→locustfiles自动转换 :Transformer的使用
|
网络协议 IDE 测试技术
VS Code 折腾记 - (13) VS Live Share (可提高效率的代码实时协作插件)的使用姿势
这货憋了大半年,终于进入可用状态了,体验了一段时间后,该水文诞生了... 这货是什么,微软自家出的实时协作插件,有用过石墨文档或者腾讯文档的没?差不多那样了.
450 0
|
PHP
php的file_get_contents和curl差距
php的file_get_contents和curl差距
154 0
php的file_get_contents和curl差距
|
存储 JSON 前端开发
Code Review效率低?来试试智能语法服务
代码管理-智能语法服务
1423 0
Code Review效率低?来试试智能语法服务
|
SQL 索引
[20180409]delete删除缓慢分析.txt
[20180409]delete删除缓慢分析.txt --//链接:http://www.itpub.net/thread-2101054-2-1.html --//大量产生记录出现缓慢的情况.
905 0