Laispace - 来思碑

天酬勤笨先飞,乐观进取。

  • GIT
  • WEB
  • SVN
  • proxy
  • 归档
  • 关于
5月 23 2014
Node24

编写爬虫会使用到的一些模块

  • request 模块

    用于简化HTTP请求

  • cheerio 模块

    jquery core 的子集,实现了与DOM操作无关的API

  • async 模块

    用于简化异步代码的编写

  • debug 模块

    用于显示调试信息

  • cron 模块

    用于定时执行任务

  • child_process API

    用于启动新的进程

  • pm2 模块

    用于自动重启程序

  • uncaughException 处理错误

    process.on(‘uncaughtException’, function (err) {

      console.error('uncaughtException: ', err.stack);
    

    })

阅读全文

  • -crawler -spider1

Recents

  • UMD兼容AMD和CMD的写法
  • JavaScript 碎片
  • 移动 Web 开发技巧
  • Web worker 的简单使用
  • 常用字符集和编码格式

Categories

  • CSS5
  • Database2
  • HTML8
  • HTML51
  • Hybrid2
  • Javascript17
  • Linux1
  • Node24
  • Reading1
  • Tips1
  • Tools6
  • Translate5
  • 后台编程2
  • 好文阅读1
  • 来思碑记11
  • 每日一发21
  • 碎片积累1

Tag Cloud

-crawler -spider-linuxChild_processClusterES6FormDataHTML5MongoNPMNodeNode modulesNotesNotificationPhonegapSAEToolsUbuntuajaxanimateasyncbase64blurbufferbytewiserclearSelectconcat-streamcookiescss3debugdnsexpressfileuploadfilterflexfsgeneratorsgitgoagentgrunthtml5

Archives

  • December 20143
  • November 20142
  • September 20146
  • August 20147
  • July 201412
  • June 20143
  • May 201415
  • April 20141
  • March 20146
  • February 20141
  • January 20142
  • December 20131
  • November 20135
  • October 20134
  • September 20132
  • August 20131
  • June 20134
  • May 20132
  • April 20133
  • March 20135
  • January 20131
  • December 20126
  • November 20128
  • October 20126
  • August 20122
  • July 20122
  • May 20121
  • December 20111
© 2014 赖小赖
Powered by Hexo