代码 > cheerio.js的一个坑。

2015-02-07

今天在用nodejs给客户从老网站上爬资料时,碰到一个巨坑。

所有的问题都被转意了,导致 我公司自己的程序截取前N个字符的部分和渣一样(其实这也能算我部分代码的BUG)。

爬遍谷歌,找到了解决方案:

在使用是禁用decodeEntities。

比如:

var $ = cheerio.load(body,{decodeEntities: false});

参考:

https://github.com/cheeriojs/cheerio/issues/496

点击登录