代码 > cheerio.js的一个坑。
2015-02-07
今天在用nodejs给客户从老网站上爬资料时,碰到一个巨坑。
所有的问题都被转意了,导致 我公司自己的程序截取前N个字符的部分和渣一样(其实这也能算我部分代码的BUG)。
爬遍谷歌,找到了解决方案:
在使用是禁用decodeEntities。
比如:
var $ = cheerio.load(body,{decodeEntities: false});
参考:
https://github.com/cheeriojs/cheerio/issues/496
点击登录