Node.js 爬虫常见问题

1,cheerio 获取一个文本节点,该节点没有html标签,比如想获取html中的“猪突猛进”

<a href="#">
  猪突猛进
  <span>2021年3月12日</span>
</a>


var text = $("#itemInfo").contents().filter(function () {
      return this.nodeType === 3;
}).text();


2,Node.js 获取 IP V6 内容出现超时问题的解决方法

本地是IP V4,获取IP V6内容的时候,提示:

Error: connect ETIMEDOUT 172.67.215.xxx:80
  at TCPConnectWrap.afterConnect [as oncomplete] (net.js:1137:16) {
 errno: 'ETIMEDOUT',
 code: 'ETIMEDOUT',
 syscall: 'connect',
 address: '172.67.215.xxx',
 port: 80
}


原因是 http.request(url[, options][, callback]) 中,options 的 family <number> 当解析 host 或 hostname 时使用的 IP 地址族。有效值为 4 或 6。如果没有指定,则同时使用 IP v4 和 v6。这里需要显示设置为6才可以正常使用。



真诚赞赏,手留余香
赞赏
MySQL
MySQL 删除多余重复的记录,只保留一条
2021-03-17
MySQL
MySQL 函数 FIND_IN_SET 和 IN 的区别
2021-04-10
ngtwewy
随机推荐
Debian11 安装笔记4:安装常用软件
CSS 实现图标详解 image sprite、Icon Font、svg 和 CSS 绘制
WordPress 中如何在主题和插件中使用
进制计数法
MySQL tag设计中,where in参数为带逗号的字符串查询
macOS 自动登录 ssh
Node.js WebSocket
Node.js MySQL 连接池和事务
MySQL的外键总结
JavaScript 检查 Date 是否为 Invalid Date

微信联系我

夜间模式切换
回到顶部