爬虫必备:Python 执行 JS 代码 —— PyExecJS、PyV8、Js2Py
<blockquote> <p>在使用爬虫中,经常会遇到网页请求数据是经过 JS 处理的,特别是模拟登录时可能有加密请求。而目前绝大部分前端 JS 代码都是经过混淆的,可读性极低,想理解代码逻辑需要花费大量时间。这时不要着急使用 Selenium 暴力解决,毕竟 Selenium 严重拖慢爬虫效率,我们可以尝试使用一些第三方库,来直接执行前端 JS 代码...
51工具盒子
<blockquote> <p>在使用爬虫中,经常会遇到网页请求数据是经过 JS 处理的,特别是模拟登录时可能有加密请求。而目前绝大部分前端 JS 代码都是经过混淆的,可读性极低,想理解代码逻辑需要花费大量时间。这时不要着急使用 Selenium 暴力解决,毕竟 Selenium 严重拖慢爬虫效率,我们可以尝试使用一些第三方库,来直接执行前端 JS 代码...
> 北京时间 10 月 15 日,Python 官方发布了 3.8.0 正式版,该版本较 3.7 版本再次带来了多个非常实用的新特性。 赋值表达式 {#赋值表达式} -------------- PEP 572: Assignment Expressions 新增一种新语法形式:`:=`,又称为"海象运算符"(为什么叫海象,看看这两个符号像不像颜...
<h2>前言 {#前言}</h2> <p>前几天董大 <a href="https://www.zhihu.com/people/6d23d8e16eb481e548032719bb5898a4">@董伟明</a> 的爱派森上线了,还发了一套 PPT 和视频,PPT 共有75页干货,讲了很多进阶的用...
<blockquote> <p>描述符是在 Python 2.2 版本就被引用的特性,然而作为"元老",却逐渐消失在 Python 教程的视野中。但当你了解它时,你就懂得了什么是 Python 的优雅之美。</p> </blockquote> <h2>什么是描述符 {#什么是描述符}...
pip: command not found ### python 2.7 wget https://bootstrap.pypa.io/pip/2.7/get-pip.py ### python3 wget https://bootstrap.pypa.io/get-pip.py 安装pip python get-pip.py 上安装chromadb,使用以...