Python Web高级爬虫工程师测试题
(请本文件发送到: SpiderTestQuestion@163.com 并附带简历)

1、 用yield写一个斐波那契数列的生成器函数。

2、 放一段scrapy项目parse函数的代码(解析列表页,使用分组提取,解析字段)。

3、 遇到过哪些反爬策略,如果突破?

4、 scrapy各个模块启动顺序(Spider, Middleware, Pipeline的加载、实例化、Open、Close的顺序)。

5、 使用过哪些抓包工具,各有什么优点。

6、 有没有自己博客,贴一下网址。

7、 字体加密反爬机制及分类。

8、 遇到过那些验证码,怎么突破的,不使用打码平台有办法吗?

9、 简述了解的采集任务管理平台,有何不同,有修改过源码吗?

10、 遇到过哪些难度大的网站,卡在哪了,认为反爬的天花板网站/软件有哪些。

11、 selenium/splash/puppeteer(谷歌)/playwright(微软)/web scraper(插件) 优劣势。

12、 js/小程序/apk的Hook 原理。

13、 遇到过那些防御系统,极验验证码/易盾/观镜防御系统反爬策略优劣。

14、 简述绕过小程序动态调试中用户验证的方式。

15、 还有哪些问题是没问到的,又是自己的优势优点,可自行作答

附件:高级爬虫面试测试题 v1.3

更多相关文章

  1. python爬虫抓取富贵论坛
  2. 无头浏览器Selenium的使用要点
  3. 请简述 DOM 事件模型或 DOM 事件机制
  4. 简述事件委托(事件代理)
  5. python爬虫采集企查查数据
  6. Python经典面试题之前端和框架!Python学习分享
  7. 亚马逊商品销售数据爬虫分析报告
  8. 什么是MongoDB?Python爬虫为什么使用MongoDB?
  9. Python爬虫的框架有哪些?推荐这五个!

随机推荐

  1. php android json
  2. Android zip解压
  3. android flash 遮挡问题
  4. Android下Notification(通知栏)的使用
  5. Android NDK 往控制台打印Log
  6. Android 打开浏览器的几种方法
  7. Android之圆角矩形
  8. 科普篇
  9. Android app版本号的修改
  10. 【Android學習專題】数据存储篇:SQLite