想必大家都知道,在从事网络爬虫工作之前,我们需要掌握很多知识,除了基本的爬虫原理之外,我们还需要学习框架、数据库等,其中就包含MongoDB。那么Python爬虫为什么使用MongoDB呢?我们一起来看看吧。

  Python爬虫为什么使用MongoDB呢?

  1. 文档结构的存储方式:简单讲就是可以直接存Json、list;

  2. 不要事先定义表,随时可以创建;

  3. 表中的数据长度可以不一样。

  比如说:你的第一条记录有10个值,第二条记录就不要规定10个值了,对爬虫很乱的数据来讲,这样是非常适用的。

  什么是MongoDB呢?

  MongoDB是一个基于分布式文件存储 的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。

  MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

  MongoDB有什么功能呢?

  它的特点是高性能、易部署、易使用,存储数据非常方便,主要功能特性有:

  面向集合存储,易存储对象类型的数据;

  模式自由、支持动态查询、支持完全索引,包含内部对象;

  支持查询、支持复制和故障恢复;

  使用高效的二进制数据存储,包含大型对象;

  自动处理碎片,以支持云计算层次的扩展性;

  支持GOlang、Ruby、Python、Java、C++、PHP、C#等多种语言;

  支持存储格式为BSON,一般json的扩展;

  可通过网络访问。


©著作权归作者所有:来自51CTO博客作者mb5fd1925b5d585的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 信创稳妥落地,一云多芯协同是唯一答案!
  2. Python爬虫的框架有哪些?推荐这五个!
  3. 程序员必须知道的9大数据挖掘工具
  4. Bootstrap5中文手册完整翻译版发布
  5. 基于golang分布式爬虫系统的架构体系v1.0
  6. 视频:使用Docker搭建RabbitMQ环境
  7. 关于驰骋BPM对银行行业的问题答复
  8. 微信支付V3实现Payment Spring Boot 1.0.4.RELEASE发布,支持商家
  9. 图片

随机推荐

  1. Android(Java)简单发送和接收服务器 - 快速
  2. 谷歌横幅广告未能加载广告:0
  3. 9PNG用的很不舒服,请高手指导!
  4. Android-----------扫描二维码
  5. Android 开发之 Android 开发的起步
  6. Android控件组合应用四
  7. [MD]模仿百度手机助手动态折线图/MPAndro
  8. Android圆弧形ListView的实现
  9. Android在Dialog中显示PopupWindow不全问
  10. sc7731 Android 5.1 Camera 学习之二 fra