9月12日爆出,也就是刚刚,存信科技被杭州市公安局西湖分局古荡派出所查封,原因还没实锤,但据相关报道透露大概率上可能是因为爬虫




公信宝是干啥的?

可能有的朋友听说过公信宝这个产品,不知道的正好来介绍一下。

公信宝是一家基于区块链技术、网络爬虫和大数据分析的个人征信数据服务交易所,适用于各行各业的数据交换。公信宝数据交易所具面向的典型客户为互联网金融领域的网络贷款、汽车金融、消费金融、银行等企业以及有数


通过企查查我发现,它的主体运营公司为杭州存信数据科技有限公司

工商信息显示,存信数据,注册于2016年10月28日,注册资本750万元,法定代表人、执行董事兼总经理为黄敏强。该公司出资结构为:黄敏强,66.5%;涂国君,18.5%;李笑来,7.5%;天津真格天弘资产管理合伙企业(有限合伙),7.5%。
公信宝为啥被查封?公信宝除了区块链,主要业务还有爬虫。在一份产品价格服务表中,公信宝介绍了其爬虫类数据类型涵盖社保、学信网、京东、电信、移动、联通、智联招聘、芝麻信用分、微信、支付宝,甚至是人行征信数据等。


观察仔细的朋友应该发现了,股东之一有李笑来,认缴56.25万。事发之后,李笑来在微博上迅速发表了自己的看法,表示:做天使投资真的不是容易的事儿啊!



爬虫到底犯不犯法?


老生常谈的话题了,原来我开始学爬虫也是因为好玩,没想到现在已经被推到风口浪尖上了,对于爬虫触犯法律的边界确实值得研究。


按我的想法来说,技术是无罪的,爬虫技术本身没问题,但凡事要有个度。爬数据自己研究学习我想很多朋友都干过,但是你拿爬来数据换取商业价值,而且很多数据都是隐私数据,并未经许可,那真的是该管一管了。


虽说在大数据时代我们都相当于裸奔,但是起码的底线还是要有的。对于个人信息的使用上是有相关法规文件的,数据层面上有个人信息的规定:

《中华人民共和国刑法》第二百五十三条之一所涉的“侵犯公民个人信息罪”及第二百八十六条之一所涉的“拒不履行信息网络安全管理义务罪”就是爬虫在个人信息爬取过程中经常触碰到的“红线”。未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于刑法第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。

爬虫行为上也同样存现有一些限制。大家都知道反爬虫,目的是防止恶意的爬虫造成服务器瘫痪的影响。多线程多进程走起来,大家比比谁单位时间内爬的数据多。这些行为一定程度上可能会对其它公司正常业务造成一定的影响,万一宕机了谁来负责,运维也不能总背锅啊。

《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。《刑法》第二百八十六条还规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。

虽然具体仅针对爬虫的相关法规还没出来,不过前几天分享过的一篇文章也提到过了,爬虫法即将出台。


©著作权归作者所有:来自51CTO博客作者mb5fe18e9fef50b的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 干货丨时序数据库DolphinDB横截面引擎教程
  2. 别再造假数据了,来试试 Faker 这个库吧!
  3. 爬虫智能解析库 Readability 和 Newspaper 的用法
  4. Python 如何爬取实时变化的 WebSocket 数据
  5. 介绍一些比较方便好用的爬虫工具和服务
  6. 还在一个个写规则?来了解下爬虫的智能化解析吧!
  7. Python排序算法[二]:测试数据的迷雾散去
  8. Python常用的数据存储方式有哪些?五种!
  9. 爬虫又报错了?用 Scrapy 来一发邮件不就好了!

随机推荐

  1. Hibernate 和 UUID 标示符
  2. 内推工作福利
  3. 数据库界的 Swagger,一键自动生成 Java 实
  4. 为什么 String 类是不可变的?
  5. 我终于决定要放弃 Postman,选择了牛逼的神
  6. 使用后台进程和 Shutdown Hook 友好地关
  7. ConcurrentHashMap 和 HashTable 的区别
  8. 船新 IDEA 2020.3 插件大合集,个个都是精
  9. 恕我直言,我怀疑你没怎么用过枚举
  10. 昨天你用的 YYYY-MM-dd 被 CTO 捶了吗?