前言


大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧。可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团网相关数据,以一个消费者的角度去分析如何选择店铺。



数据获取与说明


本文将基于重庆市火锅数据进行分析,为啥是重庆的火锅,除了辣之外还因为其他城市的火锅店数量相比重庆的火锅店数量就是小巫见大巫

除此之外,相信重庆人民对于火锅的评价会更加地道,所以我们打开重庆市美团网选择火锅进入店铺列表。接下来的操作就和之前类似了:F12—>找到数据包—>requests请求数据—>pandas清洗


但是本文需要爬取两层数据,首先需要在店铺列表取得店铺id、店铺名和销量等相关数据,第二步还需要根据刚刚的店铺id进入每一个店铺请求评论数据相关代码如下

for k in url_list:
    url = k
    r = requests.get(url,headers = headers,proxies=proxies)
    data = r.json()['data']['poiInfos']
    for i in range(len(data)):
        ID = data[i]['poiId']
        biaoti = data[i]['title']
        junfen = data[i]['avgScore']
        pingjia = data[i]['allCommentNum']
        dizhi = data[i]['address'][0:3]
        junjia = data[i]['avgPrice']
        youhui = 1 if len(data[i]['dealList']) > 0 else 0
        df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
        s = s + 1
来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据



去哪吃


首先看下重庆市不同地区的火锅店分布,找火锅店嘛,总要找火锅店多的地区,这样能选择的店铺也更多

从上图可以看到,重庆市的火锅店基本集中在渝中区、渝北区、沙坪坝区、南岸区,并且经过进一步的计算可以得到这四个区的火锅店总数为388家,在所有进入统计的重庆市27个区县共750家店铺中占到了超过一半,所以优先去这四个区,十步一家火锅店,总有你要的!



什么时候吃


在对地点分析之后,我们来对吃火锅的时间进行分析,以评论数量代替同时吃火锅的人数,并使用Pandas提取含有时间的评论并进行整理得到不同时间的人流量与平均评分

从上图可以看到,重庆人民吃火锅的时间集中在下午和晚上,并且高峰期集中在晚上7点至11点,所以想安安静静吃火锅可以避开这段时间。不过从整体评价来看下午的评价不太好,反而晚上10点之后的评价比较高,可能是大家对于老板也耐心等候表示认可



选什么标签


每个店铺下的评价都有顾客评价的标签

本节我们通过绘制好评用户的矩形数图来看下带有哪些标签的火锅店获得的好评更多

从上图可以看出除了味道赞,重庆人更喜欢去回头客多、上菜快的店铺,所以当我们寻找一家火锅店的时候,点开店铺评价,按照带有上面标签找准没错。



选什么价格


在挑选一家火锅店的时候,价格也是很重要的一项参考指标,本节对均价格绘制直方图同时添加对应价格的平均分曲线©著作权归作者所有:来自51CTO博客作者mb5fe18e32e4691的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 【ecmall】解决无法上传店铺logo和banner照片问题
  2. Android Things:“1024工场”店铺开张啦!树莓派套装首发—专为Andr

随机推荐

  1. 哈利·波特的考试 java描述
  2. 算法笔记_138:稳定婚姻问题(Java)
  3. Java web环境配置和Servlet实例HelloWorl
  4. Sping Boot入门到实战之实战篇(二):一些常用
  5. Java学习(三)面向对象之多态
  6. 将嵌入式DB与远程DB同步
  7. 我在Java中组织这些if语句时遇到了很多麻
  8. java与ASP.NET网络应用程序在生命期开始
  9. 怎样用java生成GUID与UUID
  10. 怎么用java 实现两个web service之间调用