之前有个朋友提到了抖音数据的获取。


问我这样的行业前景如何,说实话我哪知道啊...


不过也算是给我提供了一些分析思路,感谢。



所以本次就来分析一下抖音的那些大V们


来探索一下什么样的视频在抖音里最受欢迎。


这里不得不吐槽一下抖音,体验越来越差。


从一开始的打开App没广告,再到现在启动页面有广告,刷视频也有广告,还有商品橱窗的存在。


当然这只是吐槽一下而已,其实无论什么产品,广告必不可少~


否则,日子估摸着一天比一天难过。


或许,某一天我的公众号也会出现广告...



/ 01 / 获取分析


信息肯定不是去抖音获取的,而是从某平台爬取的。


具体的就不透露了,万一哪天被查水表了该怎么办。


如果需要数据集的,公众号回复「抖音」,即可获取。



主要包含了大V们的昵称、性别、类型、点赞数、粉丝数以及视频数。


一共有2840位抖音大V,粉丝数都是50w+。



/ 02 /  数据可视化


01 性别分布情况



2000多位大V,除去未知性别的,男女比例基本在「1:1」。


可视化代码如下。


def create_gender(df):
    """
    性别
    """

    df = df.copy()
    df.loc[df.gender == 0'gender'] = '未知'
    df.loc[df.gender == 1'gender'] = '男性'
    df.loc[df.gender == 2'gender'] = '女性'
    gender_message = df.groupby(['gender'])
    gender_com = gender_message['gender'].agg(['count'])
    gender_com.reset_index(inplace=True)

    # 生成饼图
    attr = gender_com['gender']
    v1 = gender_com['count']
    pie = Pie("抖音大V性别分布情况", title_pos='center', title_top=0)
    pie.add("", attr, v1, radius=[4075], label_text_color=None, is_label_show=True, legend_orient="vertical", legend_pos="left", legend_top="%10")
    pie.render("抖音大V性别分布情况.html")


02 点赞数TOP10



点赞数都是过亿的存在,就问你怕不怕。


其中「浙有正能量」和「人民日报」这两个都是属于弘扬中国正能量的。


泱泱大中华,复兴在当下,国强则无惧,龙行在天涯。


可视化代码如下。


def create_likes(df):
    """
    点赞数
    """

    df = df.sort_values('likes', ascending=False)
    attr = df['name'][0:10]
    v1 = ["{}".format(float('%.1f' % (float(i) / 100000000))) for i in df['likes'][0:10]]

    # 生成柱状图
    bar = Bar("抖音大V点赞数TOP10(亿)", title_pos='center', title_top='18', width=800, height=400)
    bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
    bar.render("抖音大V点赞数TOP10.html")


03 粉丝数TOP10



粉丝数前十,大部分大V都是娱乐圈的。


这也是当下所流行的~


可视化代码如下。


def create_fans(df):
    """
    粉丝数
    """

    df = df.sort_values('fans', ascending=False)
    attr = df['name'][0:10]
    v1 = ["{}".format(float('%.1f' % (float(i) / 10000))) for i in df['fans'][0:10]]

    # 生成柱状图
    bar = Bar("抖音大V粉丝数TOP10(万)", title_pos='center', title_top='18', width=800, height=400)
    bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
    bar.render("抖音大V粉丝数TOP10.html")


04 各类型点赞数汇总分布图



「蓝V」「娱乐」「生活」「美女」「搞笑」「帅哥」「音乐」这些类型的抖音视频,应该算是在抖音里较受欢迎的。


蓝V是抖音上的一个认证方式,主要是针对企业。



从上面可以看出大部分是媒体这一块,内容则主要是一些时事以及那些正能量视频。


可视化代码如下。


def create_type_likes(df):
    """
    类型点赞数
    """

    dom = []
    likes_type_message = df.groupby(['type'])
    likes_type_com = likes_type_message['likes'].agg(['sum'])
    likes_type_com.reset_index(inplace=True)
    for name, num in zip(likes_type_com['type'], likes_type_com['sum']):
        data = {}
        data['name'] = name
        data['value'] = num
        dom.append(data)

    # 生成矩形树图
    treemap = TreeMap("各类型抖音大V点赞数汇总图", title_pos='center', title_top='5', width=800, height=400)
    treemap.add('各类型抖音大V点赞数汇总图', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
    treemap.render('各类型抖音大V点赞数汇总图.html')


05 各类型粉丝数汇总分布图



「娱乐」类型大V的粉丝数遥遥领先,位居第一。


其次便是「美女」「生活」「音乐」「帅哥」「文化」「蓝V」类型的。


结合一下点赞数的数据,我们就能知道在抖音里什么样的视频大家比较喜欢。


便是「娱乐」「生活」「美女」「帅哥」「音乐」「蓝V」这几个类型。


可视化代码如下。


def create_type_fans(df):
    """
    类型粉丝数
    """

    dom = []
    fans_type_message = df.groupby(['type'])
    fans_type_com = fans_type_message['fans'].agg(['sum'])
    fans_type_com.reset_index(inplace=True)
    for name, num in zip(fans_type_com['type'], fans_type_com['sum']):
        data = {}
        data['name'] = name
        data['value'] = num
        dom.append(data)

    # 生成矩形树图
    treemap = TreeMap("各类型抖音大V粉丝数汇总图", title_pos='center', title_top='5', width=800, height=400)
    treemap.add('各类型抖音大V粉丝数汇总图', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
    treemap.render('各类型抖音大V粉丝数汇总图.html')


06 视频粉丝点赞三维度图



视频越多并不意味着点赞数就越多,粉丝数就越多。


不过还是会有个例出现,比如「浙有正能量」,1744个视频,4.6亿点赞数。


可视化代码如下。


def create_scatter(df):
    """
    三维度散点图
    """

    # 生成数据列表
    data = [list(i) for i in zip(df['videos'], df['fans'], df['likes'], df['name'])]

    # 生成散点图
    x_lst = [v[0for v in data]
    y_lst = [v[1for v in data]
    extra_data = [v[2for v in data]
    sc = Scatter("抖音大V视频数粉丝数点赞数三维度", title_pos='center', title_top='5', width=800, height=400)
    sc.add("", x_lst, y_lst, extra_data=extra_data, is_visualmap=True, visual_dimension=2, visual_orient="horizontal", visual_type="size", visual_range=[0500000000], visual_text_color="#000", visual_range_size=[530])
    sc.render('抖音大V视频数粉丝数点赞数三维度.html')


07 平均视频点赞数TOP10



第一居然被一个珠宝商给霸占了,我觉得肯定有猫腻。


于是便去抖音看了一眼。



鬼知道它的粉丝和点赞数怎么来的。


或许和圈内的删库一样,小哥删视频跑路了。


可视化代码如下。


def create_avg_likes(df):
    """
    平均点赞数
    """

    df = df[df['videos'] > 0]
    df.eval('result = likes/(videos*10000)', inplace=True)
    df['result'] = df['result'].round(decimals=1)
    df = df.sort_values('result', ascending=False)
    attr = df['name'][0:10]
    v1 = df['result'][0:10]

    # 生成柱状图
    bar = Bar("抖音大V平均视频点赞数TOP10(万)", title_pos='center', title_top='18', width=800, height=400)
    bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
    bar.render("抖音大V平均视频点赞数TOP10.html")


08 平均视频粉丝数TOP10



妥妥的娱乐圈大佬。


反正我是一个没关注,你们呢?


可视化代码如下。


def create_avg_fans(df):
    """
    平均粉丝数
    """

    df = df[df['videos'] > 0]
    df.eval('result = fans/(videos*10000)', inplace=True)
    df['result'] = df['result'].round(decimals=1)
    df = df.sort_values('result', ascending=False)
    attr = df['name'][0:10]
    v1 = df['result'][0:10]

    # 生成柱状图
    bar = Bar("抖音大V平均视频粉丝数TOP10(万)", title_pos='center', title_top='18', width=800, height=400)
    bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
    bar.render("抖音大V平均视频粉丝数TOP10.html")



/ 03 / 总结


我们常说,刷抖音就是浪费时间。


讲道理,抖音上也是有不少技术流的大佬,当然内容上更趋向于视频制作。


比如下面这几位,鼎鼎大名的「黑脸V」。



所以,抖音也并不是一无是处。


如果哪天你也能学会制作出那些吊炸天的视频,也是一种收获。


当然路很长,慢慢走~


万水千山总是情,点个「在看」行不行。





···  END  ···



©著作权归作者所有:来自51CTO博客作者mb5fe18ec4a4df8的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 用Python生成抖音字符视频!
  2. 用Python清除文件夹中的重复视频
  3. 用Python全自动下载抖音视频!
  4. 教你使用Python下载全网视频
  5. 视频当道的时代,这些珍藏的优质 Python 播客值得推荐
  6. 20张图!3个视频!一文带你搞定「快慢指针」在数组中的应用
  7. 以B站C语言视频为基础的课后总结(一)
  8. 学算法的那些年,吴师兄接触的网站、软件、视频、书籍大揭秘
  9. 视频讲解 | 图解剑指offer:二维数组的查找

随机推荐

  1. 使用jQuery更新textarea值更改的文本
  2. 是否每次都可能分离内容、表示和行为?
  3. jquery向Django后台发送数组
  4. 将JavaScript对象作为Dictionary 传递给C
  5. 如何防止缓存.NET JSON源
  6. 如何在用户选择操作后获取当前日期和时间
  7. jquery内部实现原理分析
  8. 用replaceWith()对DOM结点操作时应注意的
  9. JavaScript / jQuery:如何链接使用console
  10. 动态添加表单元素,将它们存储到MySQL并在