入门大数据必读

浪尖 浪尖聊大数据

前言,学大数据要先换电脑:
保证电脑4核8G内存64位操作系统,尽量有ssd做系统盘,否则卡到你丧失信心。硬盘越大越好。
1,语言要求
java刚入门的时候要求javase。
scala是学习spark要用的基本使用即可。
后期深入要求:
java NIO,netty,多线程,ClassLoader,jvm底层及调优等,rpc。
2,操作系统要求
linux 基本的shell脚本的使用。
crontab的使用,最多。
cpu,内存,网络,磁盘等瓶颈分析及状态查看的工具。
scp,ssh,hosts的配置使用。
telnet,ping等网络排查命令的使用
3,sql基本使用
sql是基础,hive,sparksql等都需要用到,况且大部分企业也还是以数据仓库为中心,少不了sql。
sql统计,排序,join,group等,然后就是sql语句调优,表设计等。
4,大数据基本了解
Zookeeper,hadoop,hbase,hive,sqoop,flume,kafka,spark,storm等这些框架的作用及基本环境的搭建,要熟练,要会运维,瓶颈分析。
5,mapreduce及相关框架hive,sqoop
深入了解mapreduce的核心思想。尤其是shuffle,join,文件输入格式,map数目,reduce数目,调优等。
6,hive和hbase等仓库
hive和hbase基本是大数据仓库的标配。要回用,懂调优,故障排查。
hbase看浪尖hbase系列文章。hive后期更新。
7,消息队列的使用
kafka基本概念,使用,瓶颈分析。看浪尖kafka系列文章。
8,实时处理系统
storm和spark Streaming
9,spark core和sparksql
spark用于离线分析的两个重要功能。
10,最终方向决策
a),运维。(精通整套系统及故障排查,会写运维脚本啥的。)
b),数据分析。(算法精通)
c),平台开发。(源码精通)

自学还是培训?

无基础的同学,培训之前先搞到视频通学一遍,防止盲目培训跟不上讲师节奏,浪费时间,精力,金钱。

有基础的尽量搞点视频学基础,然后跟群里大牛交流,前提是人家愿意,
想办法跟大牛做朋友才是王道。看浪尖的文章,跟着文章思考操作。

关注浪尖公众号,回复:入门,获取基础课程。
回复:pdf,获取架构类设计的pdf

至于难么?请看下图:

©著作权归作者所有:来自51CTO博客作者mob604756ed02fe的原创作品,如需转载,请注明出处,否则将追究法律责任

好知识,才能预见未来

赞赏

0人进行了赞赏支持

更多相关文章

  1. Vue.js 基础入门系列(一)环境搭建
  2. 0基础学习Python该如何入门?Python学习方法!
  3. Vue.js基础入门系列(二)数据绑定
  4. 学Python编程有什么用?Python基础教程!
  5. 技多不压身,手把手教你零基础秒上手成为数据可视化老司机
  6. 3,Structured Streaming使用checkpoint进行故障恢复
  7. 大数据基础系列之JAVA引用详解
  8. 零基础入门 实战mpvue2.0多端小程序框架
  9. 1819、shell脚本基础-bash变量和逻辑运行0脚本编程基础及配置文

随机推荐

  1. Linux下多任务间通信和同步-消息队列
  2. awk域分隔符问题
  3. Linux下如何备份恢复和查看硬盘MBR与分区
  4. 008_Linux驱动之_IO口的配置
  5. 将JSON文件中的所有时间戳转换为bash(Ubu
  6. Linux时区设置和时间同步-基于CentOS 6(最
  7. VMware Workstation虚拟机平台安装Linux-
  8. 小记——inotify文件监控
  9. Linux技巧:如何利用Putty连接Linux主机
  10. Linux--常用命令--last