欢迎您访问济南云启数据科技有限公司网站
网站首页 >课程大纲> 全部课程
Linux操作系统基础

1、Linux系统概述、系统安装及相关配置
2、Linux网络基础
3、Linux终端常用命令
4、Linux vi常用命令
5、Linux 管道符
6、Linux 文件系统权限
7、Linux 文件压缩与解压缩
8、Linux 分区
9、Linux  rpm、yum 安装软件包
10、Linux 常用系统监控命令
11、Linux 正则表达式讲解
12、Linux shell 编程
13、Linux crontab at 定时任务

Java程序开发基础


1、Java简介

2、初识Java开发
3、Java基本概念
4、Java数据类型划分
5、Java运算符
6、程序逻辑
7、方法的定义与使用
8、类与对象
9、数组的定义及使用
10、String类常用方法
11、this关键字
12、引用传递实例分析
13、static关键字
14、代码块
15、内部类
16、继承性
17、覆写
18、抽象类的定义与使用
19、接口
20、Object类
21、基本数据类型的包装类
22、包的定义及使用
23、面向对象辅助概念
24、异常的捕获及处理
25、链表的定义与使用
26、Eclipse开发工具
27、Java多线程编程


Python程序开发基础

1、Python的版本及安装
2、Python的相关学习资料推荐
3、Python开发工具介绍
4、Python快速入门
5、Python数据结构,函数  
6、快速安装Python的第三方lib
7、Python面向对象编程
8、Python异常处理机制

Hadoop大数据平台体系基础

1、数据仓库与大数据开发概念
2、Apache Hadoop安装部署
3、商业发行版Hadoop安装部署
4、Ambari-大数据运维管理工具
5、HDFS-分布式文件系统
6、YARN-资源管理器
7、MapReduce-分布式离线计算框架
8、Hive-数据仓库工具
9、Sqoop-数据库交换工具
10、Flume-日志采集工具
11、Hbase-分布式列式数据库
12、Spark-分布式内存计算引擎
13、Storm-流式计算引擎
14、Kafka-消息队列
15、Azkaban-调度工具
16、Zeppelin-数据可视化工具
17、ETL工具
18、商业可视化工具
19、商业数据抓取工具
20、知识串讲
21、面试技巧

某旅游网大型离线数据电商分析平台实战

1、项目环境准备
2、项目需求介绍
3、用户行为数据收集
4、数据分析模块实现
5、数据展示模块实现

Hive-数据仓库工具

1、Hive功能、体系结构、使用场景
2、Hive环境搭建、初级使用
3、Hive原数据配置、常见交互方式
4、Hive中的内部表、外部表、分区表
4、Hive 数据迁移
5、Hive常见查询(select、where、distinct、join、group by)
6、Hive数据的存储和压缩
7、Hive常见优化(数据倾斜、压缩等)
8、结合Hive对用户浏览日志实际案例分析

Hbase-分布式数据库

1、Hbase入门
2、安装和目录机构介绍
3、Hbase Shell
4、Hbase架构详解
5、Hbase文件存储和读写
6、Hbase 表的设计和调优
7、通过API访问Hbase
8、集群管理
9、节点管理和备份与恢复
10、高级特性快照和集群复制

Scala编程详解

1、Scala编程基础语法
2、Scala编程条件控制与循环
3、Scala编程函数式编程
3、Scala编程详解:数组操作之Array、ArrayBuffer以及遍历数组
4、Scala编程数组操作之数组转换
5、Scala编程Map与Tuple
6、Scala编程面向对象编程
7、Scala编程函数式编程之集合操作
8、Scala编程模式匹配
9、Scala编程类型参数
10、Scala编程隐式转换与隐式参数
11、Scala编程Actor入门

Spark-分布式内存计算引擎

1、Spark 概述、生态系统、与MapReduce比较
2、Spark 编译、安装部署(Standalone Mode)及测试
3、Spark应用提交工具(spark-submit,spark-shell)
4、Scala基本知识讲解(变量,类,高阶函数)
5、Spark 核心RDD 特性、常见操作、缓存策略
6、RDD Dependency、Stage常、源码分析
7、Spark 核心组件概述
8、Spark 高阶应用
9、Spark on YARN运行原理、运行模式及测试
10、Spark HistoryServer历史应用监控
11、Spark Streaming流式计算 原理、DStream设计
12、Spark Streaming 常见input、out
13、Spark Streaming 与Kafka集成
14、结合Spark对用户浏览日志进行分析

Impala-分布式计算框架

1、什么是Impala
2、Impala的数据查询
3、Imala跟Hive对比
4、Impala性能优化

Solr-企业级搜索应用服务器

1、最基础的solr语法2、solr 环境搭建
3、Solr的二次开发
4、Solr在hadoop集群的使用
5、海量数据的索引和实时检索
6、项目实战:架构设计、索引设计、目录树实现、商品筛选实现

ELK大数据搜索及日志分析系统

1、认识ELK及Windows安装
2、安全性控制—Shield插件
3、NXLog及其与ELK配合
4、Linux系统搭建ELK服务
5、Elasticsearch详解
6、Logstash详解
7、Kibana详解

Storm-流式计算引擎

1、Storm简介和课程介绍
2、Storm原理和概念详解
3、Zookeeper集群搭建及基本使用、测试
4、Storm api 使用
5、Spout的Tail特性、storm-starter及maven使用、Grouping
6、实例讲解Grouping策略及并发
7、案例开发——计算网站PV通过2种方式实现汇总型计算"
8、案例优化引入Zookeeper锁控制线程操作
9、计算网站UV(去重计算模式)
10、Storm事务详解
11、DRPC精解和案例分析
12、Storm Trident 入门
13、Trident API和概念
14、Storm Trident实战之计算网站PV
15、ITridentSpout、FirstN(取Top N)实现、流合并和Join
16、Storm Trident之函数、流聚合及核心概念State
17、Storm Trident综合实战
18、Storm集群和作业监控告警开发
19、ITridentSpout、FirstN(取Top N)实现、流合并和Join
20、Storm Trident之函数、流聚合及核心概念State

大数据协作框架(Sqoop、Flume、Ozzie)

1、Sqoop功能、使用原则
2、将RDBMS数据导入Hive表中(全量、增量) 
3、将HDFS上文件导出到RDBMS表中
4、Flume 设计架构、原理(三大组件)
5、Flume初步使用,实时采集数据
6、如何使用Flume监控文件夹数据,实时采集录入HDFS中
7、任务调度框架Oozie 架构、原理
8、使用Oozie调度MapReduce Job和HiveQL
9、定时调度任务使用

Storm电商实时数据分析系统

1、课程中完整开发3个Storm项目,均为企业实际项目,其中一个是完全由Storm Trident开发。
2、从Kafka到Storm项目开发及HighCharts图表开发
3、搭建CDH5生态环境完整平台,且采用Cloudera Manager界面化管理CDH5平台
4、分享实际项目的架构设计、优劣分析和取舍、经验技巧,陡直提升学员的经验值

大数据高薪面试剖析

1、企业大数据项目的类型
2、技术架构(如何使用各框架处理数据)
3、冲刺高薪面试
4、面试简历编写(把握重点要点)
5、常见面试题讲解

6、针对普遍问题进行公共解答


大数据开发性能调优

1、深入Java性能调优
2、JAVA企业级开放必备高级技术(Weblogic Tomcat集群 Apach集群)
3、大数据高并发系统架构实战方案(LVS负载均衡、Nginx、共享存储、海量数据、队列缓存 )
4、大数据高并发服务器实战教程


Mahout-机器学习框架

1、数据降维—主成分分析和因子分析
2、数据挖掘常用方法及算法(回归分析、分类、聚类等)
3、数据挖掘分析工具
4、Mahout支持的算法、安装、配置及测试
5、Mahout K-means聚类分析、逻辑回归分类预测、朴素贝叶斯分类
6、推荐系统的概念及分类
7、协同过滤推荐算法概念、分类及应用
8、实战:实现基于Mahout的电影推荐系统
9、Hadoop综合实战-文本挖掘项目

Spark Mllib-机器学习框架

1、Spark MLlib基础入门
2、Spark MLlib矩阵向量
3、Spark MLlib线性回归算法
4、Spark MLlib逻辑回归算法
5、Spark MLlib贝叶斯分类算法
6、Spark MLlib决策树算法
7、Spark MLlib KMeans聚类算法
8、Spark MLlib FPGrowth关联规则算法
9、Spark MLlib协同过滤推荐算法
10、Spark MLlib神经网络算法

分布式网络爬虫

1、第一个爬虫
2、多线程、多进程的爬虫
3、分布式数据库 Mongo HBase 及 Redis 的使用
4、爬虫任务调度、分布式爬虫
5、PageRank、动态重排技术
6、更有效率的爬取:利用网站的分布式部署及应对反爬
7、表单登录、动态页面抓取
8、Scrapy
9、Scrapy进阶
10、网页排重
11、验证码识别与微博数据抓取
12、正文提取
13、文本分类
14、搜索引擎原理及应用

Python数据分析与数据挖掘

1、Python数据分析与挖掘技术基础
2、Python数据可视化分析实现
3、Python数据清洗、集成与变换
4、数据转换、属性构造、数据规约
5、文本挖掘
6、文本相似度分析
7、Python数据分析与挖掘实战 上
8、Python数据建模与分类实现 下
9、Python数据分析与挖掘聚类实现与回归分析
10、Python数据分析与挖掘实战
11、Python降维技术与大型数据分析与挖掘项目实训上
12、Python降维技术与大型数据分析与挖掘项目实训下

R语言数据分析与数据挖掘

1、R语言快速入门
2、R语言数据对象
3、数据读入
4、数据基本管理
5、描述性统计分析
6、R语言绘图基础之常用参数设置
7、R语言绘图基础之低级绘图函数
8、R语言绘图基础之高级绘图函数
9、R语言绘图高级篇之ggplot2包
10、R语言绘图高级篇之交互式绘图
11、玩转shiny--快速搭建数据挖掘平台
12、R语言之数据探索
13、R语言模型
14、数据挖掘可视化工具:Rattle

深度神经网络

1、机器学习基础
2、常用软件集合和环境配置
3、数据分组和关联分析算法
4、分类器
5、神经网络
6、稀疏自编码器
7、数据预处理
8、Softmax回归
9、深度网络简介
10、自编码算法(AE)
11、大型图片处理
12、编程实战

基于金融行业的大数据挖掘/分析实战

1、Python与金融应用概述
2、Python的基本数据类型与数据结构
3、Python数据可视化
4、金融时间序列分析
5、输入输出操作
6、提升Python效率
7、数学工具
8、随机分析随机分析
9、使用Python操作Excel
10、Python面向对象编程与图形用户界面

CDH认证

1、CCAH-Cloudera认证Hadoop管理员
2、CCDH-Cloudera认证Hadoop程序员
3、CCDA-Cloudera认证Hadoop数据分析师
4、CCDS-Cloudera认证Hadoop数据科学家
5、CCDE-Cloudera认证Hadoop数据工程师

HDP认证

1、HDPCD-HDP 认证的开发者
2、HDPCD-Spark-HDP 认证的 APACHE SPARK 开发者
3、HDPCD-Java-HDP 认证的 JAVA 开发者
4、HDPCA-HDP 认证的管理员



【2017】6138-1456号 Copyright © 1998 - 2017 Tencent. All Rights Reserved.版权所有:济南云启数据科技有限公司  技术支持:山东泉诺网络科技有限公司