新手入门大数据 Hadoop基础与电商行为日志分析【已完结 MK301】(不限速下载)
新手入门大数据 Hadoop基础与电商行为日志分析课程目录:
第1章 大数据概述
1-1 课程导学 .mp4
1-3 课程目录 .mp4
1-4 从一个案例说起 .mp4
1-5 什么是大数据以及大数据的4V特征 .mp4
1-6 大数据带来的技术变革 .mp4
1-7 大数据现存的模式 .mp4
1-8 大数据的技术概念 .mp4
1-9 大数据带来的挑战 .mp4
1-10 如何对大数据进行存储和分析 .mp4
1-11 大数据典型应用 .mp4
第2章 初识Hadoop
2-1 课程目录 .mp4
2-2 Hadoop概述 .mp4
2-3 Hadoop核心组件之HDFS概述 .mp4
2-4 Hadoop核心组件之MapReduce .mp4
2-5 Hadoop核心组件之YARN .mp4
2-6 Hadoop优势 .mp4
2-7 Hadoop发展史 .mp4
2-8 Hadoop生态圈 .mp4
2-9 Hadoop发行版选型 .mp4
2-10 OOTB环境的使用 .mp4
第3章 分布式文件系统HDFS
3-1 HDFS概述 .mp4
3-2 HDFS设计目标 .mp4
3-3 HDFS架构详解 .mp4
3-4 文件系统NameSpace详解 .mp4
3-5 HDFS副本机制 .mp4
3-6 本课程使用的Linux环境介绍 .mp4
3-7 Hadoop部署前置介绍 .mp4
3-8 JDK1.8部署详解 .mp4
3-9 ssh无密码登陆部署详解 .mp4
3-10 Hadoop安装目录详解及hadoop-env配置 .mp4
3-11 HDFS格式化以及启动详解 .mp4
3-12 HDFS常见文件之防火墙干扰 .mp4
3-13 Hadoop停止集群以及如何单个进程启动 .mp4
3-14 Hadoop命令行操作详解 .mp4
3-15 深度剖析Hadoop文件的存储机制 .mp4
3-16 HDFS API编程之开发环境搭建 .mp4
3-17 HDFS API编程之第一个应用程序的开发 .mp4
3-18 HDFS API编程之jUnit封装 .mp4
3-19 HDFS API编程之查看HDFS文件内容 .mp4
3-20 HDFS API编程之创建文件并写入内容 .mp4
3-21 HDFS API编程之副本系数深度剖析 .mp4
3-22 HDFS API编程之重命名 .mp4
3-23 HDFS API编程之copyFromLocalFile .mp4
3-24 HDFS API编程之带进度的上传大文件 .mp4
3-25 HDFS API编程之下载文件 .mp4
3-26 HDFS API编程之列出文件夹下的所有内容 .mp4
3-27 HDFS API编程之递归列出文件夹下的所有文件 .mp4
3-28 HDFS API编程之查看文件块信息 .mp4
3-29 HDFS API编程之删除文件 .mp4
3-30 HDFS项目实战之需求分析 .mp4
3-31 HDFS项目实战之代码框架编写 .mp4
3-32 HDFS项目实战之自定义上下文 .mp4
3-33 HDFS项目实战之自定义处理类实现 .mp4
3-34 HDFS项目实战之功能实现 .mp4
3-35 HDFS项目实战之使用自定义配置文件重构代码 .mp4
3-36 HDFS项目实战之使用反射创建自定义Mapper对象 .mp4
3-37 HDFS项目实战之可插拔的业务逻辑处理 .mp4
3-38 HDFS Replica Placement Policy .mp4
3-39 HDFS写数据流程图解 .mp4
3-40 HDFS读数据流程图解 .mp4
3-41 HDFS Checkpoint详解 .mp4
3-42 HDFS SaveMode .mp4
第4章 分布式计算框架MapReduce
4-1 课程目录 .mp4
4-2 MapReduce概述 .mp4
4-3 MapReduce编程模型详解 .mp4
4-4 MapReduce编程模型核心概念详解 .mp4
4-5 词频统计之自定义Mapper实现 .mp4
4-6 词频统计之自定义Reducer实现 .mp4
4-7 词频统计之自定义Driver类实现 .mp4
4-8 词频统计之本地方式运行 .mp4
4-9 词频统计之通过Debug方式进一步了解偏移量以及重构代码 .mp4
4-10 词频统计升级之Combiner操作 .mp4
4-11 流量统计实战之需求 .mp4
4-12 流量统计实战之自定义复杂数据类型 .mp4
4-13 流量统计实战之自定义Mapper类 .mp4
4-14 流量统计实战之自定义Reducer实现 .mp4
4-15 流量统计实战之Driver开发 .mp4
4-16 流量统计实战之代码重构及NullWritable的使用 .mp4
4-17 流量统计实战升级之自定义Partitioner .mp4
第5章 资源调度框架YARN
5-1 课程目录 .mp4
5-2 YARN产生背景 .mp4
5-3 YARN概述 .mp4
5-4 YARN架构详解 .mp4
5-5 YARN执行流程 .mp4
5-6 YARN环境部署 .mp4
5-7 提交example案例到YARN上运行 .mp4
5-8 提交流量统计案例到YARN上运行 .mp4
第6章 电商项目实战Hadoop实现
6-1 课程目录 .mp4
6-2 用户行为日志概述 .mp4
6-3 为什么要记录用户行为日志 .mp4
6-4 日志内容介绍 .mp4
6-5 用户行为日志分析的意义所在 .mp4
6-6 电商常用术语 .mp4
6-7 项目需求描述 .mp4
6-8 数据处理流程及技术架构 .mp4
6-9 浏览量统计功能实现 .mp4
6-10 省份浏览量统计之IP库解析 .mp4
6-11 省份浏览量统计之日志解析 .mp4
6-12 省份浏览量统计之功能实现 .mp4
6-13 页面浏览量统计之页面编号获取 .mp4
6-14 页面浏览量统计之功能实现 .mp4
6-15 数据处理过程中ETL的重要性 .mp4
6-16 原始日志ETL操作 .mp4
6-17 浏览量统计功能升级 .mp4
6-18 省份浏览量统计功能升级 .mp4
6-19 页面浏览量统计功能升级思路 .mp4
6-20 打包到服务器上运行 .mp4
6-21 项目扩展 .mp4
第7章 数据仓库Hive
7-1 课程目录 .mp4
7-2 Hive产生背景 .mp4
7-3 Hive是什么 .mp4
7-4 为什么要使用Hive .mp4
7-5 Hive在Hadoop生态圈中的位置 .mp4
7-6 Hive体系架构 .mp4
7-7 Hive部署架构 .mp4
7-8 Hive与RDBMS的区别 .mp4
7-9 Hive部署 .mp4
7-10 Hive快速入门 .mp4
7-11 Hive DDL之数据库操作 .mp4
7-12 Hive DDL之表操作 .mp4
7-13 Hive DML之加载和导出数据 .mp4
7-14 Hive QL基本统计 .mp4
7-15 Hive QL之聚合函数 .mp4
7-16 Hive QL之分组函数 .mp4
7-17 Hive QL之join的使用 .mp4
7-18 Hive QL执行计划 .mp4
第8章 电商项目实战Hive实现
8-1 课程目录 .mp4
8-2 外部表在Hive中的使用 .mp4
8-3 track_info分区表的创建 .mp4
8-4 将ETL的数据加载到Hive表 .mp4
8-5 使用Hive完成统计分析功能 .mp4
8-6 Hive实现项目的方便性体现 .mp4
第9章 Hadoop分布式集群搭建
9-1 课程目录 .mp4
9-2 Hadoop集群规划 .mp4
9-3 前置条件安装 .mp4
9-4 JDK安装 .mp4
9-5 Hadoop集群部署 .mp4
9-6 提交作业到Hadoop集群上运行 .mp4
9-7 课程总结 .mp4