Spark 3.x大数据分析实战(视频教学版)在线阅读
会员

Spark 3.x大数据分析实战(视频教学版)

张伟洋
开会员,本书免费读 >

计算机网络数据库11.4万字

更新时间:2023-07-17 19:33:04 最新章节:9.6 动手练习

立即阅读
加书架
下载
听书

书籍简介

本书基于Spark3.2.x版本,从Spark核心编程语言Scala讲起,涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章,第1章讲解了Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行;第3~9章讲解了离线计算框架SparkRDD、SparkSQL和实时计算框架Kafka、SparkStreaming、StructuredStreaming以及图计算框架GraphX等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。本书通俗易懂,案例丰富,注重实操,适合Spark新手和大数据开发人员阅读,也可作为培训机构和高校大数据及相关专业的教学用书。
品牌:清华大学
上架时间:2022-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

张伟洋
主页

最新上架

  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢
    明日科技编著计算机14万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。
    刘林 李朝成 饼干哥哥计算机16.8万字

同类书籍最近更新

  • 会员
    本书从零基础讲解起步,用实例引导读者深入学习,采取“数据库基础→数据库的基本操作→SQL查询语句→数据库高级管理→项目开发与案例设计”的讲解模式,深入浅出地讲解MySQL的各项技术及实战技能。本书共分5篇,第1篇主要讲解MySQL的基础知识,MySQL的安装与环境配置等;第2篇主要讲解操作数据库,创建、修改和删除数据表,数据类型和运算符,索引的操作,视图的操作等;第3篇主要讲解插入、更新与删除数据
    刘玉红 郭广新编著数据库22.2万字
  • 会员
    本书将作者10余年从事SQLServer数据库管理和开发经验积累的Transact-SQL综合性实例整理归类并进行剖析。可以帮助读者快速借鉴和开发出适合自己的Transact-SQL实例,这些实例既可以用于数据库管理,也可以用于数据库系统开发。同时,由于Transact-SQL语言良好的传承和继承性,因此,本书的绝大部分代码可以跨越SQLServer版本的限制,在SQLServer2008
    赵松涛等编著数据库14.7万字
  • 会员
    本书是一本面向流域现代管理的新技术应用著作,内容广泛而新颖,反映了数字流域最新的发展理论与技术。本书分为9章和附录,系统论述了数字流域的基本概念、发展状况、框架和业务应用系统,以及数字流域所涉及的关键技术、流域模拟模型和常用专业软件,并对部分成功的案例进行了剖析。
    李纪人 潘世兵 张建立 丁志雄 魏加华等编著数据库22.3万字
  • 会员
    本书是一本系统讲述云计算技术的专业书籍。介绍了云计算的概念、发展现状、与网格计算的关系,系统阐述了GoogleGFS/MapReduce/Bigtable实现原理、GoogleAppEngine编程、Hadoop原理与安装使用、亚马逊AWS和微软WindowsAzure的编程使用等,介绍了一些云计算理论研究热点,并对云计算的未来进行了展望。读者可与配套网站中国云计算(http
    刘鹏主编数据库19.4万字
  • 会员
    本书以在数据中心采用服务器虚拟化技术构建云计算平台为主题,讨论了:1)数据中心的基本概念,构建、管理、维护数据中心的最佳实践方法,以及未来数据中心的需求和挑战;2)虚拟化技术的基本概念,常见的虚拟化技术,采用虚拟器件创建、部署、激活虚拟化解决方案的方法,以及业界几家重要的虚拟化厂商的产品及特性;3)云计算的基本概念,云计算的优势和它为信息产业带来的变革,云架构以及架构中各个层次的核心功能与示例,云
    《虚拟化与云计算》小组数据库18万字
  • 会员
    本书从数据挖掘基础、数据挖掘经典算法、数据挖掘业务建模与模型评价、SPSSClementine数据挖掘实务这4方面对数据挖掘技术进行了全面介绍。本书共24章,分为4部分。第1部分介绍数据挖掘的基本概念及数据挖掘应用的基本原理。第2部分介绍了回归分析、贝叶斯网络、聚类分析、决策树算法、关联规则、粗糙集、神经网络模型、遗传算法等。第3部分是数据挖掘建模和模型模型评价的基础知识。第4部分包括SPSS
    元昌安主编数据库45.2万字