
会员
循序渐进学Spark
更新时间:2019-01-04 20:18:55 最新章节:8.7 本章小结
书籍简介
本书以小象学院git项目方式管理。感谢姜冰钰、陈超、冼茂源等每一位内容贡献者,感谢他们花费大量时间,将自己对Spark的理解加上在实际工作、学习过程中的体会,融汇成丰富的内容。与企业不断涌现的对大数据技术的需求相比,大数据人才还存在很大缺口,对大数据技术充满期许的新人正在源源不断地加入这个领域。在小象学院的教学实践过程中,我们发现,一本能完整系统地介绍Spark各模块原理并兼顾使用实战的书,对于初入大数据领域的技术人员至关重要。于是,我们根据日常积累的经验,著成本书。
品牌:机械工业出版社
上架时间:2017-04-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
小象学院 杨磊
同类热门书
最新上架
- 会员高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字
- 会员本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例计算机10.4万字
- 会员本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字
- 会员本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,计算机12万字
- 会员《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字
- 会员本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现计算机7.1万字
- 会员《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中计算机14.1万字
- 会员这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字
同类书籍最近更新
- 会员本书揭示了云计算环境下的信息资源的形成与演化规律,设计云计算环境下的信息资源集成和服务的顶层框架,提出对应的集成方法和服务模式,突破其中的若干关键技术,并通过验证性应用本课题研究成果的推广应用提供最佳实践。数据库23.1万字
- 会员本书从零基础讲解起步,用实例引导读者深入学习,采取“数据库基础→数据库的基本操作→SQL查询语句→数据库高级管理→项目开发与案例设计”的讲解模式,深入浅出地讲解MySQL的各项技术及实战技能。本书共分5篇,第1篇主要讲解MySQL的基础知识,MySQL的安装与环境配置等;第2篇主要讲解操作数据库,创建、修改和删除数据表,数据类型和运算符,索引的操作,视图的操作等;第3篇主要讲解插入、更新与删除数据数据库22.2万字
- 会员本书将作者10余年从事SQLServer数据库管理和开发经验积累的Transact-SQL综合性实例整理归类并进行剖析。可以帮助读者快速借鉴和开发出适合自己的Transact-SQL实例,这些实例既可以用于数据库管理,也可以用于数据库系统开发。同时,由于Transact-SQL语言良好的传承和继承性,因此,本书的绝大部分代码可以跨越SQLServer版本的限制,在SQLServer2008数据库14.7万字