
会员
精通Spark数据科学
更新时间:2021-01-15 16:45:59 最新章节:14.6 小结
书籍简介
ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读,需要读者具备数据科学相关的基础知识,并通过阅读本书进一步提升Spark运用能力,从而创建出高效且实用的数据科学解决方案。
品牌:人邮图书
译者:柯晟劼 刘少俊
上架时间:2020-09-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字
同类书籍最近更新
- 会员本书从科学实验与工程实际出发,系统地讲述了虚拟仪器软件LabVIEW和LabWindows/CVI在测控系统设计方面的应用技术。首先介绍了虚拟仪器的基本知识和常用的开发平台,然后通过基于串口通信的测控系统、基于数据采集卡的测控系统、基于声卡和网络的测控系统等十余个典型应用实例,详细地讲解了利用虚拟仪器软件设计数据采集与串口通信程序的方法。每个实例的设计任务均采用LabVIEW和LabWindows自动化18.8万字
- 会员本书基于PhotoshopCS3环境进行编写,内容坚持图文并茂、繁简得当、深入浅出的原则,以企业真实案例为原型,基于工作过程导向的理念进行开发和序化。全书共有五个项目,即“食益堂健康连锁机构”海报制作、“无限挑战”电视节目宣传单制作、“凯黎世”全棉内衣广告制作、“思丞科技”画册制作和“转动的地球”动画制作。每个项目设置若干任务,将Photoshop的基本理论和操作知识融入到各个任务中,使读者在完自动化7.3万字
- 会员本书是一本关于如何使用Photoshop进行设计的优秀图书。由浅入深,由表及里,以软件自身体系为线索,将工作中的设计作为案例,循序渐进地讲解PhotoShop的使用方法和技巧,内容涉及广泛,能使读者做到活学活用,举一反三。全书分为9章,主要内容包括:初识PhotoshopCS3、工具的应用、路径与形状、色彩的调整、图层的应用、通道与蒙版、滤镜的应用、网页设计、综合案例实战。以“知识点+案例”的设自动化6.9万字