
会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结
书籍简介
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
最新上架
- 会员本书重点关注和介绍SpringBoot2框架的技术应用。SpringBoot是目前微服务架构使用最为广泛的框架之一,一旦开发人员掌握了该框架的配置和使用技巧,则对于当前微服务应用的开发将得心应手。本书详细介绍了SpingBoot2的开发环境、开发方式、数据库应用、MVC、RESTful、安全及测试等。对于刚开始接触微服务架构、SpringBoot的开发人员来说,这是一本很适合的书籍。本计算机8.6万字
- 会员本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习计算机8.8万字
- 会员《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理计算机9.2万字
- 会员本书是布鲁斯·埃克尔时隔15年,继ThinkinginJava之后又一力作,基于Java的3个长期支持版(Java8、11、17),讲解Java核心语法,并对Java的核心变化进行详述。全书内容通俗易懂,配合示例讲解逐步深入,并结合实际开发需要,从语言底层设计出发,有效帮读者规避一些常见的开发陷阱。主体部分共22章,内容包含对象、操作符、控制流、初始化和清理、复用、多态、接口、内部类、集合、函计算机29.4万字
- 会员在智能手机快速发展的背景下,越来越多的人开始喜爱使用各种App。《AppUI设计案例实操》主要介绍了手机AppUI(用户界面)设计思路和制作过程。《AppUI设计案例实操》适合想要快速掌握UI设计制作方法的人员,也适合广大平面设计爱好者和相关行业从业人员,同时,也可作为高等院校的教学辅导用书。计算机6.5万字
- 会员《Go语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了Go语言的基础、进阶提高和高级应用知识。全书分为4篇,共19章,包括初识Go语言、Go语言基础、Go语言基本数据类型与运算符、流程控制、复合数据类型、函数、指针、结构体、接口、错误处理、并发编程、包管理、标准库、编译与测试工具、反射、MySQL数据库编程、文件处理、网络编程和Go语言在爬虫中的应用等内容。所有知计算机9.9万字
同类书籍最近更新
- 会员1.Python零基础,轻松学会数据分析与挖掘2.编码、分析、挖掘,数据分析全流程一次搞定3.微课视频,扫码即可观看,重点难点逐个击破本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。程序设计11.8万字
- 会员本书共有14章,内容包括:初识Go语言、Go语言的基本语法、Go语言的流程控制、函数与指针、Go语言的内置容器、Go语言的常用内置包、Go语言面向对象编程、Go语言异常处理、Go语言文件IO操作、Go语言网络编程、Go语言数据库编程、Go语言并发编程、Go语言密码学算法、Beego框架项目实战。程序设计8.3万字
- 会员在IT产业链中开源的理念已成为绝大多数企业的共识。随着开源技术的不断进步与创新,云计算也逐步深入到了每个互联网企业的内部。但是,随之而来的便是管理成本的提高,大量的物理或者虚拟主机需要管理与维护,如何能够更好地实现自动化运维,成为企业需要迫切解决的问题。行业中自动化运维的软件很多,Puppet、Saltstack、Ansible等让我们在云时代依然可以轻松管理和维护设备与业务,然而像Ansible程序设计12.2万字
- 会员这是一本故事书,也是一本编程书。小男孩派森无意中闯入神秘国度—Python王国,恰好遇到了国王的鹦鹉,于是他们开始了奇幻的冒险之旅。在这个过程中,他们曾落入“大耳朵”部落、怪兽餐厅、要“名片”的迷宫,也造访过“呆头”小镇、巫师的小屋、国王的跑马场;他们打败过7眼3嘴的拦路怪兽、两个脑袋的守护者,也结识了“哲学家”、王国里“最顽固”的人、王宫的“守门人”等形形色色的角色;他们学习过古老咒语,指程序设计9.1万字
- 会员《从零开始学Python大数据与量化交易》首先讲解量化交易的基础知识,如量化交易的优势、应用、注意事项、历史、量化交易平台等;然后讲解量化交易开发语言Python,即讲解Python语言的开发环境、基本语法及流程控制、特征数据类型、内置函数与自定义用户函数、面向对象编程;接着讲解大数据分析和可视化的3个包,分别是Numpy包、Pandas包、Matplotlib包;然后讲解量化交易策略程序设计10.5万字
- 会员这是一本编程的入门书籍,9-14岁读者可以轻松地实现编程能力从零到一的突破:从不会编程,不了解编程,到能够真正用编码进行编程。同时,它还是一本故事书,读者将沉浸到书籍中描述的世界,跟随主人公栀子猫向人工智能的老师认真学习编程,使用程序语言这门技巧,了解什么是编程概念和功用,并明白这个技能在社会中能够发挥怎样的贡献,希望能够完成振兴自己国家的使命。该书还配有编程教学的工程图、故事场景的像素图与章节思程序设计12.4万字