网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

最新上架

  • 会员
    本书是魏永明近30年来开发和维护MiniGUI、HVML等开源项目的经验总结,旨在帮助有一定C程序编写经验的软件工程师在短时间内有效提高设计能力和编码水平。全书分为?3?篇。基础篇从可读性和可维护性出发,阐述了如何提高代码的可读性、用好写好头文件、正确理解编译警告并消除潜在问题、定义和使用常量等,介绍了如何有效利用构建系统生成器(CMake)来维护项目;模式篇阐述了常见的C程序接口设计模式,说明了
    魏永明计算机19.6万字
  • 会员
    本书重点关注和介绍SpringBoot2框架的技术应用。SpringBoot是目前微服务架构使用最为广泛的框架之一,一旦开发人员掌握了该框架的配置和使用技巧,则对于当前微服务应用的开发将得心应手。本书详细介绍了SpingBoot2的开发环境、开发方式、数据库应用、MVC、RESTful、安全及测试等。对于刚开始接触微服务架构、SpringBoot的开发人员来说,这是一本很适合的书籍。本
    李世川编著计算机8.6万字
  • 会员
    本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习
    周化祥 许金元主编计算机8.8万字
  • 会员
    《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理
    马国俊计算机9.2万字
  • 会员
    本书是布鲁斯·埃克尔时隔15年,继ThinkinginJava之后又一力作,基于Java的3个长期支持版(Java8、11、17),讲解Java核心语法,并对Java的核心变化进行详述。全书内容通俗易懂,配合示例讲解逐步深入,并结合实际开发需要,从语言底层设计出发,有效帮读者规避一些常见的开发陷阱。主体部分共22章,内容包含对象、操作符、控制流、初始化和清理、复用、多态、接口、内部类、集合、函
    (美)布鲁斯·埃克尔计算机29.4万字
  • 会员
    在智能手机快速发展的背景下,越来越多的人开始喜爱使用各种App。《AppUI设计案例实操》主要介绍了手机AppUI(用户界面)设计思路和制作过程。《AppUI设计案例实操》适合想要快速掌握UI设计制作方法的人员,也适合广大平面设计爱好者和相关行业从业人员,同时,也可作为高等院校的教学辅导用书。
    刘恩鹏主编计算机6.5万字
  • 会员
    《企业微信开发详解》从零基础开始,详细地讲解了企业微信开发相关的知识点。本书重点介绍了企业微信的三大核心开发方式——回调开发方式、主动开发方式和网页开发方式,每种开发方式都从基础知识、架构设计建议、开发案例3个方面进行讲解。同时,针对企业微信开发的重要技术接口,给出了示例程序和执行结果,以方便读者清晰、明了地学习。读者可以按各技术点的讲解顺序学习,也可以根据个人需要有针对性地学习。
    翟东平计算机3.8万字
  • 会员
    《Go语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了Go语言的基础、进阶提高和高级应用知识。全书分为4篇,共19章,包括初识Go语言、Go语言基础、Go语言基本数据类型与运算符、流程控制、复合数据类型、函数、指针、结构体、接口、错误处理、并发编程、包管理、标准库、编译与测试工具、反射、MySQL数据库编程、文件处理、网络编程和Go语言在爬虫中的应用等内容。所有知
    明日科技编著计算机9.9万字
  • 会员
    本书围绕真实业务场景,系统完整地介绍了微服务中台架构在企业成功落地的全过程。它从企业遇到的IT架构痛点出发,覆盖了IT架构模式选型、技术方案设计、团队管理和项目实施过程中的每一步,并且介绍了如何基于阿里云PaaS平台,构建低风险、高可用、易扩展、好维护的业务中台。本书可以帮助对企业IT架构感兴趣的中高级软件工程师、架构师、产品经理、项目经理,深刻认识和理解业务中台,从而结合企业实际,快速搭建适合自
    任波计算机11.9万字

同类书籍最近更新

  • 会员
    1.Python零基础,轻松学会数据分析与挖掘2.编码、分析、挖掘,数据分析全流程一次搞定3.微课视频,扫码即可观看,重点难点逐个击破本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。
    董付国程序设计11.8万字
  • 会员
    本书共有14章,内容包括:初识Go语言、Go语言的基本语法、Go语言的流程控制、函数与指针、Go语言的内置容器、Go语言的常用内置包、Go语言面向对象编程、Go语言异常处理、Go语言文件IO操作、Go语言网络编程、Go语言数据库编程、Go语言并发编程、Go语言密码学算法、Beego框架项目实战。
    千锋教育高教产品研发部程序设计8.3万字
  • 会员
    在IT产业链中开源的理念已成为绝大多数企业的共识。随着开源技术的不断进步与创新,云计算也逐步深入到了每个互联网企业的内部。但是,随之而来的便是管理成本的提高,大量的物理或者虚拟主机需要管理与维护,如何能够更好地实现自动化运维,成为企业需要迫切解决的问题。行业中自动化运维的软件很多,Puppet、Saltstack、Ansible等让我们在云时代依然可以轻松管理和维护设备与业务,然而像Ansible
    丁明一程序设计12.2万字
  • 会员
    这是一本故事书,也是一本编程书。小男孩派森无意中闯入神秘国度—Python王国,恰好遇到了国王的鹦鹉,于是他们开始了奇幻的冒险之旅。在这个过程中,他们曾落入“大耳朵”部落、怪兽餐厅、要“名片”的迷宫,也造访过“呆头”小镇、巫师的小屋、国王的跑马场;他们打败过7眼3嘴的拦路怪兽、两个脑袋的守护者,也结识了“哲学家”、王国里“最顽固”的人、王宫的“守门人”等形形色色的角色;他们学习过古老咒语,指
    一石匠人程序设计9.1万字
  • 会员
    《从零开始学Python大数据与量化交易》首先讲解量化交易的基础知识,如量化交易的优势、应用、注意事项、历史、量化交易平台等;然后讲解量化交易开发语言Python,即讲解Python语言的开发环境、基本语法及流程控制、特征数据类型、内置函数与自定义用户函数、面向对象编程;接着讲解大数据分析和可视化的3个包,分别是Numpy包、Pandas包、Matplotlib包;然后讲解量化交易策略
    周峰 王可群程序设计10.5万字
  • 会员
    这是一本编程的入门书籍,9-14岁读者可以轻松地实现编程能力从零到一的突破:从不会编程,不了解编程,到能够真正用编码进行编程。同时,它还是一本故事书,读者将沉浸到书籍中描述的世界,跟随主人公栀子猫向人工智能的老师认真学习编程,使用程序语言这门技巧,了解什么是编程概念和功用,并明白这个技能在社会中能够发挥怎样的贡献,希望能够完成振兴自己国家的使命。该书还配有编程教学的工程图、故事场景的像素图与章节思
    周鲁程序设计12.4万字