自己动手写搜索引擎在线阅读
会员

自己动手写搜索引擎

罗刚编著
开会员,本书免费读 >

计算机网络编程语言与程序设计6.3万字

更新时间:2018-12-28 22:52:39 最新章节:参考资料

立即阅读
加书架
下载
听书

书籍简介

本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

最新上架

  • 会员
    《剑指JVM:虚拟机实践与性能调优》共分5篇:引言篇讲述了Java与Java虚拟机的关系,以及Java虚拟机的相关知识;第1篇讲述了运行时数据区,涉及Java内存区域的各个核心结构,以及对象创建的各种细节;第2篇讲述了垃圾收集,涉及各种收集算法、垃圾收集器;第3篇讲述了字节码与类的加载;第4篇讲述了性能监控与调优,带领读者学习Java虚拟机常用的监控与调优工具,并附有企业级的性能调优案例。
    尚硅谷教育计算机23万字
  • 会员
    本书是魏永明近30年来开发和维护MiniGUI、HVML等开源项目的经验总结,旨在帮助有一定C程序编写经验的软件工程师在短时间内有效提高设计能力和编码水平。全书分为?3?篇。基础篇从可读性和可维护性出发,阐述了如何提高代码的可读性、用好写好头文件、正确理解编译警告并消除潜在问题、定义和使用常量等,介绍了如何有效利用构建系统生成器(CMake)来维护项目;模式篇阐述了常见的C程序接口设计模式,说明了
    魏永明计算机19.6万字
  • 会员
    本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的编程基础和实际应用。本书共17章,可分为4部分。第一部分Python编程环境搭建和Python的基础知识(第1~6章)、第二部分数学运算(第7~9章)、第三部分绘制图像(第10~12章)、第四部分办公自动化(第13~17章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。
    邢世通编著计算机15.9万字
  • 会员
    本书跟随了Node.js的标准与行业的发展趋势,在介绍新标准与新技术的同时兼顾了理论基础和实际应用,主要内容分为基础和应用两部分,基础部分内容包含了Node.js环境配置,npm项目管理,JavaScript语法基础,Node.js基本模块的原理与使用,异步代码的编写与组织,应用部分包含了网络编程,桌面应用开发以及测试和调试。本书讲解与示例并重,由浅入深地剖析了Node.js模块与语言原理,并通过
    李锴编著计算机10.9万字
  • 会员
    本书是一本难度适当、易学易懂的小学生Python启蒙教材,用贴近孩子的语言,通过多个简单、有趣的编程案例,激发孩子学习和探索科技的兴趣。本书以程序为中心,适当弱化语法。本书共11章,涵盖Python输入输出、数据类型、选择循环基本结构、函数、面向对象编程、海龟绘图、二进制和GUI编程等,内容丰富全面,每章末尾配有单词表和思考题,帮助读者巩固所学知识和技能。本书适合任何想要通过Python学习编程的
    曹阳波 李文月编著计算机4.2万字
  • 会员
    本书讲述了如何从Java过渡到Kotlin,主要关注代码,每章都阐述了从Java过渡到Kotlin的一个方面,考察了典型Java项目在这个过程中可以改进的方面。比如,从Optional到nullable,从Bean到值,从开放类到密封类。每章首先解释关键概念,然后展示如何在保持互操作性的前提下,逐步且安全地将生产型Java代码重构为惯用的Kotlin代码,由此产生的代码更简单、更有表现力,也更容易
    (英)邓肯·麦格雷戈 (英)纳特·普莱斯计算机14.5万字
  • 会员
    《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java
    张文亮编著计算机5.2万字
  • 会员
    《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理
    马国俊计算机9.2万字
  • 会员
    本书为适应新工科复合型人才对计算思维和问题求解能力的要求而编写。全书共12章,主要内容包括:计算思维与问题求解,数据类型、运算符和表达式,简单的C程序设计,选择结构程序设计,循环结构程序设计,函数,数组,常用算法,指针,结构体,文件系统和人工智能经典算法。本教材兼顾计算思维与程序设计基础知识,注重问题抽象,通过问题案例分析,逐步给出问题求解算法与程序实现,引导读者的算法思维和程序设计思维。通过“常
    刘杰 鞠成东 郭江鸿主编计算机13.2万字

同类书籍最近更新

  • 会员
    本书适合学习Python3的入门读者,也适用对编程一无所知,但渴望用编程改变世界的朋友们!本书提倡理解为主,应用为王。因此,只要有可能,小甲鱼(作者)都会通过生动的实例来让大家理解概念。虽然这是一本入门书籍,但本书的“野心”可并不止于“初级水平”的教学。本书前半部分是基础的语法特性讲解,后半部分围绕着Python3在爬虫、Tkinter和游戏开发等实例上的应用。编程知识深似海,小甲鱼没办法仅通过一
    小甲鱼编著程序设计11.3万字
  • 会员
    DOS时代用汇编语言,Windows时代倡导Windows编程,Internet时代是HTML的天下,进入大数据时代,R语言必须掌握!本书作者作为一名历经四个时代的老程序员,深知学习编程的痛苦与欢乐,结合多年的开发经验完成此书。本书将从无到有地教读者R语言的使用,同时学习本书并不需要统计学基础,在学习编程的过程中,就掌握了一些必要的统计知识。本书完整讲解了几乎所有R
    洪锦魁程序设计12.6万字
  • 会员
    本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、唯一约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,
    程朝斌程序设计18.9万字
  • 会员
    本书系统论述了Cocos2dxLuaAPI游戏编程和开发技术,内容涵盖Cocos2dx中的核心类、瓦片地图、物理引擎和AudioEngine音频引擎等知识。全书分为16章:准备开始、Lua语言基础、Cocos2dxLuaAPI开发环境搭建、Cocos2dx引擎与Lua绑定、游戏中的文字、菜单、精灵、场景与层、动作和动画、用户事件、AudioEngine音频引擎、粒子系统、瓦片地图、
    赵志荣程序设计8.6万字
  • 会员
    精通VisualStudio2015VisualStudio2015包含大量有助于提高编程效率的新功能以及专用于跨平台开发的新工具。综合性指南VisualStudio2015高级编程(第6版)遵循“由程序员为程序员而著”的理念,涵盖所有增强的开发工具,帮你快速掌握VisualStudio的新变化。本书独特的以IDE为中心的方法揭示VisualStudio的诸多秘密,是开发新手和
    (美)Bruce Johnson程序设计47.4万字
  • 会员
    Android系统是目前最为流行的智能手机操作系统。为了帮助开发人员快速掌握Android开发技术,获取更好的就业机会,作者基于AndroidSDK5.1(APILevel22)编写了本书。本书分为14章,主要包括Android5系统发展历史、系统架构、应用程序框架、界面开发、电话短信应用、多媒体开发、数据存储、网络编程、位置服务、绘图与计算、国际化、企业应用以及应用程序发布等
    李波程序设计15.4万字