返回检索首页
我的图书馆登录
书 名
作 者
分类号
ISBN
索书号
主题词
出版社
任意词
每页显示
10
20
50
排序选项
排序方式
出版日期
索书号
出版社
排序方式
降序排列
升序排列
网络
共有
3
条记录
共耗时[0.000]秒
页码:
1
/
1
每页显示:
10
记录
跳转:
出版社:"电子工业出版社"
作者:"罗刚"
网络爬虫全解析: 技术、原理与实践
:罗刚
作者:
罗刚
出版社:
电子工业出版社
出版时间:
20170101
ISBN:
978-7-121-31071-3
索书号:
TP311.561/50
分类号:
TP311.561
页数:
429页
价格:
CNY79.00
复本数:
在馆数:
累借天数:
累借次数:
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。*后,以实战为例,介绍了如何抓取微信和微博,以及在电商、医药、金融等领域的案例应用。其中,电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。
详细信息
索书号
展开
解密搜索引擎技术实战: Lucene Java精华版
:罗刚
作者:
罗刚
出版社:
电子工业出版社
出版时间:
20140101
ISBN:
978-7-121-21732-6
索书号:
G354.4/29D\2
分类号:
G354.4
页数:
501页
价格:
CNY79.00
复本数:
在馆数:
累借天数:
累借次数:
《解密搜索引擎技术实战:LuceneJava精华版(第2版)》主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍
详细信息
索书号
展开
解密搜索引擎技术实战: Lucene Java精华版
:罗刚
作者:
罗刚
出版社:
电子工业出版社
出版时间:
20110101
ISBN:
978-7-121-13393-0
索书号:
G354.4/29D
分类号:
G354.4
页数:
14, 544页
价格:
CNY69.80
复本数:
在馆数:
累借天数:
累借次数:
本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。
详细信息
索书号
展开
缩小检索范围
文献类型
中文图书
(
3
)
出版社
电子工业出版社
(
3
)
只显示前10条......
电子工业出版社
(
3
)
查看更多信息......
作者
罗刚
(
3
)
只显示前10条......
罗刚
(
3
)
查看更多信息......
出版年
20110101
(
1
)
20140101
(
1
)
20170101
(
1
)
只显示前10条......
20110101
(
1
)
20140101
(
1
)
20170101
(
1
)
查看更多信息......
网络
共有
3
条记录
共耗时[0.000]秒
页码:
1
/
1
每页显示:
10
记录
跳转: