网络 共有3条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转:
出版社:"电子工业出版社" 作者:"罗刚"
  • 正在加载图片,请稍后......

    网络爬虫全解析: 技术、原理与实践:罗刚

    作者:罗刚 出版社:电子工业出版社 出版时间:20170101 ISBN:978-7-121-31071-3
    索书号:TP311.561/50 分类号:TP311.561 页数:429页 价格:CNY79.00
    复本数: 在馆数:
    累借天数: 累借次数:
    本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。*后,以实战为例,介绍了如何抓取微信和微博,以及在电商、医药、金融等领域的案例应用。其中,电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。
    详细信息
    索书号 展开
  • 正在加载图片,请稍后......

    解密搜索引擎技术实战: Lucene Java精华版:罗刚

    作者:罗刚 出版社:电子工业出版社 出版时间:20140101 ISBN:978-7-121-21732-6
    索书号:G354.4/29D\2 分类号:G354.4 页数:501页 价格:CNY79.00
    复本数: 在馆数:
    累借天数: 累借次数:
    《解密搜索引擎技术实战:LuceneJava精华版(第2版)》主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍
    详细信息
    索书号 展开
  • 正在加载图片,请稍后......

    解密搜索引擎技术实战: Lucene Java精华版:罗刚

    作者:罗刚 出版社:电子工业出版社 出版时间:20110101 ISBN:978-7-121-13393-0
    索书号:G354.4/29D 分类号:G354.4 页数:14, 544页 价格:CNY69.80
    复本数: 在馆数:
    累借天数: 累借次数:
    本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。
    详细信息
    索书号 展开
缩小检索范围
网络 共有3条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转: