墨香园 -网络舆情分析技术
本书资料更新时间:2025-01-19 00:53:35

网络舆情分析技术 下载 mobi 免费 pdf 百度网盘 epub 2025 在线 电子书

网络舆情分析技术精美图片
》网络舆情分析技术电子书籍版权问题 请点击这里查看《

网络舆情分析技术书籍详细信息

  • ISBN:9787118093032
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2014-10
  • 页数:暂无页数
  • 价格:61.20
  • 纸张:胶版纸
  • 装帧:精装
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-19 00:53:35

内容简介:

  王兰成编著的《网络舆情分析技术(精)》以国家社科基金专项课题和全军专项研究生课题的研究成果为背景,对互联网主题舆情分析的理论、方法、技术和实现进行研究。将国内外领先的知识技术运用于网络舆情的采集和网络舆情的分析过程,抛砖引玉促进我国在网络舆情采集、处理和服务方法与技术领域的深入研究,推动军内外网络舆情信息系统中新技术的研究和应用创新。在网络舆情智能采集方面,本书的主要工作是:研究网络舆情情报规划与获取,研究主题网络舆情的语义特征抽取,研究舆情网页内容相关性的判定,研究舆情网页链接相关性的判定等。在网络舆情智能处理方面,本书的主要工作是:研究主题网络舆情的本体构建,研究语义层的舆情信息聚类和分类方法,研究基于情感本体的网络舆情倾向性分析等。在网络舆情智能服务方面,本书的主要工作是:研究舆情事件网页内容的词汇关联分析,研究基于网络论坛的舆情话题追踪方法和技术,研究网络舆情检索系统中的查询主题分类技术等。


书籍目录:

第1章 导论

1.1 互联网舆情信息

1.2 网络舆情采集

1.3 网络舆情处理

1.4 网络舆情服务

1.5 内容概览

第2章 网络舆情的分析

2.1 网络舆情的信息采集

2.1.1 网络舆情的采集方法

2.1.2 搜索引擎的研究进展

2.1.3 网络信息的分类及其抽取

2.2 舆情话题的搜索技术

2.2.1 话题搜索的基本原理

2.2.2 话题搜索的若干技术

2.2.3 主题爬行的实现

2.2.4 国内外舆情采集的研究成果

2.3 网络舆情的信息处理

2.3.1 网络舆情的处理方法

2.3.2 网络舆情的信息内容分析

2.4 网络舆情的内容分析与服务

2.4.1 知识技术及其应用

2.4.2 主题舆情内容分析框架

2.4.3 国内外舆情分析的研究成果

2.5 基于社交网络的舆情传播动力学性质

2.5.1 舆情演化模型及评析

2.5.2 社交网络特性与舆情传播控制策略

2.6 本章小结

第3章 基于主题爬行的网络舆情信息抽取和整理

3.1 舆情网页的结构特征与分块处理

3.1.1 话题标记和页分块

3.1.2 基于DOM树的内容分块

3.1.3 基于板块位置的布局分块

3.1.4 基于视觉特征的结构分块

3.2 基于主题爬行的舆情网页分块

3.2.1 网页分块的典型应用

3.2.2 网页的预处理

3.2.3 网页分块的特征提取及其算法

3.2.4 舆情内容块的整合

3.3 主题网络舆情的语义特征抽取

3.3.1 网络舆情语义的特征

3.3.2 基于N—Gram的特征抽取及其改进算法

3.3.3 基于DOM树分块的特征项权重计算

3.4 网络舆情的情报获取与整合

3.4.1 网络舆情的情报价值与情报支援

3.4.2 网络舆情情报支援系统

3.5 本章小结

第4章 舆情网页与话题相关性的判定分析

4.1 内容相关性的判定方法

4.1.1 元数据方法

4.1.2 链接标签数据方法

4.1.3 链接结构分析方法

4.1.4 页面语义信息方法

4.2 链接相关性的判定方法

4.2.1 链接锚文本标记及其信息提取

4.2.2 基于分块的主题链接上下文信息提取

4.2.3 基于链接标记和锚文本的主题判定算法

4.2.4 基于语义相似度计算的链接判定

4.3 舆情网页内容相关性的分析

4.3.1 主题特征的选择

4.3.2 待识别网页模型的建立

4.3.3 话题文本识别算法的选择

4.4 舆情网页链接相关性的分析

4.4.1 Web超链接的若干分析

4.4.2 基于信息链接关系的分析算法

4.4.3 增加主题分析的PageRank改进算法

4.5 本章小结

第5章 基于本体的网络舆情分析

5.1 本体理论概述

5.1.1 本体概念与分类

5.1.2 面向舆情分析的本体作用

5.1.3 通用本体构建的几种方法

5.2 基于本体的主题网络舆情知识模型

5.2.1 舆情的本体知识源

5.2.2 本体的主题舆情构建策略

5.2.3 知识模型中的本体库架构

5.3 主题网络舆情SIPO本体的实现方案

5.3.1 本体构建的规则

5.3.2 SIPO本体的实现步骤

5.3.3 一个舆情事件的本体实例

5.4 本章小结

第6章 基于SIPO的网络舆情信息聚类和分类

6.1 语义特征抽取转换

6.1.1 语义转换及概念特征生成

6.1.2 概念映射匹配算法分析

6.2 网络舆情信息的聚类与分类

6.2.1 Web文本信息的聚分类

6.2.2 利用SIPO本体的聚分类

6.2.3 SIPO的语义聚分类分析

6.3 基于SIPO本体的语义相似度计算

6.3.1 SIPO概念语义相似度

6.3.2 增加语义特征的文本相似度计算

6.4 基于语义的主题网络舆情信息聚类

6.4.1 舆情信息聚类流程分析

6.4.2 基于语义相似计算模型的凝聚层次聚类算法

6.5 基于语义的主题网络舆情信息分类

6.5.1 舆情信息分类流程分析

6.5.2 基于语义相似计算模型的KNN分类算法

6.6 本章小结

第7章 网络舆情采集与处理的功能实现及其评测

7.1 SIPO原型系统的功能框架

7.2 开发工具和平台概述

7.3 舆情采集实验与结果分析

7.3.1 实验数据选取和测试指标

7.3.2 URL与主题相关性判定算法测试

7.3.3 舆情采集应用分块方法的效果测试

7.4 舆情信息聚类实验与结果分析

7.4.1 实验数据选取和测试指标

7.4.2 基于语义的聚类分析实验方法

7.4.3 实验结果及分析

7.5 舆情信息分类实验与结果分析

7.5.1 基于语义的舆情分类实验方法

7.5.2 实验结果及分析

第8章 基于情感本体的网络舆情倾向性分析

8.1 网络舆情的倾向性分析

8.2 网络舆情倾向性识别方法及比较

8.2.1 基于文本分类的倾向性识别

8.2.2 基于语义规则的倾向性识别

8.2.3 基于情感词的倾向性识别

8.3 情感本体的构建方法

8.3.1 HowNet和领域语料的情感概念选择

8.3.2 整合多情感概念的情感本体构建

8.3.3 基于H0wNet和领域语料库的本体话题构建

8.4 基于J隋感本体的主题舆情倾向性分析

8.4.1 特征词情感倾向度计算

8.4.2 增加程度级别的特征词权重计算

8.4.3 基于情感本体的倾向性分析过程

8.5 网络舆情倾向性分析实验与结果分析

8.5.1 实验方法

8.5.2 实验结果及分析

8.6 本章小结

第9章 面向知识挖掘的网络舆情信息服务

9.1 基于网络论坛的舆情话题追踪

9.1.1 话题追踪的方法与分析

9.1.2 基于文本图的话题追踪模型

9.1.3 文本概念图的生成与关键词识别

9.1.4 语义相关度的计算及追踪话题的更新

9.1.5 舆情话题追踪实验与结果分析

9.2 网络舆情检索系统中的查询主题分类

9.2.1 查询分类的方法与分析

9.2.2 基于语义知识的查询分类模型

9.2.3 文档目录图上的查询词扩展

9.2.4 目录图上的查询分类识别

9.2.5 查询主题分类实验与结果分析

9.3 舆情事件网页内容的词汇关联分析

9.3.1 基于词跨度的事件内容关键词获取

9.3.2 基于共现次数统计的词汇关联分析

9.3.3 网络舆情事件的词汇关联实验与结果分析

9.4 本章小结

参考文献

后记


作者介绍:

暂无相关内容,正在全力查找中


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

  1)网页链接预测

  网页中的链接是网络爬虫持续工作的前提,然而网页中既包含了主题相关的链接,也包含了大量与主题无关的链接,面向主题的网络爬虫技术需要对即将要下载的链接进行预测,以免下载到与主题无关的网页。网页链接预测就是判断当前已经下载的网页中的链接所指向的网页是否与需要的主题相关,这是主题爬行系统的关键所在,任何一个主题爬行系统都要求尽可能爬行到和主题相关的网页,这样在一定程度上可以避免出现主题漂移现象,也可以以小的带宽资源获得多的主题相关网页。近年来,国内外研究者们所做的工作大致归为两类:一类是对整个页面进行综合评价,但是现在的网页很多都是多主题的,也就是说在一个网页内并存几个主题,或者虽然有个比较主要的主题但是其他主题的内容也很多。面对这样的网页,页面中的每个链接被赋予相同的权重,势必会有大量的不相关的链接被提取出来,甚至很可能造成下文所述的“隧道”问题。第二类是基于链接的判断,即网页中的每一个链接依据它附近的文本赋予不同的权重,有些甚至还考虑了链接所在各级标题,但标题的加入有时候反而会使得主题变模糊,基于链接的判断的问题是因为所取的信息量偏少,可能有大量的相关链接不能够被提取出来。

  网页分块技术能把网页分成不同的内容块,每一个内容块赋予不同的权重,超过一定阈值的内容块可以认为是和主题相关的。与主题相关的内容块里面的链接就假设都是和爬行主题相关的,把这些块中的链接放到爬行池等待下一步爬行,而把那些和主题不相关的块去掉,不爬行里面的链接。这种方法能更好地预测网页,既避免了针对整个网页进行评价的粒度过粗,又避免了基于链接判断方法的粒度过细,很大程度上能保证爬行下来的网页是和主题相关的。

  2)多主题和隧道问题

  随着网页制作技术和网站商业化进程的推进,当今网页中的内容和传统的文本相比有更多的表示形式,网页中的主题也不再单一。网页中有用户需要的主题内容,有与主题内容相关联的其他主题链接,还有很多信息只是为了方便浏览,如导航条、广告、版权信息等。网页中包含的多主题对于用户来说并不是什么问题,因为用户可以快速地识别出哪些是自己需要的主题信息,哪些是无关紧要的主题信息。然而这种多主题的网页却对网络爬虫产生了巨大的干扰,让机器去识别对用户有用的主题信息则困难较大。在web中还存在着一种现象,就是从当前已经得到的页面到目标网页有时往往需要经过几个不相关网页才能够达到,但是这几个网页之间都有着链接的联系。这些无关的链接就像长长的隧道一样连接着两个主题相关页面,因此,这种现象被称为“隧道现象”。

  ……


在线阅读/听书/购买/PDF下载地址:


原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

书籍介绍

《ADAMS入门详解与实例(第2版)》适合于科研院所、技术公司、企业等从事机械产品开发和研究的人员阅读,也可作为高等院校多体动力学软件课程的教材或机械原理、机械设计等课程的辅助教材。


书籍真实打分

  • 故事情节:4分

  • 人物塑造:3分

  • 主题深度:6分

  • 文字风格:3分

  • 语言运用:6分

  • 文笔流畅:9分

  • 思想传递:5分

  • 知识深度:7分

  • 知识广度:6分

  • 实用性:7分

  • 章节划分:7分

  • 结构布局:7分

  • 新颖与独特:4分

  • 情感共鸣:3分

  • 引人入胜:4分

  • 现实相关:8分

  • 沉浸感:3分

  • 事实准确性:7分

  • 文化贡献:4分


网站评分

  • 书籍多样性:4分

  • 书籍信息完全性:7分

  • 网站更新速度:7分

  • 使用便利性:4分

  • 书籍清晰度:9分

  • 书籍格式兼容性:7分

  • 是否包含广告:4分

  • 加载速度:6分

  • 安全性:3分

  • 稳定性:3分

  • 搜索功能:4分

  • 下载便捷性:9分


下载点评

  • 少量广告(164+)
  • 盗版少(274+)
  • 无盗版(638+)
  • 图文清晰(454+)
  • 无漏页(299+)
  • 小说多(200+)
  • 章节完整(632+)
  • 不亏(473+)
  • 字体合适(184+)
  • azw3(344+)

下载评价

  • 网友 冯***卉: ( 2025-01-18 18:42:09 )

    听说内置一千多万的书籍,不知道真假的

  • 网友 冯***丽: ( 2025-01-15 17:02:14 )

    卡的不行啊

  • 网友 苍***如: ( 2025-01-07 07:59:00 )

    什么格式都有的呀。

  • 网友 陈***秋: ( 2024-12-22 22:10:28 )

    不错,图文清晰,无错版,可以入手。

  • 网友 师***怀: ( 2025-01-05 13:50:26 )

    好是好,要是能免费下就好了

  • 网友 焦***山: ( 2025-01-12 03:28:02 )

    不错。。。。。

  • 网友 师***怡: ( 2025-01-12 05:08:16 )

    说的好不如用的好,真心很好。越来越完美

  • 网友 养***秋: ( 2025-01-16 05:30:57 )

    我是新来的考古学家

  • 网友 孔***旋: ( 2025-01-01 20:39:20 )

    很好。顶一个希望越来越好,一直支持。

  • 网友 薛***玉: ( 2025-01-02 14:10:33 )

    就是我想要的!!!

  • 网友 居***南: ( 2024-12-26 11:25:40 )

    请问,能在线转换格式吗?

  • 网友 马***偲: ( 2025-01-15 19:18:30 )

    好 很好 非常好 无比的好 史上最好的


随机推荐