《专利知识挖掘关键技术研究》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:翟东升著
  • 出 版 社:北京:知识产权出版社
  • 出版年份:2013
  • ISBN:9787513016865
  • 页数:296 页
图书介绍:随着科学技术的高速发展,专利数据分析与挖掘变得越来越重要。本书通过深入地研究专利数据特征以及各种专利分析方法,设计一套专利知识信息处理模型,通过对专利数据库中专利信息的抽取、采集,实现对专利数据的深度分析和挖掘。

第1章 绪论 1

1.1 研究背景意义 1

1.2 专利信息采集研究现状 2

1.2.1 Deep Web研究综述 2

1.2.2 多Agent系统应用于信息获取领域的研究 3

1.2.3 分布式系统负载均衡机制研究 5

1.2.4 网页信息抽取技术研究 7

1.2.5 信息抽取规则生成技术研究 9

1.3 专利数据仓库研究现状 9

1.3.1 异构数据源集成研究现状 9

1.3.2 专利分析方法和工具 10

1.3.3 数据挖掘在专利分析中的应用 12

1.3.4 面向主题的研究 12

1.4 基于语义的专利信息查询研究现状 14

1.4.1 专利信息检索的研究现状 14

1.4.2 查询扩展的研究现状 14

1.5 专利侵权检索研究现状 16

1.5.1 国外专利侵权检索研究 16

1.5.2 国内专利侵权检索研究 19

1.6 本书内容与整体框架安排 20

第2章 基于多代理的专利信息采集技术 22

2.1 专利信息资源数据库介绍 22

2.1.1 USPTO专利信息资源 22

2.1.2 DII专利数据库简介 24

2.2 相关理论和关键技术 26

2.2.1 多Agent系统与JADE 26

2.2.2 面向Agent的软件分析设计方法 28

2.2.3 Deep Web信息抽取 31

2.3.3 基于XML技术的网页信息抽取技术 33

2.2.4 异构数据库的信息交互 35

2.3 基于多Agent系统的专利采集原型系统研究 39

2.3.1 基于MAS的专利采集系统分析与设计 39

2.3.2 专利信息页面获取 66

2.3.3 专利信息抽取 67

2.3.4 专利采集系统实现 81

2.4 基于分布式多Agent系统的二层数据库专利信息抽取系统 86

2.4.1 分布式专利抽取系统的分析与设计 86

2.4.2 任务分配关键技术 107

2.4.3 信息抽取规则半自动生成关键技术 114

2.4.4 原型系统实现 121

本章小结 127

第3章 专利数据仓库构建技术及应用 129

3.1 相关理论与关键技术 129

3.1.1 数据仓库 129

3.1.2 数据ETL 132

3.1.3 微软商业智能 133

3.2 面向主题的专利分析系统需求分析与设计 137

3.2.1 需求分析 137

3.2.2 系统总体架构设计 140

3.2.3 数据源特征 142

3.3 主题数据集市设计 143

3.3.1 主题数据集市的构建步骤 143

3.3.2 主题模型库的设计 144

3.3.3 主题数据集市设计 147

3.4 面向主题的专利分析系统实现 152

3.4.1 系统实现环境 152

3.4.2 ETL的实现 153

3.4.3 多维分析模型的实现 175

3.5 实例分析 179

3.5.1 企业层面 179

3.5.2 技术层面 182

本章小结 188

第4章 基于本体的专利知识库构建及应用技术 190

4.1 相关理论和关键技术 190

4.1.1 语义与语境相关理论 190

4.1.2 文本挖掘理论 191

4.1.3 语料库理论 199

4.1.4 本体知识库理论 200

4.1.5 信息检索模型 203

4.2 专利领域语料库的设计 205

4.2.1 专利领域语料库的构建的整体框架 205

4.2.2 专利领域语料预处理 208

4.2.3 专利领域语料特征抽取 212

4.3 构建专利领域本体知识库 216

4.3.1 专利领域本体知识库构建 216

4.3.2 专利领域本体构建的关键步骤 218

4.3.3 专利领域本体的编辑与存储 227

4.4 专利领域信息查询扩展原型系统的实现 229

4.4.1 原型系统设计 229

4.4.2 系统实现 230

4.4.3 查询扩展实验验证 233

本章小结 237

第5章 中文专利侵权检索模型研究 239

5.1 相关理论和关键技术 239

5.1.1 专利侵权概念 239

5.1.2 专利侵权判定原则 239

5.2 专利数据获取及文本预处理 241

5.2.1 中文专利来源及数据特征 242

5.2.2 专利权利要求书预处理 243

5.2.3 中文专利权利要求书分词算法 245

5.2.4 特征抽取及数据保存 251

5.3 中文专利侵权检索模型构建 253

5.3.1 专利侵权检索总体模型设计 254

5.3.2 本体构建 254

5.3.3 特征选择及倒排索引构建 255

5.3.4 向量空间模型构建及差异权重设置 258

5.3.5 专利权利要求书相似度算法 260

5.3.6 专利必要技术特征覆盖度算法 261

5.4 中文专利侵权检索系统实现 274

5.4.1 开发环境及数据库 274

5.4.2 系统数据流程图 275

5.4.3 系统主要功能模块及界面展示 277

5.4.4 实验分析 277

本章小结 278

结论与展望 280

参考文献 282