第1章 数据处理概述 1
1.1 专利分析基本概念 1
1.2 数据处理概述 2
1.3 数据的内容及分类概述 5
1.4 数据处理的基本工具 5
1.4.1 专利分析工具 5
1.4.2 Excel在专利分析中的应用 6
第2章 数据源 12
2.1 专利申请/公开信息 12
2.1.1 申请/公开数据类型 12
2.1.2 申请号的标准化处理 14
2.2 相关案件信息 14
2.2.1 相关案件数据类型 14
2.2.2 专利族信息的处理 16
2.3 相关人信息 19
2.3.1 相关人数据类型 19
2.3.2 专利权人/申请人信息的处理 21
2.3.3 专利地域标准化数据的处理 22
2.4 引证/施引信息 22
2.4.1 引证/施引相关数据 22
2.4.2 引证/施引信息来源与处理 24
2.5 技术信息 27
2.5.1 技术信息相关数据 28
2.5.2 技术信息的来源与处理 31
2.6 法律状态信息 36
2.6.1 法律状态相关数据 36
2.6.2 法律状态信息来源与处理 39
2.7 无效宣告/复审信息 39
2.8 诉讼信息 41
2.8.1 诉讼信息相关数据 41
2.8.2 专利诉讼信息来源 43
2.9 统计/索引信息 44
2.10 总结 45
第3章 数据清洗 46
3.1 数据清洗方法及实现 46
3.2 数据清洗流程 47
3.3 清洗示例 48
3.4 清洗常见问题及处理方法 50
第4章 数据记录处理 51
4.1 数据的拼接 51
4.1.1 数据拼接的意义 51
4.1.2 数据拼接的实现 51
4.2 数据记录的去重 57
4.2.1 数据去重的意义 57
4.2.2 数据去重的实现 58
4.3 数据记录的去噪 64
4.3.1 数据去噪的意义 64
4.3.2 数据噪音的来源 64
4.3.3 数据去噪方式 66
4.3.4 数据去噪主要手段 67
4.4 数据记录处理常见问题 69
第5章 数据规范化 70
5.1 数据规范化概述 70
5.1.1 数据规范化定义 70
5.1.2 数据规范化作用 70
5.1.3 数据常见问题 72
5.1.4 数据规范化基本内容 74
5.2 数据字段的规范化 75
5.2.1 日期型数据处理 75
5.2.2 数值型数据处理 87
5.2.3 文本型数据的规范化 89
第6章 数据的深加工:标引 92
6.1 数据标引的基本内容 92
6.2 数据标引的基本原则 93
6.2.1 技术主题分解环节的定位 93
6.2.2 技术主题分解的原则 93
6.2.3 技术分解环节的几种常见形式 94
6.2.4 数据标引的基本原则 97
6.3 数据标引的基本方法 98
6.3.1 基于Excel的人工阅读标引方法 98
6.3.2 基于检索辅助的批量标引方法 104
6.3.3 基于专利分析系统的数据标引方法 105
第7章 信息的呈现 118
7.1 信息可视化概述 118
7.2 专利分析维度与图表的适用 119
7.2.1 专利态势分析 119
7.2.2 专利技术分析 120
7.2.3 申请主体分析 123
7.3 主流专利分析系统数据可视化的表现 123
7.3.1 信息可视化的人性化表现 123
7.3.2 信息可视化的智能化表现 131
第8章 数据处理的全流程实例 144
8.1 Power Query、Power BI自动化分析实例 144
8.1.1 概述 144
8.1.2 数据来源 145
8.1.3 数据校验和准备 146
8.1.4 数据加工 158
8.1.5 数据建模和可视化 161
8.2 Patentics客户端软件专利分析实例 169
8.2.1 概述 169
8.2.2 专利分析的检索 169
8.2.3 分析数据的导入 173
8.2.4 分析数据的处理 178
8.2.5 专利数据标引 185
8.2.6 数据统计 190
8.2.7 可视化 192
第9章 结束语 195
9.1 向着智能化和人性化发展的专利分析方法 196
9.2 不远的未来 199