中文科研领域命名实体知识图谱的构建与应用PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:王瑞云著
- 出 版 社:北京:中国财政经济出版社
- 出版年份:2018
- ISBN:9787509587201
- 页数:189 页
第1章 绪论 1
1.1 知识图谱与命名实体 1
1.1.1 知识图谱的概念 1
1.1.2 命名实体的知识图谱构建 2
1.1.3 国内外命名实体的知识图谱构建 4
1.2 中文网络知识库存在的问题与研究的意义 7
1.2.1 海量信息与“信息孤岛”的问题 7
1.2.2 本书的研究意义 10
1.3 关联数据语义化聚簇研究综述 11
1.3.1 虚拟国际规范档VIAF关联数据研究 11
1.3.2 Wikipedia及其系列项目知识库研究 14
1.3.3 语义化基础工具的研究 17
1.3.4 LDA主题模型 20
1.4 本书的研究内容和研究路线 23
第2章 基础理论 26
2.1 语义Web的构成 26
2.1.1 RDF与关系数据库 27
2.1.2 网络本体语言OWL与本体的构建与应用 28
2.1.3 语义推理应用 30
2.1.4 基于数学关系的本体定义和逻辑公式 31
2.2 规范数据和关联数据 34
2.2.1 规范数据的描述格式 34
2.2.2 规范数据的关联 36
2.2.3 跨语言的一体化关联数据Wikidata 38
2.3 语义聚簇 40
2.3.1 VIAF初期项目分析一连接德意志图书馆和美国国会图书馆的规范文档 41
2.3.2 VIAF周期性关联实践的算法流程及歧义处理 43
2.3.3 VIAF独立网站服务开通的运营分析 47
2.3.4 VIAF与W ikidata的结合实践与发展趋势 48
2.4 基于主题模型的语义化 49
2.4.1 LDA输入 50
2.4.2 LD A的假设 50
2.4.3 LDA的图形表示与生成模型表示 51
2.4.4 LDA的参数估计 51
2.4.5 LDA的新样本推断 52
2.5 异构知识库的实体定义与识别 52
2.5.1 使用RDF模式定义知识库的实体、属性及实体间的关系 52
2.5.2 命名实体知识图谱的类层次定义与实例构建 55
2.5.3 中文命名实体的对齐 58
2.5.4 中文命名实体的识别困难 59
2.6 小结 60
第3章 基于个人属性表的中文个人名称规范记录聚簇 61
3.1 名称规范记录与规范控制 61
3.1.1 CNASS结果集记录未聚簇的问题分析 62
3.1.2 国内学者对名称记录聚簇的研究 64
3.1.3 VIAF匹配算法的参考 65
3.2 规范记录实体匹配分析 66
3.2.1 CNASS检索结果集总体特征 67
3.2.2 中文名称规范记录的各级表示方法 67
3.2.3 VIAF聚簇内详细内容和结构分析 69
3.2.4 不同中文规范数据库的特征比较 71
3.2.5 中文名称规范记录的匹配检索点的构建 72
3.3 自动聚簇方法与实现 73
3.3.1 数据库表的构建 73
3.3.2 数据预处理 75
3.3.3 名称实体匹配和聚簇算法 76
3.3.4 聚簇结果分析 78
3.3.5 聚簇结果与VIAF匹配聚簇验证 78
3.4 小结 80
第4章 基于作品关系扩展的中文个人名称规范记录聚簇 81
4.1 名称规范记录的FRBR语义化表示 81
4.2 中文个人名称规范记录聚簇的E-R分析 82
4.2.1 中文个人名称规范记录的实体分析 82
4.2.2 中文个人名称规范记录的实体关系分析 83
4.3 基于作品关系扩展的中文个人名称规范记录聚簇算法 86
4.3.1 基于外部关联记录的作品关系属性扩展 86
4.3.2 基于作品关系扩展的中文个人名称记录识别与聚簇算法 88
4.4 中文个人名称规范记录聚簇实验 90
4.4.1 实验聚簇结果的评价指标和描述统计分析 90
4.4.2 聚簇的综合效果分析 93
4.4.3 聚簇实验结果分析 94
4.5 利用虚拟国际规范档的CCS记录进行关联扩展 95
4.5.1 CCS规范记录号能否重定向到VIAF聚簇 95
4.5.2 VIAF聚簇中的CCS记录的特征研究 96
4.6 小结 97
第5章 基于Wikidata的个人职业本体构建 99
5.1 中文名称规范检索系统结果集附加信息识别问题 99
5.2 Wikidata个人名称数据的职业表示方法 101
5.3 基于准马尔可夫过程的职业层次关系分析 104
5.3.1 职业条目数据的获取 104
5.3.2 职业上位关系的矩阵表示与特征研究 106
5.3.3 职业上位关系矩阵的准马尔可夫转化 108
5.3.4 结果分析 111
5.4 中文个人职业本体的推导 114
5.5 小结与展望 115
第6章 基于主题模型识别的个人名称规范记录聚簇 116
6.1 基于主题模型的记录语义结构化问题 116
6.2 中文个人名称规范记录的主题模型构建 117
6.2.1 中文个人名称规范记录的主题特征分析 117
6.2.2 主题框架构建 119
6.2.3 主题词抽取方法 119
6.2.4 基于主题词方法的案例 122
6.3 实验和结果分析 124
6.4 小结 126
第7章 机构实体知识库构建研究 127
7.1 基于名称的机构识别方法 127
7.1.1 名称文本近似度识别 127
7.1.2 曾用名表简称表识别 127
7.1.3 分段识别 128
7.1.4 总体分支语义关联识别 128
7.2 参考知识库的机构 129
7.2.1 中文名称规范数据库的机构查询分析 129
7.2.2 虚拟国际规范档的机构 129
7.2.3 百度百科的机构分析 130
7.2.4 维基数据的机构 130
7.3 机构实体的分析与构建 132
7.3.1 机构的概念 132
7.3.2 机构的分类及类层次关系 132
7.3.3 机构实例库的初步构建 133
7.3.4 机构库实体结点构建 134
7.3.5 机构库实例结点与外部知识库的实例等同关系构建 136
7.4 命名实体知识图谱概念层次定义和实例构建 137
7.5 小结 140
第8章 研究结论、局限与展望 141
8.1 研究结论 141
8.2 研究局限与展望 143
附录A 个人名称检索语料 145
附录B 示例:Amarc3_005.XML文件内容 156
附录C 初步收集科研实体机构一总体机构名称表 169
附录D 本书术语的中英文对应表 174
参考文献 178
后记 188
- 《浙江海岛植物原色图谱》蒋明,柯世省主编 2019
- 《乳腺手术图谱》Diethelm Wallwiener Seven Becker Umberto Verones 2019
- 《海棠花粉电镜图谱》张往祥著 2018
- 《学校教育指标系统的构建》杨向东著 2019
- 《中国二氧化碳减排和环境协同效益评价模型的构建与研究》杨曦,滕飞著 2019
- 《中国“轻一代”女性的心灵图谱 来自心理咨询室的十五个一手故事》蔡岫,梁明霞著 2019
- 《磁性核壳结构吸波材料构建与制备》刘渊,陈桂明,王炜著 2019
- 《地方文化特色历史课堂与学科体系的构建》刘金林,聂亚珍 2019
- 《“一带一路”倡议下中国城市形象与城市文化的构建》李莹著 2019
- 《深圳市土壤环境技术体系构建研究》郗秀平等编著 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《信息系统安全技术管理策略 信息安全经济学视角》赵柳榕著 2020
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019