文本挖掘 英文PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:(以)RonenFeldman,(美)JamesSanger著
- 出 版 社:北京:人民邮电出版社
- 出版年份:2009
- ISBN:9787115205353
- 页数:410 页
Ⅰ.Introduction to Text Mining 1
Ⅰ.1 Defining Text Mining 1
Ⅰ.2 General Architecture of Text Mining Systems 13
Ⅱ.Core Text Mining Operations 19
Ⅱ.1 Core Text Mining Operations 19
Ⅱ.2 Using Background Knowledge for Text Mining 41
Ⅱ.3 Text Mining Query Languages 51
Ⅲ.Text Mining Preprocessing Techniques 57
Ⅲ.1 Task-Oriented Approaches 58
Ⅲ.2 Further Reading 62
Ⅳ.Categorization 64
Ⅳ.1 Applications of Text Categorization 65
Ⅳ.2 Definition of the Problem 66
Ⅳ.3 Document Representation 68
Ⅳ.4 Knowledge Engineering Approach to TC 70
Ⅳ.5 Machine Learning Approach to TC 70
Ⅳ.6 Using Unlabeled Data to Improve Classification 78
Ⅳ.7 Evaluation of Text Classifiers 79
Ⅳ.8 Citations and Notes 80
Ⅴ.Clustering 82
Ⅴ.1 Clustering Tasks in Text Analysis 82
Ⅴ.2 The General Clustering Problem 84
Ⅴ.3 Clustering Algorithms 85
Ⅴ.4 Clustering of Textual Data 88
Ⅴ.5 Citations and Notes 92
Ⅵ.Information Extraction 94
Ⅵ.1 Introduction to Information Extraction 94
Ⅵ.2 Historical Evolution of IE:The Message Understanding Conferences and Tipster 96
Ⅵ.3 IE Examples 101
Ⅵ.4 Architecture of IE Systems 104
Ⅵ.5 Anaphora Resolution 109
Ⅵ.6 Inductive Algorithms for IE 119
Ⅵ.7 Structural IE 122
Ⅵ.8 Further Reading 129
Ⅶ.Probabilistic Models for Information Extraction 131
Ⅶ.1 Hidden Markov Models 131
Ⅶ.2 Stochastic Context-Free Grammars 137
Ⅶ.3 Maximal Entropy Modeling 138
Ⅶ.4 Maximal Entropy Markov Models 140
Ⅶ.5 Conditional Random Fields 142
Ⅶ.6 Further Reading 145
Ⅷ.Preprocessing Applications Using Probabilistic and Hybrid Approaches 146
Ⅷ.1 Applications of HMM to Textual Analysis 146
Ⅷ.2 Using MEMM for Information Extraction 152
Ⅷ.3 Applications of CRFs to Textual Analysis 153
Ⅷ.4 TEG:Using SCFG Rules for Hybrid Statistical-Knowledge-Based IE 155
Ⅷ.5 Bootstrapping 166
Ⅷ.6 Further Reading 175
Ⅸ.Presentation-Layer Considerations for Browsing and Query Refinement 177
Ⅸ.1 Browsing 177
Ⅸ.2 Accessing Constraints and Simple Specification Filters at the Presentation Layer 185
Ⅸ.3 Accessing the Underlying Query Language 186
Ⅸ.4 Citations and Notes 187
Ⅹ.Visualization Approaches 189
Ⅹ.1 Introduction 189
Ⅹ.2 Architectural Considerations 192
Ⅹ.3 Common Visualization Approaches for Text Mining 194
Ⅹ.4 Visualization Techniques in Link Analysis 225
Ⅹ.5 Real-World Example:The Document Explorer System 235
Ⅺ.Link Analysis 242
Ⅺ.1 Preliminaries 242
Ⅺ.2 Automatic Layout of Networks 244
Ⅺ.3 Paths and Cycles in Graphs 248
Ⅺ.4 Centrality 249
Ⅺ.5 Partitioning of Networks 257
Ⅺ.6 Pattern Matching in Networks 270
Ⅺ.7 Software Packages for Link Analysis 271
Ⅺ.8 Citations and Notes 272
Ⅻ.Text Mining Applications 273
Ⅻ.1 General Considerations 274
Ⅻ.2 Corporate Finance:Mining Industry Literature for Business Intelligence 279
Ⅻ.3 A "Horizontal" Text Mining Application:Patent Analysis Solution Leveraging a Commercial Text Analytics Platform 295
Ⅻ.4 Life Sciences Research:Mining Biological Pathway Information with Gene Ways 307
Appendix A:DIAL:A Dedicated Information Extraction Language for Text Mining 315
A.1 What Is the DIAL Language? 315
A.2 Information Extraction in the DIAL Environment 316
A.3 Text Tokenization 318
A.4 Concept and Rule Structure 318
A.5 Pattern Matching 320
A.6 Pattern Elements 321
A.7 Rule Constraints 325
A.8 Concept Guards 326
A.9 Complete DIAL Examples 327
Bibliography 335
Index 389
- 《潜文本的阐释与翻译》刘早著 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《人工智能与数据挖掘的原理及应用》黄尚科编著 2019
- 《古徽州 中英日韩文本》向晓阳摄影 2004
- 《基于Python的智能文本分析》BenjaminB 2019
- 《生态批评 理论实践与文本 英文》李显文著 2015
- 《基于文本挖掘的本体学习方法研究》于娟著 2018
- 《基于群体智能优化算法的文本过滤关键技术研究》朱振方,刘培玉,尉永清著 2019
- 《细胞毒性数据挖掘技术与应用》潘天红,陈娇 2019
- 《云破月来 文本深读与语文核心素养》(中国)司保峰 2019
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《咏叹生死》(以)阿摩司·奥兹著;钟志清译 2019
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019