第二章：使用spaCy进行大规模数据分析

在本章中，我们会用一些新技术来从大量语料中抽取特定信息。我们会学习如何利用spaCy的数据结构来结合统计与规则模型进行文本分析。

1数据结构 (1)

2从字符串到哈希值

3vocab（词汇表），哈希值和词素

4数据结构 (2)

5创建一个Doc

6从头开始练习Docs（文档）, spans（跨度）和entities（实体）

7数据结构最佳实践

8词向量和语义相似度

9检查词向量

10比对相似度

11结合流程与规则

12模板调试 (1)

13模板调试 (2)

14高效率的短语匹配

15提取国家和关系