第二章:使用spaCy进行大规模数据分析

在本章中,我们会用一些新技术来从大量语料中抽取特定信息。 我们会学习如何利用spaCy的数据结构来结合统计与规则模型进行文本分析。

1数据结构 (1)

2从字符串到哈希值

3vocab(词汇表),哈希值和词素

4数据结构 (2)

5创建一个Doc

6从头开始练习Docs(文档), spans(跨度)和entities(实体)

7数据结构最佳实践

8词向量和语义相似度

9检查词向量

10比对相似度

11结合流程与规则

12模板调试 (1)

13模板调试 (2)

14高效率的短语匹配

15提取国家和关系

关于这门课程

spaCy是一个先进的工业级别自然语言处理Python库。在这个免费的交互性在线课程中,你会学习到如何使用spaCy来打造先进的基于规则或是机器学习方法的自然语言处理系统。

关于我

我是Ines,我是spaCy的核心开发人员之一,也是Explosion的联合创始人。我专注于构建人工智能、机器学习和自然语言处理的先进开发工具。我也非常喜欢开发一些网络应用。