第3章: パイプライン処理

この章では spaCy の処理パイプラインについて知っておくべきことをすべて紹介します。テキストを処理するときに裏側で起こっていること、自分でコンポーネントを書いてパイプラインに追加する方法、拡張属性を使用してdocやスパン、トークンに独自のメタデータを追加する方法、などを学びます。

1処理パイプライン

2nlpを呼び出すとき、何が起こっているか?

3パイプラインの中身

4カスタムのパイプラインコンポーネント

5カスタムコンポーネントのユースケース

6シンプルなコンポーネント

7複雑なコンポーネント

8拡張属性

9拡張属性の設定(1)

10拡張属性の設定(2)

11固有表現と拡張属性

12拡張属性とコンポーネント

13スケーリングとパフォーマンス

14ストリームの処理

15データをコンテキストで処理する

16処理対象の選択

このコースについて

spaCyは産業応用向きの自然言語処理用Pythonライブラリです。この無料のオンラインコースでは、ルールベースと機械学習を用いた先進的な自然言語処理システムをspaCyで作る方法をインタラクティブに学ぶことができます。

私について

私はspaCyのコア開発者で、Explosionの共同創業者の一人のInesです。AIや機械学習、自然言語処理の最新の開発ツールを専門としており、Web関連のものを作るのも大好きです。