第1章: 単語やフレーズ、名前、概念の検索

この章では、spaCyの基本的なテキスト処理の方法を紹介します。 データ構造や機械学習モデルの扱い方や、これらを用いてテキストの言語的特徴を抽出する方法を学んでいきます。

第2章: spaCyによる大量データの解析

この章では、大量のテキストから特定の情報を抽出する方法をみていきます。 spaCyのデータ構造の作成方法と、テキスト解析のために機械学習モデルとルールベースモデルを効率的に組み合わせる方法を学びます。

第3章: パイプライン処理

この章では spaCy の処理パイプラインについて知っておくべきことをすべて紹介します。テキストを処理するときに裏側で起こっていること、自分でコンポーネントを書いてパイプラインに追加する方法、拡張属性を使用してdocやスパン、トークンに独自のメタデータを追加する方法、などを学びます。

第4章: ニューラルネットワークのトレーニング

この章では、ユースケースに合わせて機械学習モデルを更新する方法を学びます。例えば、オンラインのコメントを使って新しい固有表現タイプを予測する、などです。 ゼロからトレーニングループを書いていき、トレーングの基礎を理解し、NLPプロジェクトをより成功させるためのヒントやコツを学んでいきます。

このコースについて

spaCyは産業応用向きの自然言語処理用Pythonライブラリです。この無料のオンラインコースでは、ルールベースと機械学習を用いた先進的な自然言語処理システムをspaCyで作る方法をインタラクティブに学ぶことができます。

私について

私はspaCyのコア開発者で、Explosionの共同創業者の一人のInesです。AIや機械学習、自然言語処理の最新の開発ツールを専門としており、Web関連のものを作るのも大好きです。