Chapter 2: Análise da dados em larga escala usando a biblioteca spaCy

Neste capítulo você desenvolverá novas habilidades ao extrair informações específicas de um grande volume de texto. Você vai aprender a otimizar o uso das estruturas de dados da spaCy e como criar estratégias combinadas de estatística e baseadas em regras para efetuar análises de textos de maneira eficiente.

1Estruturas de Dados (1)

2Strings e hashes

3Vocabulários, códigos hash e lexemas

4Estruturas de Dados (2)

5Criando um objeto Doc

6Docs, partições Span e Entidades a partir do zero

7Melhores práticas em estruturas de dados

8Vetores das palavras e similaridade semântica

9Inspeção dos vetores das palavras

10Comparando similaridades

11Combinando predições e regras

12Depurando expressões (padrões) (1)

13Depurando expressões (padrões) (2)

14Correspondência eficiente de frases

15Extraindo países e relacionamentos

Sobre o curso

spaCy é uma biblioteca moderna em Python para Processamento de Linguagem Natural (PLN) em escala profissional. Neste curso online, gratuito e interativo, você aprenderá a utilizar a biblioteca spaCy para construir sistemas avançados de entendimento de linguagem natural, usando tanto estratégias baseadas em regras como aprendizado de máquina.

Sobre mim

Sou Ines, uma desenvolvedora principal da spaCy e co-fundadora da Explosion. Sou especialista em ferramentas modernas de Inteligência Artificial, Aprendizado de Máquina e Processamento de Linguagem Natural (PLN). E também amo construir coisas para a Internet.