Processamento de Linguagem Natural

Conceitos, Técnicas e Aplicações em Português

Publicado em:

26/09/2023

Sobre este livro

Um dos grandes desafios de escrever um livro sobre uma área tecnológica, como o PLN (Processamento de Linguagem Natural), é fazê-lo de tal forma que ele não fique obsoleto pouco tempo depois de seu lançamento. E esse risco é, de fato, muito grande. Cada vez mais as tecnologias não apenas avançam rapidamente como podem ser totalmente substituídas por outras, tornando-se descartáveis. Ainda assim, há sempre um núcleo de conhecimento que se mantém relevante ao longo do tempo e que é indispensável para quem quer conhecer ou atuar nessa área. Por outro lado, por ser uma área tecnológica, é indispensável que o livro também apresente o que há de mais atual.

Este livro aborda conhecimentos, técnicas e aplicações de PLN em português que são relevantes atualmente ou historicamente. Afinal, para chegar até aqui, um longo caminho de construção de conhecimento foi percorrido – ainda que possa parecer que cada nova tecnologia seja sempre uma nova invenção.

Para contemplar história, estado da arte e não obsolescência, optou-se por criar um livro na forma digital, de acesso gratuito e dinâmico, ou seja, assume-se o compromisso de atualizá-lo sempre que for necessário. Mais do que apenas atualizá-lo com novos conhecimentos, o livro deve ser ampliado, com o tempo, com temas que, nesta primeira edição, ficaram de fora. As possibilidades de expansão são inúmeras, já que há uma demanda crescente por novas aplicações que envolvem PLN.

Nesta primeira edição, procuramos introduzir os principais conceitos e tarefas da área, algumas das aplicações mais relevantes hoje em dia, particularmente em português do Brasil, e algumas das técnicas usadas para o desenvolvimento dessas tarefas e aplicações. Os temas de todos os capítulos têm potencial para serem aprofundados em edições futuras deste livro. Outros temas, ainda que muito centrais à área, ficaram para uma segunda edição. Entre eles, destacamos os formalismos e as técnicas de análise sintática (parsing), o tratamento de expressões multipalavras, formalismos de representação semântica e pragmática. Novos capítulos com aplicações em diferentes domínios devem ser inseridos no futuro próximo.

A fim de abranger temas variados nessa área, foi importante contar com um grande número de autores especialistas. Eles incluem experientes professores universitários das principais universidades brasileiras e também do exterior, pesquisadoras brasileiras que atuam no exterior, alunos de pós-graduação em Computação e em Linguística, profissionais de PLN que atuam em empresas. A variedade de autoria e a forma colaborativa de construção de conteúdos, sob diferentes visões (computacional e linguística), dão a este livro uma característica única: uma personalidade. E essa personalidade, que tanto nos orgulha, faz deste livro uma história do PLN escrita a muitas mãos.

Com este livro, as autoras e os autores pretendem oferecer um corpo de conhecimento suficientemente abrangente sobre o PLN em português do Brasil – ainda que não esgote todos os temas da área – que atenda expectativas de leitores com diferentes perfis. O livro pode ser usado como material didático para disciplinas de cursos de Computação ou Linguística, ou áreas afins, servindo como fonte de conhecimento teórico e prático para quem está aprendendo essa ciência. Pode servir de referência a profissionais que fazem uso do PLN para criar soluções tecnológicas, servindo como fonte de técnicas e métodos para desenvolvimento de sistemas tecnológicos. Também acadêmicos e curiosos, de um modo geral, nele encontrarão uma visão geral da área de PLN, e como ela pode interagir com outras áreas de conhecimento.

Agradecemos o apoio da NAACL RAF 2021, uma iniciativa da NAACL1 (North American Chapter of the Association for Computational Linguistics) para apoiar projetos da comunidade de PLN na América Latina.


  1. https://naacl.org/↩︎