Sobre este livro
Um dos grandes desafios de escrever um livro sobre uma área tecnológica, como o PLN, é fazê-lo de tal forma que ele não fique obsoleto pouco tempo depois de seu lançamento. E esse risco é, de fato, muito grande. Cada vez mais as tecnologias não apenas avançam rapidamente como podem ser totalmente substituídas por outras, tornando-se descartáveis. Ainda assim, há sempre um núcleo de conhecimento que se mantém relevante ao longo do tempo e que é indispensável para quem quer conhecer ou atuar nessa área. Por outro lado, por ser uma área tecnológica, é indispensável que o livro também apresente o que há de mais atual.
Este livro aborda conhecimentos, técnicas e aplicações de PLN em português que são relevantes atualmente ou historicamente. Afinal, para chegar até aqui, um longo caminho de construção de conhecimento foi percorrido – ainda que possa parecer que cada nova tecnologia seja sempre uma nova invenção.
Para contemplar história, estado da arte e não obsolescência, optou-se por criar um livro na forma digital, de acesso gratuito e dinâmico, ou seja, temos atualizado seu conteúdo a cada nova edição. Mais do que apenas atualizá-lo com novos conhecimentos, o livro tem sido ampliado com novos capítulos a cada nova edição. As possibilidades de expansão são inúmeras, já que há uma demanda crescente por novas aplicações que envolvem PLN.
Na primeira edição, procuramos introduzir os principais conceitos e tarefas da área, algumas das aplicações mais relevantes hoje em dia, particularmente em português do Brasil, e algumas das principais técnicas usadas para o desenvolvimento dessas tarefas e aplicações. Os temas de todos os capítulos tinham potencial para serem aprofundados em edições futuras, o que de fato aconteceu.
Na segunda edição, revisada e ampliada, o conteúdo foi estendido com seis novos capítulos organizados em doze partes. Foram acrescentadas duas novas partes: Interação e Avaliação, dois temas importantíssimos para o PLN.
A terceira edição foi estendida com seis novos capítulos e também trouxe material suplementar em alguns deles, com vídeos dos autores e slides de apresentação do conteúdo do capítulo.
Nesta quarta edição, com o crescimento constante do livro, decidimos dividi-lo em 3 volumes. O Volume 1 é dedicado aos capítulos introdutórios e conceituais da área de PLN: Introdução, Fala, Palavra, Estrutura, Significado, Discurso, Geração e Interação, Dados, Avaliação e Desafios e Perspectivas. O Volume 2 é totalmente dedicado aos modelos de linguagem (Language Models): conceituação, técnicas, treinamento, avaliação, aplicação. Já o Volume 3 concentra os capítulos que descrevem as aplicações variadas na área de PLN. Esperamos que essa nova apresentação propicie aos leitores de diferentes perfis uma navegação mais confortável e eficaz. Ressaltamos que sempre é possível navegar de um capítulo a outro, de um volume a outro. O Prefácio de cada volume traz informações específicas sobre o mesmo.
Esta edição foi estendida com oito novos capítulos, sendo um no Volume 1, cinco no Volume 2 e dois no Volume 3. Outros nove capítulos foram atualizados, sendo dois deles – Sumarização Automática e Complexidade Textual e suas tarefas relacionadas – significativamente estendidos com novas seções, com novos coautores. Finalmente, dez capítulos foram anexados vídeos sobre seus temas.
Este livro deve continuar crescendo com novas contribuições, na forma de novos capítulos ou novas versões dos capítulos já existentes. Por isso, atente-se sempre para a data de publicação dos conteúdos. A fim de abranger temas variados nessa área, contamos com um número cada vez maior de autores colaboradores. A quarta edição conta com 99 autores, sendo eles professores universitários das principais universidades brasileiras e também do exterior, pesquisadores brasileiros que atuam no exterior, alunos de pós-graduação em Computação e em Linguística, profissionais de PLN que atuam em empresas. A variedade de autoria e a forma colaborativa de construção de conteúdos, sob diferentes visões (computacional e linguística), dão a este livro uma característica única, uma personalidade. E essa personalidade, que tanto nos orgulha, faz deste livro uma história do PLN escrita a muitas mãos.
Com este livro, as autoras e os autores pretendem oferecer um corpo de conhecimento suficientemente abrangente sobre o PLN em português do Brasil – ainda que não esgote todos os temas da área – que atenda expectativas de leitores com diferentes perfis. O livro pode ser usado como material didático para disciplinas de cursos de Computação ou Linguística, ou áreas afins, servindo como fonte de conhecimento teórico e prático para quem está aprendendo essa ciência. Pode servir de referência a profissionais que fazem uso do PLN para criar soluções tecnológicas, servindo como fonte de técnicas e métodos para desenvolvimento de sistemas tecnológicos. Também acadêmicos e curiosos, de um modo geral, nele encontrarão uma visão geral da área de PLN, e como ela pode interagir com outras áreas de conhecimento. Em Como ler este livro, apresentamos em detalhes os volumes desta edição.
Agradecemos o apoio da NAACL RAF 2021, uma iniciativa da NAACL1 (North American Chapter of the Association for Computational Linguistics) para apoiar projetos da comunidade de PLN na América Latina.
Como citar
Caseli, H.M.; Nunes, M.G.V. (org.) Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 4 ed. BPLN, 2025. Disponível em: https://brasileiraspln.com/livro-pln/4a-edicao.