@MASTERSTHESIS{ 2022:712809880, title = {Classificação automática de documentos utilizando técnicas de inteligência artificial}, year = {2022}, url = "http://sistemas2.uespi.br/handle/tede/2264", abstract = "A organização de documentos em uma instituição é de extrema importância, pois traz praticidade e eficiência na recuperação. Separar esses arquivos de acordo com seu tipo de forma manual, ocupa bastante horas de trabalho por parte do profissional responsável. Portanto, este trabalho tem como objetivo o desenvolvimento de um sistema capaz de classificar documentos institucionais da Universidade Estadual do Piauí (UESPI), de acordo com seu determinado tipo. A base de dados, inicialmente, estava dispostas de arquivos PDFs possuindo a foto do documento físico. Para o reconhecimento dos textos contidos nas imagens, foi utilizado o software Tesseract com algumas técnicas de processamentos de imagens, a fim de melhorar o desempenho da extração dos textos. A partir disso, foi construído uma base de dados com as informações textuais dos documentos e sua classe correspondente. Após a definição da base de dados, foi realizado o pré-processamento utilizando técnicas de processamento de linguagem natural, preparando para as fases de classificação. A fase de classificação se deu por duas camadas de identificação, uma através de expressões regulares (buscando localizar o tipo de documento pelo título) e outra utilizando modelos de aprendizado de máquina (analisando o conteúdo textual do texto). Essas camadas funciona com o fluxo de classificação passando primeiro pela expressões regulares, se não conseguir identificar, passa para o modelo classificador. Na aplicação final, foi construído uma API que realiza o processo de classificação eficiente, utilizando tanto as expressões regulares quanto o modelo de aprendizado de máquina com a acurácia de 98% na validação cruzada.", publisher = {Universidade Estadual do Piauí}, scholl = {Bacharelado em Ciências da Computação}, note = {Centro de Ensino - Campus do Interior} }