| Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
https://sistemas2.uespi.br/handle/tede/2264Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Sousa, Luciano Lopes de | - |
| dc.creator.Lattes | https://lattes.cnpq.br/3855612025425114 | por |
| dc.contributor.advisor1 | Sousa, José Vigno Moura | - |
| dc.contributor.referee1 | Sousa, José Vigno Moura | - |
| dc.contributor.referee2 | Campos, Gustavo Augusto Lima | - |
| dc.contributor.referee3 | Costa, Nator Junior Carvalho | - |
| dc.date.accessioned | 2025-07-14T10:43:40Z | - |
| dc.date.issued | 2022 | - |
| dc.identifier.citation | SOUSA, Luciano Lopes de.Classificação automática de documentos utilizando técnicas de inteligência artificial. 2022. 25 f. Artigo (Bacharelado em Ciências da Computação) - Universidade Estadual do Piauí, Piripiri, 2025. | por |
| dc.identifier.uri | http://sistemas2.uespi.br/handle/tede/2264 | - |
| dc.description.resumo | A organização de documentos em uma instituição é de extrema importância, pois traz praticidade e eficiência na recuperação. Separar esses arquivos de acordo com seu tipo de forma manual, ocupa bastante horas de trabalho por parte do profissional responsável. Portanto, este trabalho tem como objetivo o desenvolvimento de um sistema capaz de classificar documentos institucionais da Universidade Estadual do Piauí (UESPI), de acordo com seu determinado tipo. A base de dados, inicialmente, estava dispostas de arquivos PDFs possuindo a foto do documento físico. Para o reconhecimento dos textos contidos nas imagens, foi utilizado o software Tesseract com algumas técnicas de processamentos de imagens, a fim de melhorar o desempenho da extração dos textos. A partir disso, foi construído uma base de dados com as informações textuais dos documentos e sua classe correspondente. Após a definição da base de dados, foi realizado o pré-processamento utilizando técnicas de processamento de linguagem natural, preparando para as fases de classificação. A fase de classificação se deu por duas camadas de identificação, uma através de expressões regulares (buscando localizar o tipo de documento pelo título) e outra utilizando modelos de aprendizado de máquina (analisando o conteúdo textual do texto). Essas camadas funciona com o fluxo de classificação passando primeiro pela expressões regulares, se não conseguir identificar, passa para o modelo classificador. Na aplicação final, foi construído uma API que realiza o processo de classificação eficiente, utilizando tanto as expressões regulares quanto o modelo de aprendizado de máquina com a acurácia de 98% na validação cruzada. | por |
| dc.description.abstract | The organization of documents in an institution is extremely important, as it brings practicality and efficiency in retrieval. Manually separating these files according to their type takes many hours of work on the part of the responsible professional. Therefore, this work aims to develop a system capable of classifying institutional documents of the State University of Piauí (UESPI), according to their specific type. The database, initially, was composed of PDF files with the photo of the physical document. For the recognition of the texts contained in the images, the software Tesseract was used with some image processing techniques, in order to improve the performance of text extraction. From this, a database was built with the textual information of the documents and their corresponding class. After defining the database, pre-processing was performed using natural language processing techniques, preparing for the classification phases. The classification phase was carried out by two layers of classifiers, one through regular expressions (seeking to locate the type of document by the title) and another using machine learning models (analyzing the textual content of the text). These layers work with the classification flow going through the regular expressions first, if it cannot identify, it passes to the classifier model. In the final application, an API was built that performs the efficient classification process, using both regular expressions and the machine learning model with an accuracy of 98% in cross-validation. | eng |
| dc.description.provenance | Submitted by Luciano Lopes (lucianosousa@aluno.uespi.br) on 2025-07-13T20:41:46Z No. of bitstreams: 2 Luciano_TCC_II.pdf: 1247160 bytes, checksum: 56910c3999ae898551bbd96ef5eb4912 (MD5) Termo-de-Autorizacao-repositorio-UESPI_luciano_assinado_assinado.pdf: 1160286 bytes, checksum: bc4266baf34364f4aa99f5437547babb (MD5) | eng |
| dc.description.provenance | Approved for entry into archive by Curadoria Digital Biblioteca Central (repositorioinstitucional@uespi.br) on 2025-07-14T10:43:40Z (GMT) No. of bitstreams: 2 Luciano_TCC_II.pdf: 1247160 bytes, checksum: 56910c3999ae898551bbd96ef5eb4912 (MD5) Termo-de-Autorizacao-repositorio-UESPI_luciano_assinado_assinado.pdf: 1160286 bytes, checksum: bc4266baf34364f4aa99f5437547babb (MD5) | eng |
| dc.description.provenance | Made available in DSpace on 2025-07-14T10:43:40Z (GMT). No. of bitstreams: 2 Luciano_TCC_II.pdf: 1247160 bytes, checksum: 56910c3999ae898551bbd96ef5eb4912 (MD5) Termo-de-Autorizacao-repositorio-UESPI_luciano_assinado_assinado.pdf: 1160286 bytes, checksum: bc4266baf34364f4aa99f5437547babb (MD5) Previous issue date: 2022-08-17 | eng |
| dc.format | application/pdf | * |
| dc.language | por | por |
| dc.publisher | Universidade Estadual do Piauí | por |
| dc.publisher.department | Centro de Ensino - Campus do Interior | por |
| dc.publisher.country | Brasil | por |
| dc.publisher.initials | UESPI | por |
| dc.publisher.program | Bacharelado em Ciências da Computação | por |
| dc.rights | Acesso Aberto | por |
| dc.subject | Inteligência Artificial | por |
| dc.subject | Processamento de Linguagem Natural | por |
| dc.subject | Processamento de Imagens | por |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | por |
| dc.title | Classificação automática de documentos utilizando técnicas de inteligência artificial | por |
| dc.title.alternative | Automatic Document Classification Using Artificial Intelligence Techniques | por |
| dc.type | Artigo | por |
| Aparece nas coleções: | CIES - Bacharelado em Ciências da Computação (Prof. Antônio Giovanni Alves de Sousa – PIRIPIRI) | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Artigo Completo.pdf | 1,22 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
