Aplicando redes neurais para reduzir espaço utilizado no armazenamento de conjuntos de dados
Resumo
Ao trabalhar com Aprendizagem de Máquina, existem casos em que manipular o conjunto de dados pode se tornar trabalhoso ou demorado devido à grande quantidade de informação. Apesar de existirem técnicas de redução de dimensionalidade como a análise de componentes principais ou a análise discriminante linear que podem ser utilizadas para reduzir a quantidade de atributos, elas não são capazes de reduzir o conjunto de dados sem perda de informação. Esse trabalho busca investigar a possibilidade de empregar técnicas que transformam dados de formas que seriam extremamente difíceis de reverter ao combiná-las com o uso de redes neurais para essa restauração dos dados, sem que haja perda de informação. Para isso, foi criada uma prova de conceito utilizando a base de dados clássica de flores Iris. Apesar de não terem sido capazes de restaurar o conjunto de dados original, os modelos testados foram capazes de obter valores muito próximos dos originais. Por se tratar de um estudo inicial, houveram diversas limitações nos testes realizados. Ainda que o objetivo proposto não tenha sido atingido, ficou evidente que ainda existe potencial inexplorado para este conceito.