BALANCEAMENTO DE DADOS EM PROBLEMA DE PREDIÇÃO DE FALHA EM DISCOS RÍGIDOS
Resumo
A capacidade de prever falhas em discos rígidos tornou-se um tópico bastante importante visto que falhas inesperadas podem acarretar em significativas perdas de dados e maior tempo de serviço fora do ar. Atualmente, a maioria dos discos rígidos está equipada com um sistema de monitoramento de falhas denominado Self-Monitoring, Analysis and Reporting Technology (SMART). Este sistema coleta diversos parâmetros relativos ao desempeno do equipamento. Apesar da grande popularidade do sistema SMART, estudos recentes mostram que somente 3\% a 10\% das falhas são identificadas previamente. Com isso muitos trabalhos foram desenvolvidos, mas nenhum deles trata o problema de desbalanceamento de classes através de balanceamento por sobreamostragem de dados. Este trabalho analisa o impacto causado por dados sintéticos gerados por redes generativas adversarias na tarefa de predição de falhas em disco rígido. Com o intuito de corrigir problemas gerados por desbalanceamento de dados. Para demonstração da efetividade do método o mesmo foi comparado com outros três métodos de sobreamostragem em um conjunto contendo dados de 2051 discos rígidos. Os resultados apresentados pela classificação com o método de balanceamento por redes generativas adversarias se mostraram promissores, o número de falhas de discos rígidos detectadas foi maior do que o obtido usando a classificação com o conjunto de dados original enquanto manteve uma acurácia próxima do mesmo.Publicado
2019-01-01
Edição
Seção
XXXVIII Encontro de Iniciação Científica
Licença
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.