CIÊNCIA DE DADOS PRÁTICA: PREDIZER O SURGIMENTO DE DIABETES COM BASE EM MEDIDAS DE DIAGNÓSTICOS
Resumo
Este artigo descreve a resolução de um problema onde o conjunto de dados (dataset) chama-se Pima Indians Diabetes e está disponível na plataforma Kaggle. O problema é apresentado e resolvido no canal do YouTube do projeto de extensão Ciência de Dados Pr ática, e disponibilizados documentos detalhando esta resolução no Github. O problema é solucionado usando um algoritmo de aprendizagem supervisionada conhecido como k-vizinhos mais próximos(k-nearest neighbors – k-NN) para classificar se uma determinada amostra do nosso conjunto de dados é de uma pessoa diabética ou não diabética. Ao final são aplicadas métricas de avaliaão de modelos para medir o desempenho final do nosso modelo de predição.Publicado
2015-09-09
Edição
Seção
Encontros Universitários 2018 - Campus Quixadá
Licença
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.