Análise do Impacto da Pandemia nas Desigualdades Sociais no Enem 2019 e 2020 utilizando Aprendizado de Máquina
DOI:
https://doi.org/10.5433/1679-0375.2023.v44.48234Palavras-chave:
ENEM, aprendizado de máquina, pandemia, desigualdades sociaisResumo
O ENEM mede a capacidade e conhecimento dos estudantes que estão no ensino médio ou já concluíram. Com as notas obtidas no exame, o estudante pode se inscrever no SISU que é uma das formas de entrar nas universidades públicas. Durante a pandemia, o planejamento das escolas, principalmente as públicas, foi afetado de forma que muitos estudantes desistiram de realizar o ENEM em 2020. Para identificar o perfil dos inscritos no ENEM e verificar qual parcela foi mais afetada, esta pesquisa analisa as desigualdades sociais usando dados do ENEM 2019 e 2020 e métodos de aprendizado de máquina. A metodologia se baseada na análise de agrupamento, onde K-Means foi aplicado, e na classificação de desempenho, onde foram utilizados Random Forest, K-Nearest Neighbors e MultiLayer Perceptron, e o Select K-Best foi empregado para selecionar características. Os resultados do agrupamento geraram dois grupos, um composto por inscritos com menores condições financeiras e outro com maiores condições. Na classificação, o MultiLayer Perceptron obteve uma precisão de 85,18% para o ano de 2019 e 83,63% para 2020. Os resultados mostraram que a metodologia proposta conseguiu identificar as diferenças entre os inscritos e classificar seu desempenho.
Downloads
Referências
Adeodato, P. J. (2016). Data mining solution for assessing Brazilian secondary school quality based on ENEM and census data. In Contecsi International Conference on Information Systems and Technology Management [Conference]. 13th Contecsi, São Paulo, Brazil. DOI: https://doi.org/10.5748/9788599693124-13CONTECSI/RF-3818
Adeodato, P. J., & Silva, F., R. L. C. (2020). Where to aim? Factors that influence the performance of Brazilian secondary schools. In Anna N. Rafferty, Jacob Whitehill, Violetta Cavalli-Sforza, & Cristobal Romero (Eds.), International Conference on Educational Data Mining (EDM 2020) [Conference]. Proceedings of The 13th International Conference on Educational Data Mining (EDM 2020).
Almeida, D. S. S. (2021). Saúde digital: Predição do risco de reinternação em hospitais universitários federais [Dissertação de Mestrado, Universidade Católica de Brasília]. Biblioteca Digital. https: //bdtd.ucb.br:8443/jspui/bitstream/tede/2838/2/DiegoSouzaSilvaAlmeidaDissertacao2021.pdf
Alves, R. D., Cechinel, C., & Queiroga, E. (2018). Predição do Desempenho de Matemática e Suas Tecnologias do Enem Utilizando Técnicas de Mineração de Dados. In Universidade Federal de São Carlos, Congresso Brasileiro de Informática na Educação [Congresso]. 7º Congresso Brasileiro de Informatica na Educação, São Carlos, Brasil. https://repositorio.ufc.br/bitstream/ riufc/44034/1/2018_eve_rdalves.pdf DOI: https://doi.org/10.5753/cbie.wcbie.2018.469
Ariovaldo, T. C. d. C., & Nogueira, C. M. M. (2018). Nova forma de acesso ao ensino superior público: um estado do conhecimento sobre o Sistema de Seleção Unificada-SISU. Revista Internacional de Educação Superior, 4(1), 152–174. DOI: https://doi.org/10.22348/riesup.v4i1.8650683
Banni, M. R., Oliveira, M. V. d. P., & Bernardini, F. C. (2021). Uma análise experimental usando mineração de dados educacionais sobre os dados do enem para identificação de causas do desempenho dos estudantes. In Sociedade Brasileira de Computação, Anais do II Workshop sobre as Implicações da Computação na Sociedade [Workshop]. 2º Workshop sobre as Implicações da Computação na Sociedade, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/wics/article/view/ 15964 DOI: https://doi.org/10.5753/wics.2021.15964
Breiman, L. (2001). Random forests. Machine learning, 45, 5–32. DOI: https://doi.org/10.1023/A:1010933404324
Carmo, R. V., Heckler, W. F., & Carvalho, J. V. (2020). Uma Análise do Desempenho dos Estudantes do Rio Grande do Sul no ENEM 2019. Renote, 18(2), 378–387. DOI: https://doi.org/10.22456/1679-1916.110257
Cover, T., & Hart, P. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1), 21–27. DOI: https://doi.org/10.1109/TIT.1967.1053964
Cristo, H. S. (2020). A quem serve o Exame Nacional do Ensino Médio em tempos de pandemia da Covid-19 no Brasil? Revista Espaço Acadêmico, 20(224), 262–273. DOI: https://doi.org/10.29276/redapeci.2020.20.314543.72-86
Franco, J. J., de Almeida Miranda, F. L., Stiegler, D., Dantas, F. R., Brancher, J. D., & do Carmo Nogueira, T. (2020). Usando Mineração de Dados para Identificar Fatores mais Importantes do Enem dos Últimos 22 Anos. In Sociedade Brasileira de Computação, Anais do XXXI Simpósio Brasileiro de Informática na Educação [Simpósio]. 31º Simpósio Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.sbie.2020.1112
Gomes, T., Gouveia, R., & Batista, M. C. M. (2017). Dados educacionais abertos: associações em dados dos inscritos do exame nacional do ensino médio. In Sociedade Brasileira de Computação, Anais do XXIII Workshop de Informática na Escola [Workshop]. 23º Workshop de Informática na Escola, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/wie/article/view/16325 DOI: https://doi.org/10.5753/cbie.wie.2017.895
Haykin, S. (2001). Neural networks (2nd ed.). Pearson.
Jain, A. K., & Dubes, R. C. (1988). Algorithms for clustering data. Prentice-Hall.
Lima, M. A., Ferreira, G. G., Oliveira, L. L. C., Diniz, R. F. S., & Ferreira, C. B. (2016). Uso de redes neurais artificiais (RNA) do tipo multilayer perceptrons (MLP) modificado com processamento estatístico em paralelo para estudo do problema de classificação da origem de vinho tinto. Revista Brasileira de Agropecuária Sustentável, 6(2), 58– 65. DOI: https://doi.org/10.21206/rbas.v6i2.282
Maciel, A., Vinhas, L., & Câmara, G. (2015). Algoritmos de clustering para separação de culturas agrícolas e tipos de uso e cobertura da Terra utilizando dados de sensoriamento remoto. In Anais XVII Simposio Brasileiro de Sensoriamento Remoto (SBSR) [Simpósio]. 17º Simpósio Brasileiro de Sensoriamento Remoto, João Pessoa, Brasil.
Maia, M. M., de Andrade, L. H. F., & Fernandes, S. (2021). K-means na análise de características socioeconômicas de candidatos ao ensino superior. In Universidade Federal Rural do Semi-Árido, Anais do Encontro de Computação do Oeste Potiguar ECOP/UFERSA [Anais]. 2º Encontro de Computação do Oeste Potiguar - Pocket, Pau dos Ferros, Brasil. https://periodicos.ufersa.edu. br/ecop/article/view/11168
Oxford, R. M., & Daniel, L. G. (2001). Basic CrossValidation: Using the" Holdout" Method To Assess the Generalizability of Results. Research in the Schools, 8(1), 83–89. Palma, L. (2018). Agrupamento de dados: k-médias. [Trabalho de Conclusão de Curso, Universidade Federal do Recôncavo da Bahia]. https://www2.ufrb.edu.br/bcet/components/com_chronoforms5/chronoforms/uploads/tcc/20190604200511_2018.2_TCC_Luann_Farias_Palma-_Agrupamento_de_dados_-_K_medias.pdf
Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65. DOI: https://doi.org/10.1016/0377-0427(87)90125-7
Santos, J. M. C. T. (2011). Exame Nacional do Ensino Médio: entre a regulação da qualidade do Ensino Médio e o vestibular. Educar em Revista, (40), 195–205. DOI: https://doi.org/10.1590/S0104-40602011000200013
Silva, L. A., Morino, A. H., & Sato, T. M. C. (2014). Prática de mineração de dados no Exame Nacional do Ensino Médio. In Sociedade Brasileira de Computação, Anais dos Workshops do Congresso Brasileiro de Informatica na Educação [Workshops]. 3º Congresso Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.wcbie.2014.651
Silva, V. A. A., Moreno, L. L. O., Gonçalves, L. B., Soares, S. S. R. F., & Souza, R. R. J. (2020). Identificação de Desigualdades Sociais a partir do desempenho dos alunos do Ensi Médio no ENEM 2019 utilizando Mineração de Dados. In Sociedade Brasileira de Computação, Anais do Simpósio Brasileiro de informática na Educação [Anais]. 31º Simpósio Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.sbie.2020.72
Simon, A., & Cazella, S. (2017). Mineração de dados educacionais nos resultados do ENEM de 2015. In Anais dos Workshops do Congresso Brasileiro de Informática na Educação [Workshops]. 6º Congresso Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.wcbie.2017.754
Sinaga, K. P., & Yang, M.-S. (2020). Unsupervised Kmeans clustering algorithm. IEEE Access, 8, 80716–80727. DOI: https://doi.org/10.1109/ACCESS.2020.2988796
Souza, I. A., Barreto, T. B., & Esquerre, K. P. S. O. R. (2019). Modelo de interpretabilidade local pautado em random forest para classificação de usos domésticos de água. Revista do Seminário Internacional de Estatística com R, 4(1), 12.
Stearns, B., Rangel, F., Firmino, F., Rangel, F., & Oliveira, J. (2017). Prevendo desempenho dos candidatos do ENEM através de dados socioeconômicos. In Anais do Concurso de Trabalhos de Iniciação Científica da SBC [Anais]. 36º Concurso de Trabalhos de Iniciação Científica da SBC, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/ctic/ article/view/3244
Viggiano, E., & Mattos, C. (2013). O desempenho de estudantes no Enem 2010 em diferentes regiões brasileiras. Revista Brasileira de Estudos Pedagógicos, 94, 417–438. DOI: https://doi.org/10.1590/S2176-66812013000200005
Weber Neto, N., Soares, R. C., Coutinho, L. R., & Teles, A. S. (2022). Análise exploratória de dados para identificar o impacto da pandemia da COVID19 no ENEM dos estados do Ceará, Maranhão e Piauí. In Sociedade Brasileira de Computação, Anais da Escola Regional de Computação do Ceará, Maranhão e Piauí [Anais]. 10º Escola Regional de Computação do Ceará, Maranhão e Piauí, Porto Alegre, Brasil. https://sol.sbc.org.br/ index.php/ercemapi/article/view DOI: https://doi.org/10.5753/ercemapi.2022.225842
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2023 Bruno da Silva Macedo, Camila Martins Saporetti
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
Os Direitos Autorais para artigos publicados nesta revista são de direito do autor. Em virtude de aparecerem nesta revista de acesso público, os artigos são de uso gratuito, com atribuições próprias, em aplicações educacionais e não-comerciais. A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário. Nesses casos, os artigos, depois de adequados, deverão ser submetidos a nova apreciação. As opiniões emitidas pelos autores dos artigos são de sua exclusiva responsabilidade.
Esta obra está licenciada com uma Licença Creative Commons Atribuição-NãoComercial 4.0 Internacional.