Análise do Impacto da Pandemia nas Desigualdades Sociais no Enem 2019 e 2020 utilizando Aprendizado de Máquina

Análise do Impacto da Pandemia nas Desigualdades Sociais no Enem 2019 e 2020 utilizando Aprendizado de Máquina

Autores

DOI:

https://doi.org/10.5433/1679-0375.2023.v44.48234

Palavras-chave:

ENEM, aprendizado de máquina, pandemia, desigualdades sociais

Resumo

O ENEM mede a capacidade e conhecimento dos estudantes que estão no ensino médio ou já concluíram. Com as notas obtidas no exame, o estudante pode se inscrever no SISU que é uma das formas de entrar nas universidades públicas. Durante a pandemia, o planejamento das escolas, principalmente as públicas, foi afetado de forma que muitos estudantes desistiram de realizar o ENEM em 2020. Para  identificar o perfil dos inscritos no ENEM e verificar qual parcela foi mais afetada, esta pesquisa  analisa as desigualdades sociais  usando dados do ENEM 2019 e 2020 e métodos de aprendizado de máquina. A metodologia se baseada na análise de agrupamento, onde K-Means foi aplicado, e na classificação de desempenho, onde foram utilizados Random Forest, K-Nearest Neighbors e MultiLayer Perceptron, e o Select K-Best foi empregado para selecionar características. Os resultados do agrupamento geraram  dois grupos, um composto por inscritos com menores condições financeiras e outro com maiores condições. Na classificação, o MultiLayer Perceptron obteve uma precisão de 85,18% para o ano de 2019 e 83,63% para 2020. Os resultados mostraram que a metodologia proposta conseguiu identificar as diferenças entre os inscritos e classificar seu desempenho.

Downloads

Não há dados estatísticos.

Biografia do Autor

Bruno da Silva Macedo, Universidade Estadual de Minas Gerais - UEMG

Estudante, Engenharia de Computação, Universidade Estadual de Minas Gerais, Divinópolis, Minas Gerais, Brasil

Camila Martins Saporetti, Instituto Politécnico - UERJ

DSc. Modelagem Computacional, Depto. Modelagem Computacional, Instituto Politécnico, Universidade do Estado do Rio de Janeiro, Nova Friburgo, Rio de Janeiro, Brasil

Referências

Adeodato, P. J. (2016). Data mining solution for assessing Brazilian secondary school quality based on ENEM and census data. In Contecsi International Conference on Information Systems and Technology Management [Conference]. 13th Contecsi, São Paulo, Brazil. DOI: https://doi.org/10.5748/9788599693124-13CONTECSI/RF-3818

Adeodato, P. J., & Silva, F., R. L. C. (2020). Where to aim? Factors that influence the performance of Brazilian secondary schools. In Anna N. Rafferty, Jacob Whitehill, Violetta Cavalli-Sforza, & Cristobal Romero (Eds.), International Conference on Educational Data Mining (EDM 2020) [Conference]. Proceedings of The 13th International Conference on Educational Data Mining (EDM 2020).

Almeida, D. S. S. (2021). Saúde digital: Predição do risco de reinternação em hospitais universitários federais [Dissertação de Mestrado, Universidade Católica de Brasília]. Biblioteca Digital. https: //bdtd.ucb.br:8443/jspui/bitstream/tede/2838/2/DiegoSouzaSilvaAlmeidaDissertacao2021.pdf

Alves, R. D., Cechinel, C., & Queiroga, E. (2018). Predição do Desempenho de Matemática e Suas Tecnologias do Enem Utilizando Técnicas de Mineração de Dados. In Universidade Federal de São Carlos, Congresso Brasileiro de Informática na Educação [Congresso]. 7º Congresso Brasileiro de Informatica na Educação, São Carlos, Brasil. https://repositorio.ufc.br/bitstream/ riufc/44034/1/2018_eve_rdalves.pdf DOI: https://doi.org/10.5753/cbie.wcbie.2018.469

Ariovaldo, T. C. d. C., & Nogueira, C. M. M. (2018). Nova forma de acesso ao ensino superior público: um estado do conhecimento sobre o Sistema de Seleção Unificada-SISU. Revista Internacional de Educação Superior, 4(1), 152–174. DOI: https://doi.org/10.22348/riesup.v4i1.8650683

Banni, M. R., Oliveira, M. V. d. P., & Bernardini, F. C. (2021). Uma análise experimental usando mineração de dados educacionais sobre os dados do enem para identificação de causas do desempenho dos estudantes. In Sociedade Brasileira de Computação, Anais do II Workshop sobre as Implicações da Computação na Sociedade [Workshop]. 2º Workshop sobre as Implicações da Computação na Sociedade, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/wics/article/view/ 15964 DOI: https://doi.org/10.5753/wics.2021.15964

Breiman, L. (2001). Random forests. Machine learning, 45, 5–32. DOI: https://doi.org/10.1023/A:1010933404324

Carmo, R. V., Heckler, W. F., & Carvalho, J. V. (2020). Uma Análise do Desempenho dos Estudantes do Rio Grande do Sul no ENEM 2019. Renote, 18(2), 378–387. DOI: https://doi.org/10.22456/1679-1916.110257

Cover, T., & Hart, P. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1), 21–27. DOI: https://doi.org/10.1109/TIT.1967.1053964

Cristo, H. S. (2020). A quem serve o Exame Nacional do Ensino Médio em tempos de pandemia da Covid-19 no Brasil? Revista Espaço Acadêmico, 20(224), 262–273. DOI: https://doi.org/10.29276/redapeci.2020.20.314543.72-86

Franco, J. J., de Almeida Miranda, F. L., Stiegler, D., Dantas, F. R., Brancher, J. D., & do Carmo Nogueira, T. (2020). Usando Mineração de Dados para Identificar Fatores mais Importantes do Enem dos Últimos 22 Anos. In Sociedade Brasileira de Computação, Anais do XXXI Simpósio Brasileiro de Informática na Educação [Simpósio]. 31º Simpósio Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.sbie.2020.1112

Gomes, T., Gouveia, R., & Batista, M. C. M. (2017). Dados educacionais abertos: associações em dados dos inscritos do exame nacional do ensino médio. In Sociedade Brasileira de Computação, Anais do XXIII Workshop de Informática na Escola [Workshop]. 23º Workshop de Informática na Escola, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/wie/article/view/16325 DOI: https://doi.org/10.5753/cbie.wie.2017.895

Haykin, S. (2001). Neural networks (2nd ed.). Pearson.

Jain, A. K., & Dubes, R. C. (1988). Algorithms for clustering data. Prentice-Hall.

Lima, M. A., Ferreira, G. G., Oliveira, L. L. C., Diniz, R. F. S., & Ferreira, C. B. (2016). Uso de redes neurais artificiais (RNA) do tipo multilayer perceptrons (MLP) modificado com processamento estatístico em paralelo para estudo do problema de classificação da origem de vinho tinto. Revista Brasileira de Agropecuária Sustentável, 6(2), 58– 65. DOI: https://doi.org/10.21206/rbas.v6i2.282

Maciel, A., Vinhas, L., & Câmara, G. (2015). Algoritmos de clustering para separação de culturas agrícolas e tipos de uso e cobertura da Terra utilizando dados de sensoriamento remoto. In Anais XVII Simposio Brasileiro de Sensoriamento Remoto (SBSR) [Simpósio]. 17º Simpósio Brasileiro de Sensoriamento Remoto, João Pessoa, Brasil.

Maia, M. M., de Andrade, L. H. F., & Fernandes, S. (2021). K-means na análise de características socioeconômicas de candidatos ao ensino superior. In Universidade Federal Rural do Semi-Árido, Anais do Encontro de Computação do Oeste Potiguar ECOP/UFERSA [Anais]. 2º Encontro de Computação do Oeste Potiguar - Pocket, Pau dos Ferros, Brasil. https://periodicos.ufersa.edu. br/ecop/article/view/11168

Oxford, R. M., & Daniel, L. G. (2001). Basic CrossValidation: Using the" Holdout" Method To Assess the Generalizability of Results. Research in the Schools, 8(1), 83–89. Palma, L. (2018). Agrupamento de dados: k-médias. [Trabalho de Conclusão de Curso, Universidade Federal do Recôncavo da Bahia]. https://www2.ufrb.edu.br/bcet/components/com_chronoforms5/chronoforms/uploads/tcc/20190604200511_2018.2_TCC_Luann_Farias_Palma-_Agrupamento_de_dados_-_K_medias.pdf

Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65. DOI: https://doi.org/10.1016/0377-0427(87)90125-7

Santos, J. M. C. T. (2011). Exame Nacional do Ensino Médio: entre a regulação da qualidade do Ensino Médio e o vestibular. Educar em Revista, (40), 195–205. DOI: https://doi.org/10.1590/S0104-40602011000200013

Silva, L. A., Morino, A. H., & Sato, T. M. C. (2014). Prática de mineração de dados no Exame Nacional do Ensino Médio. In Sociedade Brasileira de Computação, Anais dos Workshops do Congresso Brasileiro de Informatica na Educação [Workshops]. 3º Congresso Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.wcbie.2014.651

Silva, V. A. A., Moreno, L. L. O., Gonçalves, L. B., Soares, S. S. R. F., & Souza, R. R. J. (2020). Identificação de Desigualdades Sociais a partir do desempenho dos alunos do Ensi Médio no ENEM 2019 utilizando Mineração de Dados. In Sociedade Brasileira de Computação, Anais do Simpósio Brasileiro de informática na Educação [Anais]. 31º Simpósio Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.sbie.2020.72

Simon, A., & Cazella, S. (2017). Mineração de dados educacionais nos resultados do ENEM de 2015. In Anais dos Workshops do Congresso Brasileiro de Informática na Educação [Workshops]. 6º Congresso Brasileiro de Informática na Educação, Porto Alegre, Brasil. DOI: https://doi.org/10.5753/cbie.wcbie.2017.754

Sinaga, K. P., & Yang, M.-S. (2020). Unsupervised Kmeans clustering algorithm. IEEE Access, 8, 80716–80727. DOI: https://doi.org/10.1109/ACCESS.2020.2988796

Souza, I. A., Barreto, T. B., & Esquerre, K. P. S. O. R. (2019). Modelo de interpretabilidade local pautado em random forest para classificação de usos domésticos de água. Revista do Seminário Internacional de Estatística com R, 4(1), 12.

Stearns, B., Rangel, F., Firmino, F., Rangel, F., & Oliveira, J. (2017). Prevendo desempenho dos candidatos do ENEM através de dados socioeconômicos. In Anais do Concurso de Trabalhos de Iniciação Científica da SBC [Anais]. 36º Concurso de Trabalhos de Iniciação Científica da SBC, Porto Alegre, Brasil. https://sol.sbc.org.br/index.php/ctic/ article/view/3244

Viggiano, E., & Mattos, C. (2013). O desempenho de estudantes no Enem 2010 em diferentes regiões brasileiras. Revista Brasileira de Estudos Pedagógicos, 94, 417–438. DOI: https://doi.org/10.1590/S2176-66812013000200005

Weber Neto, N., Soares, R. C., Coutinho, L. R., & Teles, A. S. (2022). Análise exploratória de dados para identificar o impacto da pandemia da COVID19 no ENEM dos estados do Ceará, Maranhão e Piauí. In Sociedade Brasileira de Computação, Anais da Escola Regional de Computação do Ceará, Maranhão e Piauí [Anais]. 10º Escola Regional de Computação do Ceará, Maranhão e Piauí, Porto Alegre, Brasil. https://sol.sbc.org.br/ index.php/ercemapi/article/view DOI: https://doi.org/10.5753/ercemapi.2022.225842

Publicado

2023-11-06

Como Citar

Macedo, B. da S., & Saporetti, C. M. (2023). Análise do Impacto da Pandemia nas Desigualdades Sociais no Enem 2019 e 2020 utilizando Aprendizado de Máquina. Semina: Ciências Exatas E Tecnológicas, 44, e48234. https://doi.org/10.5433/1679-0375.2023.v44.48234

Edição

Seção

Ciência da Computação
Loading...