Public data Web scraping: method for extraction of data from the public expenditure of the councilors of the city hall of Belo Horizonte
DOI:
https://doi.org/10.5433/1981-8920.2021v26n4p319Keywords:
Artificial Intelligence, Chat Bot, Government Data, Open Data, Web ScrapingAbstract
Objective: Demonstration of the Web Scraping method in Python capable of extracting and transforming the unstructured Parliamentary Costing data from the transparency portal, of the Belo Horizonte City Hall, into structured open data.
Methodology: It is governed by a bibliographic search of Public Data from the Municipality of Belo Horizonte (CMBH), from the point of view of Open Data in the context of LAI and qualitative analysis in the extraction of data via Web Scraping.
Results: Efficacy of the Web Scraping method in data extraction and transformation into structured open data, which allows data sharing, enabling the production of new solutions, the Chat Bot Sumé prototype, presented in this work.
Conclusion: Efficacy of the new method of Web Scraping for data extraction, followed by manipulation to transform them into Open Data as well as presentation of the prototype Chat Bot Sumé.
Downloads
References
ASSIS, W. V. Chat Bot Sumé: web scraping em dados governamentais para consulta de gastos públicos dos vereadores da Câmara Municipal de Belo Horizonte. Dissertação (Mestrado em Sistemas de Informação e Gestão do Conhecimento) – Faculdade de Ciências Empresariais, Universidade Fumec, Belo Horizonte, p. 90. 2021.
BARDIN, L. Análise de conteúdo. São Paulo: Edições 70, 2011. BERNERS-LEE, T. Linked Data. 2009. Disponível em: https://www.w3.org/DesignIssues/LinkedData.html. Acesso em: 18 ago. 2020.
BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Presidência da República. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2011- 2014/2011/lei/l12527.htm. Acesso em: 05 set. 2020.
CÂMARA MUNICIPAL DE BELO HORIZONTE – CMBH, 2020a. Transparência. Belo Horizonte, 07 jul 2020. Disponível em: https://www.cmbh.mg.gov.br/transparencia-principal. Acesso em: 20 jun 2020.
CÂMARA MUNICIPAL DE BELO HORIZONTE – CMBH, 2020b. Custeio Parlamentar, 2020. Belo Horizonte, 07 jul 2020. Disponível em: https://www.cmbh.mg.gov.br/perguntas-frequentes/vereadores-sal%C3%A1riopresen%C3%A7a-custeio-do-mandato-gabinetes/como-s%C3%A3o-custeadosos. Acesso em: 20 jun2020.
DIOUF, R.; SARR, E. N.; SALL, O.; BIRREGAH, B.; BOUSSO, M.; MBAYE, S. N. Web Scraping: State-of-the-Art and Areas of Application. In: IEEE INTERNATIONAL CONFERENCE ON BIG DATA, 7., Los Angeles, CA, USA, 2019. Proceedings […] Los Angeles: IEEE, 2019. p. 6040-6042, doi: 10.1109/BigData47090.2019.9005594.
EAVES, D. The Three Laws of Open Government Data, 2009. Disponível em: http://eaves.ca/2009/09/30/three-law-of-open-government-data/. Acesso em: 3 dez. 2020.
GIL, A. C. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2007.
HERNÁNDEZ, A.; GÓMEZ VÁZQUEZ, E.; RINCÓN, C. A. B.; GARCÍA, J. M.; MALDONADO, A. C.; IBARRA-OROZCO, R. Metodologías para análisis político utilizando Web Scraping. Research in Computing Science, [S. l.], v. 95, p. 113-121, 2015. DOI: 10.13053/rcs-95-1-9.
LOPES, K. M. G.; ASSUMPÇÃO, R. C. Processos e solução tecnológica para implementação da lei de acesso à informação. In: CONGRESSO CONSAD DE GESTÃO PÚBLICA, 6., Brasília, 2013. Anais [...] Brasília: 2013.
MATTOSINHO, F. J. A. P. Thesis on Mining Product Opinions and Reviews on the Web. Technische Universitat Dresden ,2010.
OPEN GOVERNMENT PARTNERSHIP (OGP). Declaração de governo aberto, 2011. Disponível em: www.opengovpartnership.org/open-governmentdeclaration. Acesso em: 10 set. 2020.
PANDAS. About Pandas. Disponível em: https://pandas.pydata.org/about/. Acesso em: 8 de jun. 2020.
PYTHON SOFTWARE FOUNDATION. What is python? 2001. Disponível em: https://docs.python.org/3/faq/general.html#what-is-python. Acesso em: 18 ago. 2020.
RODRIGUES, J. C.; FONTES, C. Estudo de Caso “Operação Serenata de Amor”: a análise de Big Data no combate à festa dos gastos públicos. In: CONGRESO DE LA ASOCIACIÓN LATINOAMERICANA DE INVESTIGADORES DE LA COMUNICACIÓN, 14., San Pedro, 2018. Anais [...] San Pedro: Universidade da Costa Rica, 2018.Disponível em: https://www.researchgate.net/publication/323585318_Estudo_de_Caso_Operac ao_Serenata_de_Amor_a_analise_de_Big_Data_no_combate_a_festa_dos_ga stos_publicos. Acesso em: 18 out. 2020.
SÁ, M. I. F.; MALIN, A. M. B. Lei de Acesso à Informação: Um Estudo Comparativo com Outros Países. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13., Rio de Janeiro, 2012. Anais [...] Rio de Janeiro: Fio Cruz, 2012.
YAZIGI, A. F. Dinero, política y transparencia: el imperativo democrático de combatir la corrupción. INTERNATIONAL ANTI-CORRUPTION CONFERENCE, 9., África do Sul, 1999. Anais […]. África do Sul, 1999. p. 10- 15
Downloads
Published
How to Cite
Issue
Section
License
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário.
O conteúdo dos textos e a citação e uso de imagens submetidas são de inteira responsabilidade dos autores.
Em todas as citações posteriores, deverá ser consignada a fonte original de publicação, no caso a Informação & Informação.