Data analysis and machine learning techniques in the analysis of car sales in Brazil during the Covid-19 pandemic

Authors

DOI:

https://doi.org/10.22279/navus.2022.v12.p01-24.1717

Keywords:

Covid-19, machine learning, regression, vehicles.

Abstract

This study aims to analyze the impacts of Covid-19 on vehicle sales in Brazil, correlating these factors with semiconductors imports and economic indicators using Machine Learning models. For this, a collection and preparation of data took place before performing the exploratory analysis, and the developing of   predictive models. This work is characterized as an applied and exploratory research, with a quantitative approach. The Python language was used to perform exploratory analysis and to create the models. The data used in this study were collected from multiples sources of private companies, government, associations and research institutes. Three regression algorithms were used: Random Forest, Multi-Layer Perceptron and Multiple Linear Regression. The neural network presented the best results among the applied algorithms, reaching an R² of 82.01% in the test data set. After the exploratory analysis, we also noticed the high impact that semiconductors have on vehicle sales and the drastic effects caused by Covid-19 on the variables used in the study. With the model created, it is possible to predict the sales of vehicles in Brazil in a given month based on some economic indicators, semiconductor imports and the monthly deaths of Covid-19.

Downloads

Download data is not yet available.

References

ADVFN. Portal de investimentos em ações da bolsa de valores do Brasil, com cotações da Bovespa e BM&F. Disponível em: https://br.advfn.com/. Acessado em: 31 jan. 2022.

AMARAL, Lilian. 8 indicadores econômicos para monitorar e usar no planejamento orçamentário. [2018]. Disponível em: https://www.treasy.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.

ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Anuário. São Paulo: ANFAVEA, 2020.

ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Produção de automóveis tem nova queda pela falta de semicondutores. Estoques são os menores das últimas duas décadas. São Paulo: ANFAVEA, 2021.

BERTO, Rosa Maria Villares.; NAKANO, Davi Noboru. Um Levantamento de Métodos e Tipos de Pesquisa. Produção Científica nos Anais do Encontro Nacional de Engenharia de Produção. Produção, v. 9, n. 2, p. 65-76, 2000.

BOSQUEEROLLI, Arthur Marti; FUJARRA, Bruno Henrique; KESSEY, Getúlio Antônio Brandalise Rodrigues; Colaço, HENRIQUE, Malicheski; OLIVEIRA, Henrique Vinícius de; SANTOS, Laura Carvalho Gomes dos; SARRES, Lucas Silva; ALENCASTRO, Matheus Fiuza de; TAO, Matheus Itiro de Castro; VIEIRA, Natalia Podbevsek; NIRO, Raul de Carvalho. Brasil e o mundo diante da Covid-19 e da crise econômica. Curitiba: Universidade Federal do Paraná, 2020.

BRUCE, Peter; BRUCE, Andrew. Practical Statistics for Data Scientists. New York, O’Reilly, 2017.

CID, Allend Hector. Machine Learning: Catalisador da ciência. Chile: Pontificia Universidad Católica de Valparaíso, 2019.

CIHI – CANADIAN INSTITUTE FOR HEALTH INFORMATION. Health indicators. Disponível em: https://www.cihi.ca/en/health-indicators. Acesso em: 19 dez. 2021.

CILO, Nelson. COVID-19: Setor automobilístico vai levar três anos para se recuperar. [2020]. Disponível em: https://www.em.com.br/app/noticia/economia/2020/04/27/internas_economia,1142056/Covid -19-setor-automobilistico-vai-levar-tres-anos-para-se-recuperar.shtml. Acesso em: 02 ago.2021.

COELHO, Carolina Gomes; PILECCO, Flávia Bulegon. Indicadores de saúde e testagem para Covid-19. Salvador: Universidade Federal da Bahia, 2020.

DANTAS, Elias F. Redes Neurais Artificias Aplicadas à Previsão de Surtos de Leptospirose. 2018. TCC (Bacharelado em Sistemas de Informação) — Universidade Federal Rural de Pernambuco, Serra Talhada, 2018.

DMITRIEVSKY, Maxim. Floresta de decisão aleatória na aprendizagem por reforço.

. Disponível em: https://www.mql5.com/pt/articles/3856. Acesso em: 20 de ago. de

FENABRAVE. Anuário 2020: O desempenho da Distribuição Automotiva no Brasil. São Paulo: FENABRAVE, 2020. Disponível em: http://www.fenabrave.org.br/anuarios/Anuario2013.pdf. Acessado em: 31 jan. 2022.

FERNANDES, Fernando Timoteo; OLIVEIRA, Tiago Almeida de; TEIXEIRA, Cristiane Esteves; BATISTA, Andre Filipe de Moraes; COSTA, Gabriel Dalla; CHIAVEGATTO FILHO, Alexandre Dias Porto. A multipurpose machine learning approach to predict COVID-19 negative prognosis. Nature, 2021. DOI 10.1038/s41598-021-82885-y. Disponível em: https://www.nature.com/articles/s41598-021-82885-y#citeas. Acesso em: 30 set. 2021.

FGV. Portal FGV - índices. Disponível em: https://portalibre.fgv.br/?utm_source=portal-fgv&utm_medium=menu-indices&utm_campaign=portal-fgv-menu-indices. Acessado em: 31 jan. 2022.

GÉRON, Aurélien. Hands-On Machine Learning With Scikit-Learn and TensorFlow. New York: O’Reilly, 2017.

HARRISON, Matt. Machine Learning Pocket Reference: Working with structured Data in Python. New York: O’Reilly, 2019.

HE, Chen; HU, Hanbin; LI, Peng. Applications for Machine Learning in Semiconductor Manufacturing and Test. In: IEEE ELECTRON DEVICES TECHNOLOGY & MANUFACTURING CONFERENCE (EDTM), 5., 2021. Proceedings [...]. USA/CANADA: IEEE, 2021. DOI 10.1109/EDTM50988.2021.9420935. Disponível em: https://ieeexplore.ieee.org/document/9420935. Acesso em: 30 set. 2021.

IBGE - INSTITURO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa Industrial Mensal – Produção Física – Brasil. Rio de Janeiro: IBGE, 2020.

IPEA – INSTITUO DE PESQUISA ECONÔMICA APLICADA. Carta de Conjuntura – Impactos da pandemia sobre os resultados recentes das contas públicas. Brasil: IPEA, 2021.

JAIN, Deepak. Machine Learning, R-Squared in Regression Analysis. [2019]. Disponível em: https://www.geeksforgeeks.org/ml-r-squared-in-regression-analysis/. Acesso em: 23 ago. 2021.

JUSBRASIL, Salário Mínimo. Disponível em: https://www.jusbrasil.com.br/busca?q=sal%C3%A1rio+m%C3%ADnimo. Acesso em: 23 ago. 2021.

KIRSCH, Daniel; HURWITZ, Judith. Machine learning for dummies. Hoboken: IBM, 2018.

LACERDA, Rogério Tadeu de Oliveira; ENSSLIN, Leonardo; ENSSLIN, Sandra Rolim. Uma análise bibliométrica da literatura sobre estratégia e avaliação de desempenho. Gestão & Produção, v. 19, n. 1, p. 59-78, 2012.

LACONSKI, Alisson. Índices econômicos, para que servem e outros. [2019]. Disponível em: https://www.guiabanco.com.br/indicadores-economicos.html. Acesso em: 20 ago. 2021.

LEITE, Vitor. O que é balança comercial e o que impacta esse resultado? [2020]. Disponível em: https://blog.nubank.com.br/balanca-comercial-o-que-e/. Acesso em: 23 ago. 2021.

LEMOS, Arthur D. Quais são os indicadores econômicos mais importantes? [2019]. Disponível em: https://empreenderdinheiro.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.

LIBERT, Barry; BECK, Megan. The machine learning race is really a data race. [2018]. Disponível em: https://sloanreview.mit.edu/article/the-machine-learning-race-is-really-a-data-race/. Acesso em: 02 ago. 2021.

LORENZI, Larissa. Ciência de dados x análise de dados: quais as diferenças? [2021]. Disponível em: https://blog.indicium.tech/diferencas-entre-ciencia-de-dados-e-analise-de-dados/. Acesso em: 20 ago. 2021.

MARR, Bernard. 20 fatos sobre a internet que você não sabe. [2015]. Disponível em: https://forbes.com.br/fotos/2015/10/20-fatos-sobre-a-internet-que-voce-provavelmente-nao-sabe. Acesso em: 02 ago. 2021.

MARTINS, Roberto Antônio. Guia para elaboração de monografia e TCC em Engenharia de produção. São Paulo: Editora Atlas, 2014.

MINISTÉRIO DA ECONOMIA. Gabinete do Ministro. Portaria 20.809, de 14 de setembro de 2020. Lista os setores da economia mais impactados pela pandemia após a decretação da calamidade pública decorrente do Covid-19. 2020. Disponível em: https://www.in.gov.br/en/web/dou/-/portaria-n-20.809-de-14-de-setembro-de-2020-277430324. Acesso em: 31 jan. 2022.

NOGUEIRA, Hugo Clapton. Indicadores econômicos: a definição e o uso do índice de movimentação econômica. 2012. Monografia (Graduação) — Universidade Estadual do Sudoeste da Bahia, Vitoria da Conquista, 2012.

NOGUERIA, Olivia. 90% dos dados no mundo foram criados apenas nos dois últimos anos. [2019]. Disponível em: https://www.jornalopcao.com.br/ultimas-noticias/90-dos-dados-no-mundo-foram-criados-apenas-nos-dois-ultimos-anos-diz-google-207812/. Acesso em: 02 ago. 2021.

PAOLANTI, Marina; MANCINI, Adriano; ROMEO, Luca; FRONTONI, Emanuele. Machine learning approach for predictive maintenance in industry 4.0. In: IEEE/ASME INTERNATIONAL CONFERENCE ON MECHTRONIC AND EMBEDDED SYSTEMS AND APPLICATIONS, 14., 2018, Oulu. Proceedings [...]. Oulu: IEEE, 2018. DOI 10.1109/MESA.2018.8449150. Disponível em: https://ieeexplore.ieee.org/document/8449150. Acesso em: 20 ago. 2021.

PENN, Malcom. Why Didi the Covid-19 pandemic lead to semiconductor shortages? Disponível em: https://newseu.cgtn.com/news/2021-09-05/Why-did-the-COVID-19-pandemic-lead-to-semiconductor-shortages--13gl7OiynEA/index.html. Acesso em: 19 dez.2021.

PENUMURU, Durga Prasad; MUTHUSWAMY, Sreekumar; KARUMBU, Premkumar. Identification and classification of materials using machine vision and machine learning in the context of industry 4.0. Journal of Intelligent Manufacturing, n. 31, p. 1229-1242, 2020.

PEREIRA, Eduardo Lacerda. Aplicação de um modelo de aprendizado de máquina para previsão do desgaste de fresas de topo esférico. 2020. TCC (Graduação em Engenharia da Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2020.

PERES, Ricardo Silva; BARATA, Jose; LEITAO, Paulo; GARCIA, Gisele. Multistage Quality Control Using Machine Learning in the Automotive Industry. IEEE Access, v. 7, 2019. DOI 10.1109/ACCESS.2019.2923405. Disponível em: https://ieeexplore.ieee.org/document/8737933. Acesso em: 20 ago. 2021.

RIAHI, Youssra; RIAHI, Sara. Big Data Analytics: Concepts, Types and Technologies. International Journal of Research and Engineering, v. 5, n. 9, p. 524-528, 2018. DOI 10.21276/ijre.2018.5.9.5. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 20 ago. 2021.

ROCHA, Ricardo. R vs Python: Uma análise desapaixonada. [2020]. Disponível em; https://www.flai.com.br/ricardo/r-vs-python-uma-analise-desapaixonada/. Acesso em: 19 ago. 2021.

RODRIGUES, Gleyson. O que são indicadores econômicos? Para que servem? [2021]. Disponível em: https://guiabancario.com.br/o-que-sao-indicadores-economicos/. Acesso em: 20 ago. 2021.

ROZANEC, Joze M; KAZIC, Blaz; SKRJANC, Maja; FORTUNA, Blaz; MLADENIC, Dunja. Automotive OEM Demand Forecasting: A comparative Study of Forecasring Algoriths and Strategies. Applied Sciences, v. 11, n. 15, 2021. DOI 10.3390/app11156787. Disponível em: https://www.mdpi.com/2076-3417/11/15/6787. Acesso em: 20 ago. 2021.

SANTOS, Valter Barbosa. Estimação e previsão de produtividade de soja por redes neurais no MATOPIBA. 2020. Dissertação (Mestrado em Agronomia) — Universidade Estadual Paulista, Jaboticabal, 2020.

SEYMOUR, Geisser, Predictive Inference: an introduction. New York: Chapman & Hall, 2016.

SIERRA, Jaime Barco. Como o machine learning é afetado pela Covid-19: Análise de dados e modelos preditivos em um cenário atípico. Belo Horizonte: Tatic, 2021.

SILVA, Ivan Nunes; SPATTI, Danilo Hernane.; FLAUZINO, Rogério Andrade. Redes neurais artificias para Engenharia e Ciências Aplicadas: fundamentos teóricos e aspectos práticos. 6. ed. São Paulo: Artliber, 2016.

SILVEIRA, Ian Vieira. Modelo de previsão de demanda com o uso de aprendizado supervisionado de máquina: um estudo de caso em uma empresa de varejo. 2019. TCC (Engenharia de Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2019.

SJOBERG, Mark Ludwikowskie Willian. Semiconductor shortage and the U.S. auto industry. [2021]. Disponivel em: https://www.reuters.com/legal/legalindustry/semiconductor-shortage-us-auto-industry-2021-06-22/. Acesso em: 19 dez. 2021.

SOUZA, Alex. Seu primeiro projeto de Machine Learning em Python. [2019]. Disponível em: https://medium.com/blog-do-zouza/seu-primeiro-projeto-de-machine-learning-em-python-passo-a-passo-78c5f7bce22d. Acesso em: 23 ago. 2021.

STUMPF, Kleber. Indicadores Econômicos. [2019]. Disponível em: https://www.topinvest.com.br/indicadores-economicos/. Acesso em: 20 ago. 2021.

TEIXEIRA, Daniel. Inteligência artificial aplicada à pesquisa de mercado e comunicação. Monografia (Especialização em Pesquisa de Mercado Aplicada em Comunicações) — Universidade de São Paulo, São Paulo, 2019.

TIWARI, Upendra Kumar; KHAN, Rijwan. Role of machine learning to predict the outbreak of Covid-19 in India. Journal of Xi’na University of Architecture & Technology, Xi’na, n. 12, p. 2663-2669, 2020.

VERGARA, S. Projetos e Relatórios de Pesquisa em Administração. São Paulo: Atlas, 2000.

WEHLE, Hans Dieter. Machine Learning, Deep Learning, and AI: What’s the difference? [2017]. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 31 jan. 2022.

ZOABI, Yazeed; ROZOV, Shira; SHOMRON, Noam. Machine learning based prediction of COVID-19 diagnosis based on symptoms. Nature, 2021. DOI 10.1038/s41746-020-00372-6. Disponível em: https://www.nature.com/articles/s41746-020-00372-6. Acesso em: 02 ago. 2021.

Published

2022-02-22

Issue

Section

Articles