Técnicas de análise de dados e machine learning na análise de vendas de autoveículos no Brasil durante a pandemia da Covid-19

Autores

DOI:

https://doi.org/10.22279/navus.2022.v12.p01-24.1717

Palavras-chave:

covid-19, machine learning, regressão, autoveículos.

Resumo

O presente estudo tem como objetivo analisar os impactos da Covid-19 nas vendas de autoveículos no Brasil, correlacionando esses fatores com as importações de semicondutores e indicadores econômicos através de modelos de Machine Learning. Para isso, ocorreu uma coleta e preparação de dados antes de ser executada a análise exploratória, para em seguida, serem desenvolvidos os modelos preditivos. Este trabalho se caracteriza como uma pesquisa aplicada e exploratória, com uma abordagem quantitativa. A análise exploratória e a criação dos modelos foram executadas na linguagem Python. Os dados utilizados no estudo foram coletados de múltiplas fontes de empresas privadas, governamentais, associações e institutos de pesquisa e organizados em intervalos mensais. Foram utilizados três algoritmos de regressão: Random Forest, Multi-Layer Perceptron e Regressão Linear Múltipla. A rede neural apresentou os melhores resultados dentre os algoritmos aplicados, alcançando um R² de 82,01% no conjunto dos dados de teste. Após a análise exploratória, percebeu-se também o alto impacto que os semicondutores têm nas vendas de autoveículos e os efeitos drásticos ocasionado pela Covid-19 nas variáveis utilizadas no estudo. Com o modelo criado, é possível prever as vendas de autoveículos no Brasil em um determinado mês com base em alguns indicadores econômicos, importação de semicondutores e os óbitos mensais da Covid-19.

Downloads

Não há dados estatísticos.

Referências

ADVFN. Portal de investimentos em ações da bolsa de valores do Brasil, com cotações da Bovespa e BM&F. Disponível em: https://br.advfn.com/. Acessado em: 31 jan. 2022.

AMARAL, Lilian. 8 indicadores econômicos para monitorar e usar no planejamento orçamentário. [2018]. Disponível em: https://www.treasy.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.

ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Anuário. São Paulo: ANFAVEA, 2020.

ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Produção de automóveis tem nova queda pela falta de semicondutores. Estoques são os menores das últimas duas décadas. São Paulo: ANFAVEA, 2021.

BERTO, Rosa Maria Villares.; NAKANO, Davi Noboru. Um Levantamento de Métodos e Tipos de Pesquisa. Produção Científica nos Anais do Encontro Nacional de Engenharia de Produção. Produção, v. 9, n. 2, p. 65-76, 2000.

BOSQUEEROLLI, Arthur Marti; FUJARRA, Bruno Henrique; KESSEY, Getúlio Antônio Brandalise Rodrigues; Colaço, HENRIQUE, Malicheski; OLIVEIRA, Henrique Vinícius de; SANTOS, Laura Carvalho Gomes dos; SARRES, Lucas Silva; ALENCASTRO, Matheus Fiuza de; TAO, Matheus Itiro de Castro; VIEIRA, Natalia Podbevsek; NIRO, Raul de Carvalho. Brasil e o mundo diante da Covid-19 e da crise econômica. Curitiba: Universidade Federal do Paraná, 2020.

BRUCE, Peter; BRUCE, Andrew. Practical Statistics for Data Scientists. New York, O’Reilly, 2017.

CID, Allend Hector. Machine Learning: Catalisador da ciência. Chile: Pontificia Universidad Católica de Valparaíso, 2019.

CIHI – CANADIAN INSTITUTE FOR HEALTH INFORMATION. Health indicators. Disponível em: https://www.cihi.ca/en/health-indicators. Acesso em: 19 dez. 2021.

CILO, Nelson. COVID-19: Setor automobilístico vai levar três anos para se recuperar. [2020]. Disponível em: https://www.em.com.br/app/noticia/economia/2020/04/27/internas_economia,1142056/Covid -19-setor-automobilistico-vai-levar-tres-anos-para-se-recuperar.shtml. Acesso em: 02 ago.2021.

COELHO, Carolina Gomes; PILECCO, Flávia Bulegon. Indicadores de saúde e testagem para Covid-19. Salvador: Universidade Federal da Bahia, 2020.

DANTAS, Elias F. Redes Neurais Artificias Aplicadas à Previsão de Surtos de Leptospirose. 2018. TCC (Bacharelado em Sistemas de Informação) — Universidade Federal Rural de Pernambuco, Serra Talhada, 2018.

DMITRIEVSKY, Maxim. Floresta de decisão aleatória na aprendizagem por reforço.

. Disponível em: https://www.mql5.com/pt/articles/3856. Acesso em: 20 de ago. de

FENABRAVE. Anuário 2020: O desempenho da Distribuição Automotiva no Brasil. São Paulo: FENABRAVE, 2020. Disponível em: http://www.fenabrave.org.br/anuarios/Anuario2013.pdf. Acessado em: 31 jan. 2022.

FERNANDES, Fernando Timoteo; OLIVEIRA, Tiago Almeida de; TEIXEIRA, Cristiane Esteves; BATISTA, Andre Filipe de Moraes; COSTA, Gabriel Dalla; CHIAVEGATTO FILHO, Alexandre Dias Porto. A multipurpose machine learning approach to predict COVID-19 negative prognosis. Nature, 2021. DOI 10.1038/s41598-021-82885-y. Disponível em: https://www.nature.com/articles/s41598-021-82885-y#citeas. Acesso em: 30 set. 2021.

FGV. Portal FGV - índices. Disponível em: https://portalibre.fgv.br/?utm_source=portal-fgv&utm_medium=menu-indices&utm_campaign=portal-fgv-menu-indices. Acessado em: 31 jan. 2022.

GÉRON, Aurélien. Hands-On Machine Learning With Scikit-Learn and TensorFlow. New York: O’Reilly, 2017.

HARRISON, Matt. Machine Learning Pocket Reference: Working with structured Data in Python. New York: O’Reilly, 2019.

HE, Chen; HU, Hanbin; LI, Peng. Applications for Machine Learning in Semiconductor Manufacturing and Test. In: IEEE ELECTRON DEVICES TECHNOLOGY & MANUFACTURING CONFERENCE (EDTM), 5., 2021. Proceedings [...]. USA/CANADA: IEEE, 2021. DOI 10.1109/EDTM50988.2021.9420935. Disponível em: https://ieeexplore.ieee.org/document/9420935. Acesso em: 30 set. 2021.

IBGE - INSTITURO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa Industrial Mensal – Produção Física – Brasil. Rio de Janeiro: IBGE, 2020.

IPEA – INSTITUO DE PESQUISA ECONÔMICA APLICADA. Carta de Conjuntura – Impactos da pandemia sobre os resultados recentes das contas públicas. Brasil: IPEA, 2021.

JAIN, Deepak. Machine Learning, R-Squared in Regression Analysis. [2019]. Disponível em: https://www.geeksforgeeks.org/ml-r-squared-in-regression-analysis/. Acesso em: 23 ago. 2021.

JUSBRASIL, Salário Mínimo. Disponível em: https://www.jusbrasil.com.br/busca?q=sal%C3%A1rio+m%C3%ADnimo. Acesso em: 23 ago. 2021.

KIRSCH, Daniel; HURWITZ, Judith. Machine learning for dummies. Hoboken: IBM, 2018.

LACERDA, Rogério Tadeu de Oliveira; ENSSLIN, Leonardo; ENSSLIN, Sandra Rolim. Uma análise bibliométrica da literatura sobre estratégia e avaliação de desempenho. Gestão & Produção, v. 19, n. 1, p. 59-78, 2012.

LACONSKI, Alisson. Índices econômicos, para que servem e outros. [2019]. Disponível em: https://www.guiabanco.com.br/indicadores-economicos.html. Acesso em: 20 ago. 2021.

LEITE, Vitor. O que é balança comercial e o que impacta esse resultado? [2020]. Disponível em: https://blog.nubank.com.br/balanca-comercial-o-que-e/. Acesso em: 23 ago. 2021.

LEMOS, Arthur D. Quais são os indicadores econômicos mais importantes? [2019]. Disponível em: https://empreenderdinheiro.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.

LIBERT, Barry; BECK, Megan. The machine learning race is really a data race. [2018]. Disponível em: https://sloanreview.mit.edu/article/the-machine-learning-race-is-really-a-data-race/. Acesso em: 02 ago. 2021.

LORENZI, Larissa. Ciência de dados x análise de dados: quais as diferenças? [2021]. Disponível em: https://blog.indicium.tech/diferencas-entre-ciencia-de-dados-e-analise-de-dados/. Acesso em: 20 ago. 2021.

MARR, Bernard. 20 fatos sobre a internet que você não sabe. [2015]. Disponível em: https://forbes.com.br/fotos/2015/10/20-fatos-sobre-a-internet-que-voce-provavelmente-nao-sabe. Acesso em: 02 ago. 2021.

MARTINS, Roberto Antônio. Guia para elaboração de monografia e TCC em Engenharia de produção. São Paulo: Editora Atlas, 2014.

MINISTÉRIO DA ECONOMIA. Gabinete do Ministro. Portaria 20.809, de 14 de setembro de 2020. Lista os setores da economia mais impactados pela pandemia após a decretação da calamidade pública decorrente do Covid-19. 2020. Disponível em: https://www.in.gov.br/en/web/dou/-/portaria-n-20.809-de-14-de-setembro-de-2020-277430324. Acesso em: 31 jan. 2022.

NOGUEIRA, Hugo Clapton. Indicadores econômicos: a definição e o uso do índice de movimentação econômica. 2012. Monografia (Graduação) — Universidade Estadual do Sudoeste da Bahia, Vitoria da Conquista, 2012.

NOGUERIA, Olivia. 90% dos dados no mundo foram criados apenas nos dois últimos anos. [2019]. Disponível em: https://www.jornalopcao.com.br/ultimas-noticias/90-dos-dados-no-mundo-foram-criados-apenas-nos-dois-ultimos-anos-diz-google-207812/. Acesso em: 02 ago. 2021.

PAOLANTI, Marina; MANCINI, Adriano; ROMEO, Luca; FRONTONI, Emanuele. Machine learning approach for predictive maintenance in industry 4.0. In: IEEE/ASME INTERNATIONAL CONFERENCE ON MECHTRONIC AND EMBEDDED SYSTEMS AND APPLICATIONS, 14., 2018, Oulu. Proceedings [...]. Oulu: IEEE, 2018. DOI 10.1109/MESA.2018.8449150. Disponível em: https://ieeexplore.ieee.org/document/8449150. Acesso em: 20 ago. 2021.

PENN, Malcom. Why Didi the Covid-19 pandemic lead to semiconductor shortages? Disponível em: https://newseu.cgtn.com/news/2021-09-05/Why-did-the-COVID-19-pandemic-lead-to-semiconductor-shortages--13gl7OiynEA/index.html. Acesso em: 19 dez.2021.

PENUMURU, Durga Prasad; MUTHUSWAMY, Sreekumar; KARUMBU, Premkumar. Identification and classification of materials using machine vision and machine learning in the context of industry 4.0. Journal of Intelligent Manufacturing, n. 31, p. 1229-1242, 2020.

PEREIRA, Eduardo Lacerda. Aplicação de um modelo de aprendizado de máquina para previsão do desgaste de fresas de topo esférico. 2020. TCC (Graduação em Engenharia da Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2020.

PERES, Ricardo Silva; BARATA, Jose; LEITAO, Paulo; GARCIA, Gisele. Multistage Quality Control Using Machine Learning in the Automotive Industry. IEEE Access, v. 7, 2019. DOI 10.1109/ACCESS.2019.2923405. Disponível em: https://ieeexplore.ieee.org/document/8737933. Acesso em: 20 ago. 2021.

RIAHI, Youssra; RIAHI, Sara. Big Data Analytics: Concepts, Types and Technologies. International Journal of Research and Engineering, v. 5, n. 9, p. 524-528, 2018. DOI 10.21276/ijre.2018.5.9.5. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 20 ago. 2021.

ROCHA, Ricardo. R vs Python: Uma análise desapaixonada. [2020]. Disponível em; https://www.flai.com.br/ricardo/r-vs-python-uma-analise-desapaixonada/. Acesso em: 19 ago. 2021.

RODRIGUES, Gleyson. O que são indicadores econômicos? Para que servem? [2021]. Disponível em: https://guiabancario.com.br/o-que-sao-indicadores-economicos/. Acesso em: 20 ago. 2021.

ROZANEC, Joze M; KAZIC, Blaz; SKRJANC, Maja; FORTUNA, Blaz; MLADENIC, Dunja. Automotive OEM Demand Forecasting: A comparative Study of Forecasring Algoriths and Strategies. Applied Sciences, v. 11, n. 15, 2021. DOI 10.3390/app11156787. Disponível em: https://www.mdpi.com/2076-3417/11/15/6787. Acesso em: 20 ago. 2021.

SANTOS, Valter Barbosa. Estimação e previsão de produtividade de soja por redes neurais no MATOPIBA. 2020. Dissertação (Mestrado em Agronomia) — Universidade Estadual Paulista, Jaboticabal, 2020.

SEYMOUR, Geisser, Predictive Inference: an introduction. New York: Chapman & Hall, 2016.

SIERRA, Jaime Barco. Como o machine learning é afetado pela Covid-19: Análise de dados e modelos preditivos em um cenário atípico. Belo Horizonte: Tatic, 2021.

SILVA, Ivan Nunes; SPATTI, Danilo Hernane.; FLAUZINO, Rogério Andrade. Redes neurais artificias para Engenharia e Ciências Aplicadas: fundamentos teóricos e aspectos práticos. 6. ed. São Paulo: Artliber, 2016.

SILVEIRA, Ian Vieira. Modelo de previsão de demanda com o uso de aprendizado supervisionado de máquina: um estudo de caso em uma empresa de varejo. 2019. TCC (Engenharia de Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2019.

SJOBERG, Mark Ludwikowskie Willian. Semiconductor shortage and the U.S. auto industry. [2021]. Disponivel em: https://www.reuters.com/legal/legalindustry/semiconductor-shortage-us-auto-industry-2021-06-22/. Acesso em: 19 dez. 2021.

SOUZA, Alex. Seu primeiro projeto de Machine Learning em Python. [2019]. Disponível em: https://medium.com/blog-do-zouza/seu-primeiro-projeto-de-machine-learning-em-python-passo-a-passo-78c5f7bce22d. Acesso em: 23 ago. 2021.

STUMPF, Kleber. Indicadores Econômicos. [2019]. Disponível em: https://www.topinvest.com.br/indicadores-economicos/. Acesso em: 20 ago. 2021.

TEIXEIRA, Daniel. Inteligência artificial aplicada à pesquisa de mercado e comunicação. Monografia (Especialização em Pesquisa de Mercado Aplicada em Comunicações) — Universidade de São Paulo, São Paulo, 2019.

TIWARI, Upendra Kumar; KHAN, Rijwan. Role of machine learning to predict the outbreak of Covid-19 in India. Journal of Xi’na University of Architecture & Technology, Xi’na, n. 12, p. 2663-2669, 2020.

VERGARA, S. Projetos e Relatórios de Pesquisa em Administração. São Paulo: Atlas, 2000.

WEHLE, Hans Dieter. Machine Learning, Deep Learning, and AI: What’s the difference? [2017]. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 31 jan. 2022.

ZOABI, Yazeed; ROZOV, Shira; SHOMRON, Noam. Machine learning based prediction of COVID-19 diagnosis based on symptoms. Nature, 2021. DOI 10.1038/s41746-020-00372-6. Disponível em: https://www.nature.com/articles/s41746-020-00372-6. Acesso em: 02 ago. 2021.

Downloads

Publicado

2022-02-22

Edição

Seção

Artigos