Técnicas de análise de dados e machine learning na análise de vendas de autoveículos no Brasil durante a pandemia da Covid-19
DOI:
https://doi.org/10.22279/navus.2022.v12.p01-24.1717Palavras-chave:
covid-19, machine learning, regressão, autoveículos.Resumo
O presente estudo tem como objetivo analisar os impactos da Covid-19 nas vendas de autoveículos no Brasil, correlacionando esses fatores com as importações de semicondutores e indicadores econômicos através de modelos de Machine Learning. Para isso, ocorreu uma coleta e preparação de dados antes de ser executada a análise exploratória, para em seguida, serem desenvolvidos os modelos preditivos. Este trabalho se caracteriza como uma pesquisa aplicada e exploratória, com uma abordagem quantitativa. A análise exploratória e a criação dos modelos foram executadas na linguagem Python. Os dados utilizados no estudo foram coletados de múltiplas fontes de empresas privadas, governamentais, associações e institutos de pesquisa e organizados em intervalos mensais. Foram utilizados três algoritmos de regressão: Random Forest, Multi-Layer Perceptron e Regressão Linear Múltipla. A rede neural apresentou os melhores resultados dentre os algoritmos aplicados, alcançando um R² de 82,01% no conjunto dos dados de teste. Após a análise exploratória, percebeu-se também o alto impacto que os semicondutores têm nas vendas de autoveículos e os efeitos drásticos ocasionado pela Covid-19 nas variáveis utilizadas no estudo. Com o modelo criado, é possível prever as vendas de autoveículos no Brasil em um determinado mês com base em alguns indicadores econômicos, importação de semicondutores e os óbitos mensais da Covid-19.
Downloads
Referências
ADVFN. Portal de investimentos em ações da bolsa de valores do Brasil, com cotações da Bovespa e BM&F. Disponível em: https://br.advfn.com/. Acessado em: 31 jan. 2022.
AMARAL, Lilian. 8 indicadores econômicos para monitorar e usar no planejamento orçamentário. [2018]. Disponível em: https://www.treasy.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.
ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Anuário. São Paulo: ANFAVEA, 2020.
ANFAVEA - ASSOCIAÇÃO NACIONAL DOS FABRICANTES DE VEÍCULOS AUTOMOTORES. Produção de automóveis tem nova queda pela falta de semicondutores. Estoques são os menores das últimas duas décadas. São Paulo: ANFAVEA, 2021.
BERTO, Rosa Maria Villares.; NAKANO, Davi Noboru. Um Levantamento de Métodos e Tipos de Pesquisa. Produção Científica nos Anais do Encontro Nacional de Engenharia de Produção. Produção, v. 9, n. 2, p. 65-76, 2000.
BOSQUEEROLLI, Arthur Marti; FUJARRA, Bruno Henrique; KESSEY, Getúlio Antônio Brandalise Rodrigues; Colaço, HENRIQUE, Malicheski; OLIVEIRA, Henrique Vinícius de; SANTOS, Laura Carvalho Gomes dos; SARRES, Lucas Silva; ALENCASTRO, Matheus Fiuza de; TAO, Matheus Itiro de Castro; VIEIRA, Natalia Podbevsek; NIRO, Raul de Carvalho. Brasil e o mundo diante da Covid-19 e da crise econômica. Curitiba: Universidade Federal do Paraná, 2020.
BRUCE, Peter; BRUCE, Andrew. Practical Statistics for Data Scientists. New York, O’Reilly, 2017.
CID, Allend Hector. Machine Learning: Catalisador da ciência. Chile: Pontificia Universidad Católica de Valparaíso, 2019.
CIHI – CANADIAN INSTITUTE FOR HEALTH INFORMATION. Health indicators. Disponível em: https://www.cihi.ca/en/health-indicators. Acesso em: 19 dez. 2021.
CILO, Nelson. COVID-19: Setor automobilístico vai levar três anos para se recuperar. [2020]. Disponível em: https://www.em.com.br/app/noticia/economia/2020/04/27/internas_economia,1142056/Covid -19-setor-automobilistico-vai-levar-tres-anos-para-se-recuperar.shtml. Acesso em: 02 ago.2021.
COELHO, Carolina Gomes; PILECCO, Flávia Bulegon. Indicadores de saúde e testagem para Covid-19. Salvador: Universidade Federal da Bahia, 2020.
DANTAS, Elias F. Redes Neurais Artificias Aplicadas à Previsão de Surtos de Leptospirose. 2018. TCC (Bacharelado em Sistemas de Informação) — Universidade Federal Rural de Pernambuco, Serra Talhada, 2018.
DMITRIEVSKY, Maxim. Floresta de decisão aleatória na aprendizagem por reforço.
. Disponível em: https://www.mql5.com/pt/articles/3856. Acesso em: 20 de ago. de
FENABRAVE. Anuário 2020: O desempenho da Distribuição Automotiva no Brasil. São Paulo: FENABRAVE, 2020. Disponível em: http://www.fenabrave.org.br/anuarios/Anuario2013.pdf. Acessado em: 31 jan. 2022.
FERNANDES, Fernando Timoteo; OLIVEIRA, Tiago Almeida de; TEIXEIRA, Cristiane Esteves; BATISTA, Andre Filipe de Moraes; COSTA, Gabriel Dalla; CHIAVEGATTO FILHO, Alexandre Dias Porto. A multipurpose machine learning approach to predict COVID-19 negative prognosis. Nature, 2021. DOI 10.1038/s41598-021-82885-y. Disponível em: https://www.nature.com/articles/s41598-021-82885-y#citeas. Acesso em: 30 set. 2021.
FGV. Portal FGV - índices. Disponível em: https://portalibre.fgv.br/?utm_source=portal-fgv&utm_medium=menu-indices&utm_campaign=portal-fgv-menu-indices. Acessado em: 31 jan. 2022.
GÉRON, Aurélien. Hands-On Machine Learning With Scikit-Learn and TensorFlow. New York: O’Reilly, 2017.
HARRISON, Matt. Machine Learning Pocket Reference: Working with structured Data in Python. New York: O’Reilly, 2019.
HE, Chen; HU, Hanbin; LI, Peng. Applications for Machine Learning in Semiconductor Manufacturing and Test. In: IEEE ELECTRON DEVICES TECHNOLOGY & MANUFACTURING CONFERENCE (EDTM), 5., 2021. Proceedings [...]. USA/CANADA: IEEE, 2021. DOI 10.1109/EDTM50988.2021.9420935. Disponível em: https://ieeexplore.ieee.org/document/9420935. Acesso em: 30 set. 2021.
IBGE - INSTITURO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa Industrial Mensal – Produção Física – Brasil. Rio de Janeiro: IBGE, 2020.
IPEA – INSTITUO DE PESQUISA ECONÔMICA APLICADA. Carta de Conjuntura – Impactos da pandemia sobre os resultados recentes das contas públicas. Brasil: IPEA, 2021.
JAIN, Deepak. Machine Learning, R-Squared in Regression Analysis. [2019]. Disponível em: https://www.geeksforgeeks.org/ml-r-squared-in-regression-analysis/. Acesso em: 23 ago. 2021.
JUSBRASIL, Salário Mínimo. Disponível em: https://www.jusbrasil.com.br/busca?q=sal%C3%A1rio+m%C3%ADnimo. Acesso em: 23 ago. 2021.
KIRSCH, Daniel; HURWITZ, Judith. Machine learning for dummies. Hoboken: IBM, 2018.
LACERDA, Rogério Tadeu de Oliveira; ENSSLIN, Leonardo; ENSSLIN, Sandra Rolim. Uma análise bibliométrica da literatura sobre estratégia e avaliação de desempenho. Gestão & Produção, v. 19, n. 1, p. 59-78, 2012.
LACONSKI, Alisson. Índices econômicos, para que servem e outros. [2019]. Disponível em: https://www.guiabanco.com.br/indicadores-economicos.html. Acesso em: 20 ago. 2021.
LEITE, Vitor. O que é balança comercial e o que impacta esse resultado? [2020]. Disponível em: https://blog.nubank.com.br/balanca-comercial-o-que-e/. Acesso em: 23 ago. 2021.
LEMOS, Arthur D. Quais são os indicadores econômicos mais importantes? [2019]. Disponível em: https://empreenderdinheiro.com.br/blog/indicadores-economicos/. Acesso em: 20 ago. 2021.
LIBERT, Barry; BECK, Megan. The machine learning race is really a data race. [2018]. Disponível em: https://sloanreview.mit.edu/article/the-machine-learning-race-is-really-a-data-race/. Acesso em: 02 ago. 2021.
LORENZI, Larissa. Ciência de dados x análise de dados: quais as diferenças? [2021]. Disponível em: https://blog.indicium.tech/diferencas-entre-ciencia-de-dados-e-analise-de-dados/. Acesso em: 20 ago. 2021.
MARR, Bernard. 20 fatos sobre a internet que você não sabe. [2015]. Disponível em: https://forbes.com.br/fotos/2015/10/20-fatos-sobre-a-internet-que-voce-provavelmente-nao-sabe. Acesso em: 02 ago. 2021.
MARTINS, Roberto Antônio. Guia para elaboração de monografia e TCC em Engenharia de produção. São Paulo: Editora Atlas, 2014.
MINISTÉRIO DA ECONOMIA. Gabinete do Ministro. Portaria 20.809, de 14 de setembro de 2020. Lista os setores da economia mais impactados pela pandemia após a decretação da calamidade pública decorrente do Covid-19. 2020. Disponível em: https://www.in.gov.br/en/web/dou/-/portaria-n-20.809-de-14-de-setembro-de-2020-277430324. Acesso em: 31 jan. 2022.
NOGUEIRA, Hugo Clapton. Indicadores econômicos: a definição e o uso do índice de movimentação econômica. 2012. Monografia (Graduação) — Universidade Estadual do Sudoeste da Bahia, Vitoria da Conquista, 2012.
NOGUERIA, Olivia. 90% dos dados no mundo foram criados apenas nos dois últimos anos. [2019]. Disponível em: https://www.jornalopcao.com.br/ultimas-noticias/90-dos-dados-no-mundo-foram-criados-apenas-nos-dois-ultimos-anos-diz-google-207812/. Acesso em: 02 ago. 2021.
PAOLANTI, Marina; MANCINI, Adriano; ROMEO, Luca; FRONTONI, Emanuele. Machine learning approach for predictive maintenance in industry 4.0. In: IEEE/ASME INTERNATIONAL CONFERENCE ON MECHTRONIC AND EMBEDDED SYSTEMS AND APPLICATIONS, 14., 2018, Oulu. Proceedings [...]. Oulu: IEEE, 2018. DOI 10.1109/MESA.2018.8449150. Disponível em: https://ieeexplore.ieee.org/document/8449150. Acesso em: 20 ago. 2021.
PENN, Malcom. Why Didi the Covid-19 pandemic lead to semiconductor shortages? Disponível em: https://newseu.cgtn.com/news/2021-09-05/Why-did-the-COVID-19-pandemic-lead-to-semiconductor-shortages--13gl7OiynEA/index.html. Acesso em: 19 dez.2021.
PENUMURU, Durga Prasad; MUTHUSWAMY, Sreekumar; KARUMBU, Premkumar. Identification and classification of materials using machine vision and machine learning in the context of industry 4.0. Journal of Intelligent Manufacturing, n. 31, p. 1229-1242, 2020.
PEREIRA, Eduardo Lacerda. Aplicação de um modelo de aprendizado de máquina para previsão do desgaste de fresas de topo esférico. 2020. TCC (Graduação em Engenharia da Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2020.
PERES, Ricardo Silva; BARATA, Jose; LEITAO, Paulo; GARCIA, Gisele. Multistage Quality Control Using Machine Learning in the Automotive Industry. IEEE Access, v. 7, 2019. DOI 10.1109/ACCESS.2019.2923405. Disponível em: https://ieeexplore.ieee.org/document/8737933. Acesso em: 20 ago. 2021.
RIAHI, Youssra; RIAHI, Sara. Big Data Analytics: Concepts, Types and Technologies. International Journal of Research and Engineering, v. 5, n. 9, p. 524-528, 2018. DOI 10.21276/ijre.2018.5.9.5. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 20 ago. 2021.
ROCHA, Ricardo. R vs Python: Uma análise desapaixonada. [2020]. Disponível em; https://www.flai.com.br/ricardo/r-vs-python-uma-analise-desapaixonada/. Acesso em: 19 ago. 2021.
RODRIGUES, Gleyson. O que são indicadores econômicos? Para que servem? [2021]. Disponível em: https://guiabancario.com.br/o-que-sao-indicadores-economicos/. Acesso em: 20 ago. 2021.
ROZANEC, Joze M; KAZIC, Blaz; SKRJANC, Maja; FORTUNA, Blaz; MLADENIC, Dunja. Automotive OEM Demand Forecasting: A comparative Study of Forecasring Algoriths and Strategies. Applied Sciences, v. 11, n. 15, 2021. DOI 10.3390/app11156787. Disponível em: https://www.mdpi.com/2076-3417/11/15/6787. Acesso em: 20 ago. 2021.
SANTOS, Valter Barbosa. Estimação e previsão de produtividade de soja por redes neurais no MATOPIBA. 2020. Dissertação (Mestrado em Agronomia) — Universidade Estadual Paulista, Jaboticabal, 2020.
SEYMOUR, Geisser, Predictive Inference: an introduction. New York: Chapman & Hall, 2016.
SIERRA, Jaime Barco. Como o machine learning é afetado pela Covid-19: Análise de dados e modelos preditivos em um cenário atípico. Belo Horizonte: Tatic, 2021.
SILVA, Ivan Nunes; SPATTI, Danilo Hernane.; FLAUZINO, Rogério Andrade. Redes neurais artificias para Engenharia e Ciências Aplicadas: fundamentos teóricos e aspectos práticos. 6. ed. São Paulo: Artliber, 2016.
SILVEIRA, Ian Vieira. Modelo de previsão de demanda com o uso de aprendizado supervisionado de máquina: um estudo de caso em uma empresa de varejo. 2019. TCC (Engenharia de Produção) — Universidade Federal de Santa Catarina, Florianópolis, 2019.
SJOBERG, Mark Ludwikowskie Willian. Semiconductor shortage and the U.S. auto industry. [2021]. Disponivel em: https://www.reuters.com/legal/legalindustry/semiconductor-shortage-us-auto-industry-2021-06-22/. Acesso em: 19 dez. 2021.
SOUZA, Alex. Seu primeiro projeto de Machine Learning em Python. [2019]. Disponível em: https://medium.com/blog-do-zouza/seu-primeiro-projeto-de-machine-learning-em-python-passo-a-passo-78c5f7bce22d. Acesso em: 23 ago. 2021.
STUMPF, Kleber. Indicadores Econômicos. [2019]. Disponível em: https://www.topinvest.com.br/indicadores-economicos/. Acesso em: 20 ago. 2021.
TEIXEIRA, Daniel. Inteligência artificial aplicada à pesquisa de mercado e comunicação. Monografia (Especialização em Pesquisa de Mercado Aplicada em Comunicações) — Universidade de São Paulo, São Paulo, 2019.
TIWARI, Upendra Kumar; KHAN, Rijwan. Role of machine learning to predict the outbreak of Covid-19 in India. Journal of Xi’na University of Architecture & Technology, Xi’na, n. 12, p. 2663-2669, 2020.
VERGARA, S. Projetos e Relatórios de Pesquisa em Administração. São Paulo: Atlas, 2000.
WEHLE, Hans Dieter. Machine Learning, Deep Learning, and AI: What’s the difference? [2017]. Disponível em: https://www.researchgate.net/publication/328783489_Big_Data_and_Big_Data_Analytics_Concepts_Types_and_Technologies. Acesso em: 31 jan. 2022.
ZOABI, Yazeed; ROZOV, Shira; SHOMRON, Noam. Machine learning based prediction of COVID-19 diagnosis based on symptoms. Nature, 2021. DOI 10.1038/s41746-020-00372-6. Disponível em: https://www.nature.com/articles/s41746-020-00372-6. Acesso em: 02 ago. 2021.
Publicado
Edição
Seção
Licença
O conteúdo da revista é de acesso público e gratuito, podendo ser compartilhado de acordo com os termos da Creative Commons Atribuição-Uso não-comercial-Vedada a criação de obras derivadas 4.0 Brasil. Você tem a liberdade de compartilhar — copiar, distribuir e transmitir a obra, sob as seguintes condições:
a) Atribuição — a atribuição deve ser feita quando alguém compartilhar um de seus artigos e deve sempre citar o nome da revista e o endereço do conteúdo compartilhado.
b) Uso não-comercial — você não pode usar esta obra para fins comerciais.
c) Vedada à criação de obras derivadas — você não pode alterar, transformar ou criar em cima desta obra.
Ficando claro que:
Renúncia — qualquer das condições acima pode ser renunciada se você obtiver permissão do titular dos direitos autorais. Domínio Público — onde a obra ou qualquer de seus elementos estiver em domínio público sob o direito aplicável, esta condição não é, de maneira alguma, afetada pela licença.
Outros Direitos — os seguintes direitos não são, de maneira alguma, afetados pela licença:
- Limitações e exceções aos direitos autorais ou quaisquer usos livres aplicáveis;
- os direitos morais do autor;
- direitos que outras pessoas podem ter sobre a obra ou sobre a utilização da obra, tais como direitos de imagem ou privacidade.
Aviso — para qualquer reutilização ou distribuição, você deve deixar claro a terceiros os termos da licença a que se encontra submetida esta obra.
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua, respeitando, porém, o estilo dos autores.
Os trabalhos publicados passam a ser propriedade da revista Navus: Revista de Gestão e Tecnologia que deve ser consignada a fonte de publicação original. Os originais não serão devolvidos aos autores.
As opiniões emitidas pelos autores nos artigos são de sua exclusiva responsabilidade.
Esta obra está licenciada sob uma Creative Commons Atribuição-Uso não-comercial-Vedada a criação de obras derivadas 4.0 Brasil.