Gestão Inteligente de Despesas de Casa
Guardado en:
| Udgivet i: | PQDT - Global (2024) |
|---|---|
| Hovedforfatter: | |
| Udgivet: |
ProQuest Dissertations & Theses
|
| Fag: | |
| Online adgang: | Citation/Abstract Full Text - PDF |
| Tags: |
Ingen Tags, Vær først til at tagge denne postø!
|
| Resumen: | O presente relatório é parte integrante do projeto realizado no âmbito da Unidade Curricular (UC) Dissertação/Projeto/Estágio do Mestrado em Ciência de Dados, lecionado na Escola Superior de Tecnologia e Gestão do Instituto Politécnico de Leiria. O objetivo deste relatório é descrever todo o trabalho desenvolvido ao longo do projeto.O projeto visa oferecer uma solução a um problema real através de técnicas utilizadas em Business Intelligence – uma das grandes áreas da Ciência de Dados que tem muito ênfase neste Mestrado. O objetivo deste projeto é responder a várias perguntas que geralmente ficam sem resposta aquando a elaboração de orçamentos familiares, como por exemplo: “quanto dinheiro gastamos nas compras dos supermercados?”, “em que categorias de produto se despendeu mais dinheiro?”, ou “qual é a loja mais cara para os produtos comprados com mais frequência?”.O projeto iniciou-se com a construção de uma Base de Dados (BD) SQL de raiz, o que incluiu a elaboração do dicionário de dados, do modelo conceptual (diagrama de entidade e relacionamento) e do modelo lógico. Esta BD foi de seguida preenchida com dados que foram extraídos a partir de faturas eletrónicas emitidas por várias lojas da cadeia de supermercados Continente, faturas essas datadas de 2019 a 2024. Foi necessário criar vários algoritmos com a linguagem de programação Python para conseguir recolher as faturas que se encontravam num servidor de e-mail, extrair dessas faturas os dados relevantes e introduzir os mesmos na BD, isto tudo de forma automática. Outras faturas referentes a outras lojas foram introduzidas manualmente através de queriesSQL.A partir da BD já preenchida, foi feito um estudo para a elaboração de um Data Warehouse (DW) igualmente de raiz, incluindo a conceção do modelo dimensional, criação das tabelas e automatização do processo ETL (Extract, Transform and Load).Por fim, foram elaborados vários dashboards. Os gráficos e as tabelas desses dashboards são gerados diretamente a partir dos dados que foram carregados no DW, o que permite analisar sob diversas formas as despesas obtidas com base nas faturas disponíveis. This report is an integral part of the master's degree project in Data Science, from the School of Technology and Management of the Polytechnique Institute of Leiria. The aim of this report is to describe all the work carried out during the project.The project aims to provide a solution to a real problem through techniques used in Business Intelligence – one of the main branches of data science. The aim of this project is to answer various questions that are often left unanswered when drawing up household budgets, such as: "how much money do we spend on supermarket?", "which product categories do we spend the most money on?", or "which is the most expensive store for the products we buy most often?". The food retail market is very confusing due to the wide variety of stores and the manipulation of prices. The large number of promotions, loyalty cards and the marketing itself means that you can't really get a clear idea of how much a particular product actually costs or where you're actually spending the most money.The project began by building an SQL database from scratch, which included drawing up the data dictionary, the logical model and the conceptual model. This database was then populated with data that was extracted from electronic invoices issued by several stores of the Continente supermarket chain, which are dated from 2019 to 2024. Several algorithms had to be created using Python programming language to collect the invoices from an e-mail server, extract the relevant data from these invoices and insert them into the database, all automatically. Other invoices from other stores were entered manually using SQL queries.From the database already created, a study was carried out to create a data warehouse from scratch, including designing the dimensional model (star schema), creating the tables, and automating the ETL (Extract, Transform and Load) process.Finally, the project includes the creation of various dashboards. The graphs in these dashboards are generated directly from the data that has been uploaded to the data warehouse, allowing us to analyse the expenses in various ways. |
|---|---|
| ISBN: | 9798342187015 |
| Fuente: | ProQuest Dissertations & Theses Global |