Área de concentração: 55134 - Ciências de Computação e Matemática Computacional
Criação: 18/11/2025
Nº de créditos: 12
Carga horária:
| Teórica Por semana |
Prática Por semana |
Estudos Por semana |
Duração | Total |
| 3 | 1 | 8 | 15 Semanas | 180 Horas |
Docentes responsáveis:
Objetivos:
Fornecer aos alunos uma visão ampla sobre os objetivos, conceitos, fundamentos e ferramentas voltados ao processamento analítico de dados em larga escala.
Justificativa:
A disciplina visa estimular o aluno quanto ao aprendizado de conceitos atuais empregados no processamento de dados em larga escala.
Conteúdo:
1. Inteligência de negócio: medição, relatórios, análise, colaboração, gerência.
2. Big Data: definições, utilidade, desafios.
3. Data Warehousing: conceitos básicos, tarefas, objetivos, diferenças entre o processamento analítico (OLAP on line analytical processing) e o processamento transacional (OLTP - on line analytical processing).
4. Arquitetura de um Big Data Warehousing: fontes de dados, camada de pré-processamento de dados, camada de data warehouse, camada de serviços, camada de governança de dados e ferramentas de análise e consulta.
5. Novos paradigmas de um Big Data Warehousing: lakehouse, data mesh.
6. Modelagem multidimensional: conceito de cubo de dados, características estáticas, operações analíticas, sistemas ROLAP (OLAP relacional), visões materializadas, índice bitmap de junção.
7. Map-Reduce: conceitos, modelo algorítmico, principais algoritmos de processamento. Arcabouços comerciais mais usados. Sistemas distribuídos para larga escala de processamento.
8. Análise de dados em larga escala: arcabouços para o processamento analítico.
Forma de avaliação:
Desenvolvimento de projetos envolvendo aplicações práticas e apresentação de seminários.
Observação:
Nenhuma.
Bibliografia:
Fundamentais:
1) KIMBALL, R., ROSS, M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 3rd edition. Wiley, 2013.
2) CIFERRI, C., CIFERRI, R., GÓMEZ, L., SCHNEIDER, M., VAISMAN, A., ZIMÁNYI, E. Cube algebra: A generic user-centric model and query language for OLAP cubes. Journal of Data Warehousing and Mining, v. 9, n. 2, p. 39-65, 2013.
3) VAISMANN, A., ZIMÁNYI, E. Data Warehouse Systems: Design and Implementation, 1st edition. Springer, 2014.
4) LINSTEDT, D., OLSCHIMKE, M. Building a Scalable Data Warehouse with Data Vault 2.0, 1st edition. Morgan Kaufmann, 2015.
5) WHITE, T. Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale, 4th Edition. O'Reilly Media, 2015.
6) M. Chen, S. Mao and Y. Liu, Big Data: A Survey. Mobile Network Applications, v. 19, p. 171- 209, 2014.
Complementares:
1) COUTO, J.; BORGES, O.; RUIZ, D.; MARCZAK, S.; PRIKLADNICKI, R. A Mapping Study About Data Lakes: An improved Definition and Possible Architectures. In Proceedings of the 31st International Conference on Software Engineering and Knowledge Engineering, p. 453-458, 2019.
2) DAMJI, J. S.; WENIG, B.; DAS, T.; LEE, D. Learning Spark: Lightning-Fast Data Analytics. Second edition. OReilly, 2020.
3) DEAN, J.; GHEMAWAT, S. MapReduce: Simplified Data Processing on Large Clusters. Communications of the ACM, v. 51, n. 1, p. 107-113, 2008.
4) GOLFARELLI, M.; RIZZI, S.; IURIS, C. Beyond Data Warehousing: What's Next in Business Intelligence? In Proceedings of the 7th ACM International Workshop on Data Warehousing and OLAP, p. 1-6, 2004.
5) HARINARAYAN, V.; RAJARAMAN, A.; ULLMAN, J. D. Implementing data cubes efficiently. ACM SIGMOD Record, v. 25, p. 205-216, 1996.
6) INMON, W. H. Building the Data Warehouse. Wiley, 4th edition, 2005.
7) JANSSEN, N.; ILAYPERUMA, T.; JAYASINGHE, J.; et al. The evolution of data storage architectures: examining the secure value of the Data Lakehouse. Journal of Data, Information and Management, v.6, p.309334, 2024.
8) KIMBALL, R.; LEVINS, M., SRIVASTAVA, R. Building the Data Lakehouse. Technics Publications, 2021.
9) MATHIS, C. Data lakes. Datenbank-Spektrum, v. 17, n. 3, p. 289293, 2017.
10) SHVACHKO, K.; KUANG, H.; RADIA, S.; CHANSLER, R. The Hadoop Distributed File. In Proceedings of the IEEE 26th Symposium on Mass Storage Systems and Technologies, p. 110, 2015.
© 2026 Instituto de Ciências Matemáticas e de Computação