Área de concentração: 55134 - Ciências de Computação e Matemática Computacional

Criação: 18/11/2025

Nº de créditos: 12

Carga horária:

Teórica
Por semana
Prática
Por semana
Estudos
Por semana
Duração Total
3 1 8 15 Semanas 180 Horas

Docentes responsáveis:


Objetivos:

Fornecer aos alunos uma visão ampla sobre os objetivos, conceitos, fundamentos e ferramentas voltados ao processamento analítico de dados em larga escala.


Justificativa:

A disciplina visa estimular o aluno quanto ao aprendizado de conceitos atuais empregados no processamento de dados em larga escala.


Conteúdo:

1. Inteligência de negócio: medição, relatórios, análise, colaboração, gerência.
2. Big Data: definições, utilidade, desafios.
3. Data Warehousing: conceitos básicos, tarefas, objetivos, diferenças entre o processamento analítico (OLAP – on line analytical processing) e o processamento transacional (OLTP - on line analytical processing).
4. Arquitetura de um Big Data Warehousing: fontes de dados, camada de pré-processamento de dados, camada de data warehouse, camada de serviços, camada de governança de dados e ferramentas de análise e consulta.
5. Novos paradigmas de um Big Data Warehousing: lakehouse, data mesh.
6. Modelagem multidimensional: conceito de cubo de dados, características estáticas, operações analíticas, sistemas ROLAP (OLAP relacional), visões materializadas, índice bitmap de junção.
7. Map-Reduce: conceitos, modelo algorítmico, principais algoritmos de processamento. Arcabouços comerciais mais usados. Sistemas distribuídos para larga escala de processamento.
8. Análise de dados em larga escala: arcabouços para o processamento analítico.


Forma de avaliação:

Desenvolvimento de projetos envolvendo aplicações práticas e apresentação de seminários.


Observação:

Nenhuma.


Bibliografia:

Fundamentais:

1) KIMBALL, R., ROSS, M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 3rd edition. Wiley, 2013.
2) CIFERRI, C., CIFERRI, R., GÓMEZ, L., SCHNEIDER, M., VAISMAN, A., ZIMÁNYI, E. Cube algebra: A generic user-centric model and query language for OLAP cubes. Journal of Data Warehousing and Mining, v. 9, n. 2, p. 39-65, 2013.
3) VAISMANN, A., ZIMÁNYI, E. Data Warehouse Systems: Design and Implementation, 1st edition. Springer, 2014.
4) LINSTEDT, D., OLSCHIMKE, M. Building a Scalable Data Warehouse with Data Vault 2.0, 1st edition. Morgan Kaufmann, 2015.
5) WHITE, T. Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale, 4th Edition. O'Reilly Media, 2015.
6) M. Chen, S. Mao and Y. Liu, Big Data: A Survey. Mobile Network Applications, v. 19, p. 171- 209, 2014.

Complementares:

1) COUTO, J.; BORGES, O.; RUIZ, D.; MARCZAK, S.; PRIKLADNICKI, R. A Mapping Study About Data Lakes: An improved Definition and Possible Architectures. In Proceedings of the 31st International Conference on Software Engineering and Knowledge Engineering, p. 453-458, 2019.
2) DAMJI, J. S.; WENIG, B.; DAS, T.; LEE, D. Learning Spark: Lightning-Fast Data Analytics. Second edition. O’Reilly, 2020.
3) DEAN, J.; GHEMAWAT, S. MapReduce: Simplified Data Processing on Large Clusters. Communications of the ACM, v. 51, n. 1, p. 107-113, 2008.
4) GOLFARELLI, M.; RIZZI, S.; IURIS, C. Beyond Data Warehousing: What's Next in Business Intelligence? In Proceedings of the 7th ACM International Workshop on Data Warehousing and OLAP, p. 1-6, 2004.
5) HARINARAYAN, V.; RAJARAMAN, A.; ULLMAN, J. D. Implementing data cubes efficiently. ACM SIGMOD Record, v. 25, p. 205-216, 1996.
6) INMON, W. H. Building the Data Warehouse. Wiley, 4th edition, 2005.
7) JANSSEN, N.; ILAYPERUMA, T.; JAYASINGHE, J.; et al. The evolution of data storage architectures: examining the secure value of the Data Lakehouse. Journal of Data, Information and Management, v.6, p.309–334, 2024.
8) KIMBALL, R.; LEVINS, M., SRIVASTAVA, R. Building the Data Lakehouse. Technics Publications, 2021.
9) MATHIS, C. Data lakes. Datenbank-Spektrum, v. 17, n. 3, p. 289–293, 2017.
10) SHVACHKO, K.; KUANG, H.; RADIA, S.; CHANSLER, R. The Hadoop Distributed File. In Proceedings of the IEEE 26th Symposium on Mass Storage Systems and Technologies, p. 1–10, 2015.

CONECTE-SE COM A GENTE
 

© 2026 Instituto de Ciências Matemáticas e de Computação