Aviso: Se está a ler esta mensagem, provavelmente, o browser que utiliza não é compatível com os "standards" recomendados pela W3C. Sugerimos vivamente que actualize o seu browser para ter uma melhor experiência de utilização deste "website". Mais informações em webstandards.org.

Warning: If you are reading this message, probably, your browser is not compliant with the standards recommended by the W3C. We suggest that you upgrade your browser to enjoy a better user experience of this website. More informations on webstandards.org.

Sub Menu
ISCTE-IUL  >  Ensino  >  METI , MEI , MIG , MSIAD

Algoritmos para Big Data (1 º Sem 2017/2018)

Código: 02864
Acrónimo: 02864
Nível: 2º Ciclo
Estruturante: Não
Língua(s) de Ensino: Português
Língua(s) amigável(is):
Ser English-friendly ou qualquer outra língua-friendly, significa que a UC é leccionada numa língua mas que se pode verificar qualquer uma das seguintes condições:
1. Existem materiais de apoio em língua inglesa/outra língua;
2. Existem exercícios, testes e exames em língua inglesa/outra língua;
3. Existe a possibilidade de se apresentar trabalhos escritos ou orais em língua inglesa/outra língua.
1 6.0 0.0 h/sem 36.0 h/sem 0.0 h/sem 0.0 h/sem 0.0 h/sem 0.0 h/sem 1.0 h/sem 37.0 h/sem 113.0 h/sem 0.0 h/sem 150.0 h/sem
Em vigor desde o ano letivo 2017/2018
Pré-requisitos Conhecimentos básicos de probabilidades e estatística, álgebra linear e programação, embora os conceitos necessários para a UC sejam revistos na sua primeira utilização.
Objectivos O objectivo geral desta UC é dar formação nas técnicas e algoritmos que permitem extrair modelos e informação a partir de grandes quantidades de informação.
Programa CP1: Programação para larga escala
- Sistema de ficheiros distribuídos
- O modelo de programação MapReduce
CP2: Locality-sensitive hashing algorithm
CP3: Aprendizagem a partir de sequências
CP4: Análise de hiperligações
- PageRank
- Link Spam
CP5: Regras de associação
CP6: Aprendizagem não supervisionada em larga escala
CP7: Sistemas de recomendação
CP8: Comunidades em redes sociais
CP9: Redução de dimensionalidade
- Análise de componentes principais
- Decomposição em valores próprios singulares
- Decomposição CUR
CP10: Aprendizagem supervisionada em larga escala
- Vizinho mais próximo
- Máquinas de vetor de suporte
CP11: Árvores de decisão
CP12: Introdução ao Deep Learning
Processo de avaliação A avaliação pode ser realizada de duas formas: periódica [1] ou exame final [2].
[1] A avaliação periódica consiste em:
- 2 testes escritos (com um peso na nota final de 20% cada), realizados ao longo do semestre, com uma nota mínima de 7;
- 1 trabalho (de grupo) com um peso na nota final de 60%.
[2] O exame final é composto por parte teórica e prática realizadas no ISCTE-IUL, realizada em época de recurso ou em época especial (ver detalhes obrigatórios no campo Observações).

Processo de ensino-aprendizagem As aulas são teórico-práticas, alternando entre a exposição dos assuntos teóricos e a realização de exercícios.
Observações A parte prática do exame final avaliará os conhecimentos práticos necessários ao desenvolvimento de projetos de complexidade semelhante à do trabalho considerado para avaliação periódica.

Os alunos que entregaram projeto durante a avaliação periódica poderão optar por não realizar a parte prática do exame final. Nesse caso, a nota da parte prática será a nota do trabalho.  
A realização da parte prática requer a inscrição por email para o docente, com pelo menos dois dias úteis de antecedência.

Por razões logísticas a realização da prova prática poderá não ser no dia da prova teórica.
Bibliografia básica Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press.

Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015.

Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O'Reilly Media, 2017.

Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale, Ofer Mendelevitch, Casey Stella and Douglas Eadline, Addison-wesley, 2016.

Deep Learning, Ian Goodfellow and Yoshua Bengio, 2016, MIT Press.
Bibliografia complementar Learning Spark: Lightning-Fast Big Data Analysis, Holden Karau, A. Konwinski, P. Wendell and M. Zaharia, O'Reilly Media, 2015.

All of Statistics: A concise course in Statistical Inference, L.Wasserman, Springer, 2003.

The elements of statistical learning, Trevor Hastie, Robert Tibshirani, and Jerome Friedman. Springer, 2001.