Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Speech Processing
Tok studiów:
2017/2018
Kod:
IES-1-706-s
Wydział:
Informatyki, Elektroniki i Telekomunikacji
Poziom studiów:
Studia I stopnia
Specjalność:
-
Kierunek:
Electronics and Telecommunications
Semestr:
7
Profil kształcenia:
Ogólnoakademicki (A)
Język wykładowy:
Angielski
Forma i tryb studiów:
Stacjonarne
Osoba odpowiedzialna:
dr inż. Ziółko Bartosz (bziolko@agh.edu.pl)
Osoby prowadzące:
dr inż. Gałka Jakub (jgalka@agh.edu.pl)
Krótka charakterystyka modułu

Opis efektów kształcenia dla modułu zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Powiązania z EKK Sposób weryfikacji efektów kształcenia (forma zaliczeń)
Wiedza
M_W001 Student knows basics of speech technologies ES1A_W01, ES1A_W20, ES1A_W21 Zaliczenie laboratorium
Umiejętności
M_U001 Student can programme basic speech recognition applications. ES1A_U08 Zaliczenie laboratorium
M_U002 Student can programme basic speech analysis application. ES1A_U08 Zaliczenie laboratorium
M_U003 Student can programme basic speech synthesiser. ES1A_U08 Zaliczenie laboratorium
Matryca efektów kształcenia w odniesieniu do form zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Forma zajęć
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Inne
E-learning
Wiedza
M_W001 Student knows basics of speech technologies + - - - - - - - - - -
Umiejętności
M_U001 Student can programme basic speech recognition applications. - - + - - - - - - - -
M_U002 Student can programme basic speech analysis application. - - + - - - - - - - -
M_U003 Student can programme basic speech synthesiser. - - + - - - - - - - -
Treść modułu zajęć (program wykładów i pozostałych zajęć)
Wykład:

Introduction and general scheme of ASR.
Speech and language resources available for automatic speech recognition.
Bayes Rule, Maximum A-posteriori Probability (MAP).
Speech parameterisation and segmentation (mel frequency cepstral coefficients (MFCC), perceptual linear predictive analysis (PLP)).
Speech modelling (hidden Markov model (HMM), artificial neural networks (ANN)).
Decoding, Vitterbi algorithm
Dictionaries in computer systems, Levenshtein metric
Grammar modelling (parsers, n-grams, part of speech taggers).
Semantic modelling (bag-of-words, wordnet, vector space model).

Ćwiczenia laboratoryjne:

Developing speech processing applications based on available toolkits.

Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 82 godz
Punkty ECTS za moduł 3 ECTS
Samodzielne studiowanie tematyki zajęć 15 godz
Udział w wykładach 28 godz
Udział w ćwiczeniach laboratoryjnych 14 godz
Przygotowanie do zajęć 20 godz
Przygotowanie sprawozdania, pracy pisemnej, prezentacji, itp. 5 godz
Pozostałe informacje
Sposób obliczania oceny końcowej:

Based on work at laboratory

Wymagania wstępne i dodatkowe:

Signal Processing

Zalecana literatura i pomoce naukowe:

D. Jurafsky, J. H. Martin, SPEECH and LANGUAGE PROCESSING. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Second Edition”, Pearson Prentice Hall, 2008
L. R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition PDF
HMM w MIT, week #5, lecture #10: www.ocw.mit.edu
http://class.coursera.org/nlp
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring-2003/
http://nlp.ipipan.waw.pl/wiki/clip

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

http://www.dsp.agh.edu.pl/pl:publications

Informacje dodatkowe:

Brak