ADATTUDOMÁNY LABORATÓRIUM INMPM9922-17 Félév: 4 Típus: Labor gyakorlat Óraszám/hét: 0+0+2 Kredit: 3 Státusz: Választható Előfeltételek: INMPM0101-17 (A gépi tanulás alapjai) Számonkérés: Gyakorlati jegy Tantárgyfelelős: Dr. Hajdu András Tantárgyleírás / tematika: A hallgatók konkrét adattudományi célprojekteken dolgozzanak és megismerhessék a megoldásban használható eszközrendszert. A kurzus törekszik rá, hogy a hallgatók valós, lehetőleg ipari partnereket is érintő kutatás-fejlesztési projektekhez kapcsolódjanak. Adattudományi kihívások, kutatás és ipar. Esettanulmány, képi információk feldolgozása. Esettanulmány, nagy mennyiségű adatfeldolgozás. Ajánlórendszerek. Hirdetések, internetes keresés. Játékfejlesztés. Kockázatelemzés. Útvonaltervezés, kézbesítés, optimalizáció. Robotika. Önvezető járművek. Projektmunka. Ipari alkalmazás. Kötelező, illetve ajánlott irodalom: - W. McKinney: Python for Data Analysis (1 ed.). O'Reilly Media, Inc. 2012. - Christopher Bishop: Pattern Recognition and Machine Learning, Springer, 2006. - D. Conway, J.M. White: Machine Learning for Hackers, O'Reilly Media, Inc., 2012. - I. Goodfellow, Y. Bengio, A. Courville: Deep Learning, MIT Press, 2016. 1., Bevezetés, adattudománi kihívások, kutatás, ipar és technológiai irányvonalak. 2., Python környezet alkalmazása az adattudományban, virtual modulok, repozitorik, adattudomány gépi tanuló környezetei 3., Python 2/3 környezet beálltása, különböző gépi tanuló eszközrendszerek áttekintéséhez 4., Esettanulmány python környezetben tensorflow gépi tanuló eszközrendszer használatával 5., Esettanulmány python környezetben keras gépi tanuló eszközrendszer használatával 6., Esettanulmány python környezetben theano gépi tanuló eszközrendszer használatával 7., Esettanulmány python környezetben pytorch gépi tanuló eszközrendszer használatával 8., Intel környezet beálltása, különböző gépi tanuló eszközrendszerek áttekintéséhez 9., Esettanulmány Intel környezetben gépi tanuló eszközrendszer használatával 10., Optimalizációs lehetőségek, teljesítmény összehasonlítások, forrásból történő forítások (intel caffe) 11., Optimalizációs lehetőségek, teljesítmény összehasonlítások, Intel mkl-dnn 12., HPC megoldások, elosztott és hibrid technológiát alkalmazó deep learning 13., Célhardverek az adattudományban: MIC, NPU, FPGA 14., Célhardverek az adattudományban: Intel neural compute stick Követelmények: A laborgyakorlatokon való részvétel kötelező. Háromnál több hiányzás esetén a tárgy teljesítése automatikusan sikertelen. A labor teljesítéséhez projektmunkát kell vállalni. A projektfeladatok kiadására és leegyeztetésére a szorgalmi időszak első harmadában kerül sor. A kiadott és leegyeztetett projektfeladatot önállóan, vagy kis létszámú csapatban kell megoldani a szorgalmi időszak hátralévő részében, illetve előzetes egyeztetés alapján a vizsgaidőszakban. A szorgalmi időszakban a projektlaborok alkalmával a hallgatók lehetőséget kapnak, hogy a kapott projekteken dolgozzanak, illetve azzal kapcsolatban kérdéseket tegyenek fel. A megoldásokat szóban kell bemuttani, megvédeni és átadni, melyre a hallgató a bemutatáskor érdemjegyet kap. Javítási lehetőség a vizsgaidőszakban a hiányosságok pótlása mellett ismételt bemutatással, megvédéssel lehetséges. Vizsga/számonkérés Szóbeli. A szorgalmi időszak végén az előre kiadott projektfeladat során elért eredmények bemutatása, megvédése szóban. Konzultáció Emailben az oktatóval előre egyezetetett időpontban. https://github.com/dennybritz/deeplearning-papernotes https://github.com/hussius/deeplearning-biology https://github.com/intel/mkl-dnn https://github.com/NervanaSystems/ngraph https://ngraph.nervanasys.com/docs/latest/ add: 1. Introduction to Deep Learning 2. Neural Networks and Backpropagation 3. Embeddings and Recommender Systems 4. Convolutional Neural Networks for Image Classification 5. Deep Learning for Object Detection and Image Segmentation 6. Recurrent Neural Networks and NLP 7. Sequence to Sequence, Attention and Memory 8. Expressivity, Optimization and Generalization 9. Imbalanced Classification and Metric Learning 10. Unsupervised Deep Learning and Generative models 11. Ensemble Learning 12. Autoencoders and Decoders 13. Visualizing Convolutional Neural Networks 14. Software Packages python2/3 és az adattudományban + deep learning python2/3 környezet beállítása repoból python2/3 környezet beállítása forrásbó fordítással, telepítéssel python2/3 virtuális környezetek használata tensorflow keras cafee theano matlab intel caffe hpc megoldások pytorch hibrid deep learning NLP Biology distributed deep learning mkl-dnn Intel neural compute stick