- 關(guān)于我們
- 針對假冒留學(xué)監(jiān)理網(wǎng)的聲明
- 留學(xué)熱線:4000-315-285
留學(xué)中介口碑查詢
項目背景
近年來,人工智能數(shù)據(jù)科學(xué)技術(shù)不斷突破與發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)CNN開啟了深度學(xué)習(xí)新篇章,推動計算機視覺落地自動化駕駛等諸多領(lǐng)域;循環(huán)神經(jīng)網(wǎng)絡(luò)RNN推動了自然語言處理,使得機器翻譯、智能語音技術(shù)日趨成熟;深度學(xué)習(xí)之上,強化學(xué)習(xí)圖神經(jīng)網(wǎng)絡(luò)GNN的崛起正在深度賦能數(shù)據(jù)挖掘,將成為企業(yè)場景拓展、數(shù)據(jù)整合、行業(yè)效率飛躍的關(guān)鍵。項目將聚焦強化學(xué)習(xí),特別是圖神經(jīng)網(wǎng)絡(luò)GNN這一構(gòu)筑未來數(shù)字生態(tài)的核心數(shù)據(jù)科學(xué)技術(shù)。
項目介紹
項目內(nèi)容涉及強化學(xué)習(xí)核心理論和技能,具體包括遺傳算法、強化學(xué)習(xí)框架、Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決策過程、優(yōu)化控制、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動機器學(xué)習(xí)(Auto ML)等。學(xué)生通過項目了解如何開發(fā)基于強化學(xué)習(xí)的生產(chǎn)力軟件,在結(jié)束時提交項目報告,進行成果展示。
適合人群
大學(xué)生
計算機科學(xué)、人工智能、數(shù)據(jù)科學(xué)、電子與計算機工程等專業(yè),軟件工程、自動化等相關(guān)專業(yè)或者希望掌握強化學(xué)習(xí)的學(xué)生;對人工智能、大數(shù)據(jù)以及交叉學(xué)科和方向感興趣的學(xué)生;學(xué)生需要具備計算機科學(xué)、線性代數(shù)、編程基礎(chǔ)
導(dǎo)師介紹
劍橋大學(xué)終身正教授
Dr.Pietro is a Full Professor at the Department of Computer Science and Technology of the University of Cambridge and a member of the Artificial Intelligence group. Prof. Pietro is also a member of the Cambridge Centre for AI in Medicine. His research interest focuses on developing Artificial Intelligence and Computational Biology models to understand disease complexity and address personalized and precision medicine. The current focus is on Graph Neural Network modeling.
Pietro導(dǎo)師現(xiàn)任劍橋大學(xué)計算機科學(xué)與技術(shù)終身正教授,持有歐洲學(xué)習(xí)和智能系統(tǒng)實驗室(Ellis;歐洲大型跨國人工智能研究所,目前擁有千位全球頂尖計算機工程師、數(shù)學(xué)家和其他領(lǐng)域科學(xué)家,旨在重構(gòu)歐洲人工智能前沿研究)席位、劍橋大學(xué)大數(shù)據(jù)研究指導(dǎo)委員會席位。Pietro導(dǎo)師的研究興趣為人工智能圖神經(jīng)網(wǎng)絡(luò)建模,在國際知名學(xué)術(shù)期刊發(fā)表論文多篇,曾榮獲歐盟委員會未來與新興技術(shù)(FET;迄今歐盟規(guī)模最大、資助力度最強的科研資助項目之一)會展三等獎。
任職學(xué)校
劍橋大學(xué)建校于1209年,是世界范圍內(nèi)歷史最為悠久的大學(xué)之一,英國Top2名校,G5名校之一。劍橋大學(xué)享有世界聲譽,在英國社會和高等教育系統(tǒng)中具有極其重要的地位,同時具有廣泛的世界性影響。許多青年學(xué)子都以到劍橋大學(xué)深造為理想。劍橋大學(xué)在2020年QS世界大學(xué)綜合排名位列第7。
項目大綱
強化學(xué)習(xí):項目將在本周聚焦遺傳算法和強化學(xué)習(xí)框架。Introduction to reinforcement learning
環(huán)境:強化學(xué)習(xí)由智能體和環(huán)境兩部分構(gòu)成。項目將在本周探討離策略、無模型強化學(xué)習(xí)算法Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決策過程等。Environment
優(yōu)化:項目將在本周深入學(xué)習(xí)強化學(xué)習(xí)與優(yōu)化控制。Optimization
集成與控制Integration and Control
集成:項目將在本周進一步探討圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動機器學(xué)習(xí)(Auto ML)等。Integration
項目回顧與成果展示Program Review and Presentation
論文輔導(dǎo) Project Deliverables Tutoring
時間安排與收獲
7周在線小組科研學(xué)習(xí)+5周論文輔導(dǎo)學(xué)習(xí) 共125課時
學(xué)術(shù)報告
優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表(可用于申請)
結(jié)業(yè)證書
成績單