您現(xiàn)在的位置:首頁 > 背景提升 > 數(shù)據(jù)科學(xué)課題-基于數(shù)據(jù)挖掘的推薦系統(tǒng)研究
驗證碼

獲取驗證碼

數(shù)據(jù)科學(xué)課題-個性化廣告推送原理:基于數(shù)據(jù)挖掘的推薦系統(tǒng)研究


項目背景

當(dāng)你發(fā)現(xiàn)刷抖音停不下來,當(dāng)你在朋友圈里看到精準(zhǔn)的廣告投放,當(dāng)你讓Siri規(guī)劃回家路線,這背后的強大驅(qū)動力便是數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)。數(shù)據(jù)挖掘又稱知識發(fā)現(xiàn),即從數(shù)據(jù)中挖掘知識。在當(dāng)下信息爆炸時代,面對龐大的數(shù)據(jù)庫,最主要的困難就是有效信息難以提煉, John Nalsbert稱之為“信息豐富而知識貧乏”窘境。因此,對海量數(shù)據(jù)進(jìn)行深入分析,發(fā)現(xiàn)并提取隱藏在其中的信息,以更好地利用這些數(shù)據(jù)的需求愈發(fā)強烈。但僅以數(shù)據(jù)庫系統(tǒng)的錄入、查詢、統(tǒng)計等功能,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢,更缺乏挖掘數(shù)據(jù)背后隱藏知識的手段。正是在這樣的條件下,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。項目將圍繞數(shù)據(jù)挖掘原理及其在推薦系統(tǒng)中的應(yīng)用展開。

項目介紹

項目中,導(dǎo)師將介紹用于知識發(fā)現(xiàn)的大數(shù)據(jù)挖掘的基礎(chǔ)編程模型和算法。學(xué)生對其代碼實現(xiàn)后,將使用真實生活中的數(shù)據(jù)集(如Yelp評論、亞馬遜交易和MovieLens數(shù)據(jù)等)進(jìn)行模型訓(xùn)練,并檢測出有意義的用戶偏好及習(xí)慣。在項目中后期,學(xué)生將結(jié)合所學(xué)知識及導(dǎo)師建議對基礎(chǔ)推薦算法及模型進(jìn)一步優(yōu)化研究,構(gòu)建一個新穎、準(zhǔn)確且高效的個性化推薦系統(tǒng),并在項目結(jié)束時提交項目報告、進(jìn)行成果展

個性化研究課題參考 

構(gòu)建基于內(nèi)容的電影推薦系統(tǒng) 

構(gòu)建基于協(xié)同過濾的推薦系統(tǒng)

構(gòu)建一個混合位置的餐廳推薦系統(tǒng)

數(shù)據(jù)挖掘其他應(yīng)用如:使用公開數(shù)據(jù)進(jìn)行空氣質(zhì)量預(yù)測和預(yù)報

適合人群

高中生/大學(xué)生

數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、計算機(jī)科學(xué)、軟件工程、數(shù)學(xué)等專業(yè)方向或者對上述方向感興趣的學(xué)生; 學(xué)生需要掌握線性代數(shù)及概率論與數(shù)理統(tǒng)計知識,至少熟練使用一門編程語言并修讀過算法與數(shù)據(jù)結(jié)構(gòu),有數(shù)據(jù)分析項目相關(guān)經(jīng)驗的申請者優(yōu)先

導(dǎo)師介紹

南加州大學(xué) 終身教授

Yao-yi導(dǎo)師現(xiàn)任南加州大學(xué)空間科學(xué)終身教授,空間計算實驗室主任,南加州大學(xué)(USC)美國國家科學(xué)基金會綜合媒體系統(tǒng)中心(IMSC)副主任。導(dǎo)師同時在南加州大學(xué)維特比數(shù)據(jù)科學(xué)碩士項目中擔(dān)任教學(xué)工作。導(dǎo)師目前的研究將空間科學(xué)理論與計算機(jī)算法相結(jié)合,從異構(gòu)數(shù)據(jù)中發(fā)現(xiàn)新見解,以解決現(xiàn)實世界的問題。他的研究興趣包括信息集成、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、計算機(jī)視覺和知識圖譜。他獲得了來自諸如NSF、NIH、DARPA、NGA和NEH等機(jī)構(gòu)的資金。導(dǎo)師曾在谷歌AI (NYC)進(jìn)行研究,并曾就職Facebook空間計算小組的機(jī)器學(xué)習(xí)顧問。

任職學(xué)校

南加州大學(xué)(University of Southern California,USC)創(chuàng)立于1880年,坐落于美國加州洛杉磯市中心,是全球領(lǐng)先私立研究型大學(xué),美國最具多元化學(xué)府之一,廣受全球博才智杰推崇。南加州大學(xué)是美國大學(xué)協(xié)會(AAU;研究型大學(xué)聯(lián)盟,會員門檻極高,被許多機(jī)構(gòu)視為衡量大學(xué)學(xué)術(shù)研究和品質(zhì)的基準(zhǔn))的成員,在2020年U.S.News全美大學(xué)數(shù)據(jù)科學(xué)專業(yè)排名Top7。

項目大綱

面向大規(guī)模數(shù)據(jù)處理的并行計算模型和方法

頻繁項級挖掘算法及關(guān)聯(lián)規(guī)則 

聚類分類與數(shù)據(jù)降維 

推薦系統(tǒng) 

學(xué)術(shù)研討1:教授與各組學(xué)生探討并評估個性化研究課題可行性,幫助學(xué)生明晰后續(xù)科研思路 

學(xué)術(shù)研討2:學(xué)生將在本周課前完成程序設(shè)計原型(prototype)及偽代碼(Pseudocode),教授將根據(jù)各組進(jìn)度進(jìn)行個性化指導(dǎo),確保學(xué)生優(yōu)質(zhì)的終期課題產(chǎn)出 

項目成果展示

論文輔導(dǎo) 

時間安排與收獲

7周在線小組科研學(xué)習(xí)+5周論文輔導(dǎo)學(xué)習(xí) 共125課時

學(xué)術(shù)報告

優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter

EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表(可用于申請)

結(jié)業(yè)證書

成績單


更多課程分類
驗證碼

獲取驗證碼