報(bào)告時(shí)間:2021年7月16日上午9點(diǎn)
報(bào)告人:上海交通大學(xué) 林巍峣 教授
地點(diǎn):機(jī)器人視覺感知與控制技術(shù)國家工程實(shí)驗(yàn)室一樓報(bào)告廳
摘要:
隨著多媒體應(yīng)用與服務(wù)的迅速發(fā)展,視頻中的行為、屬性等語義信息在大規(guī)模多媒體系統(tǒng)中的應(yīng)用日益重要,因此,對(duì)語義信息的精準(zhǔn)提取及高效壓縮等需求,正變得日益顯著。在本次報(bào)告中,我們將介紹我們課題組在大規(guī)模語義信息提取與壓縮方面的一些工作。首先,我們將介紹我們在目標(biāo)行為和交互語義提取方面的工作,我們對(duì)當(dāng)前的行為識(shí)別與定位架構(gòu)進(jìn)行的重新建模,并提出了從全局到局部的漸進(jìn)行為提取架構(gòu)。其次,我們將介紹多模態(tài)聯(lián)合視頻理解的工作,通過音視頻的聯(lián)合分析,實(shí)現(xiàn)對(duì)多媒體信息中目標(biāo)的精確定位和分析。第三,我們還將介紹我們在語義信息壓縮編碼方面的工作,我們設(shè)計(jì)了面向目標(biāo)關(guān)鍵點(diǎn)序列等基礎(chǔ)語義的壓縮編碼架構(gòu),實(shí)現(xiàn)了平均60%以上的碼率節(jié)省。最后,我們也將介紹一下我們的工作在實(shí)際場景中的一些應(yīng)用演示。
簡介:
林巍峣,上海交通大學(xué)教授,上海市五四青年獎(jiǎng)?wù)隆⑸虾J衅纸瞬?,并入選權(quán)威國際會(huì)議ICME'19評(píng)選的多媒體學(xué)術(shù)新星。部分成果獲國際權(quán)威評(píng)測MOT第一,被音視頻編碼國家標(biāo)準(zhǔn)(AVS)采納,并被英國BBC等國際權(quán)威媒體報(bào)道。獲2017微軟創(chuàng)新年會(huì)唯一最佳成果獎(jiǎng)。
林巍峣現(xiàn)為IEEE高級(jí)會(huì)員(IEEE Senior Member),同時(shí)擔(dān)任IEEE 多媒體信號(hào)處理專委會(huì)(MMSP TC) 、IEEE多媒體系統(tǒng)與應(yīng)用專委會(huì)(MSA TC) 、 IEEE 多媒體通信專委會(huì) (MMTC) 以及中國計(jì)算機(jī)協(xié)會(huì)多媒體專委會(huì)等多個(gè)學(xué)術(shù)組織專業(yè)委員會(huì)的委員;擔(dān)任IEEE Trans. Image Processing, Trans. Circuits and Systems for Video Technology, IEEE Trans. Intelligent Transportation Systems等6個(gè)SCI期刊編委。擔(dān)任ICPR’20、BMVC’19、MM'18、ICIP'19、ICME'18等領(lǐng)域主席(Area Chair)。在相關(guān)領(lǐng)域共發(fā)表IEEE Transactions系列及CVPR、ICCV、AAAI等權(quán)威期刊和會(huì)議論文40余篇,獲專利18項(xiàng)。