題目:基礎模型驅動的多模態行人檢索與可控生成
報告人:葉茫
時間:2024年11月29日(周五),15:30-16:30
會議地點:31-904
報告摘要:
多模態行人檢索在智慧城市等領域有重要應用,現有方法通常獨立的去研究單一的跨模態檢索任務,極大的限制了實際不確定場景的靈活性,本次報告將介紹如何利用多模態預訓練模型,構建不確定多模態場景下的行人檢索基礎模型等相關工作,同時分享文本引導的可控人像生成相關研究進展及應用。
報告人簡介:
葉茫,武漢大學教授,國家級高層次青年人才、中國科協青年托舉人才。主要研究方向多媒體檢索、多模態理解、聯邦學習等,發表國際期刊會議論文 100 余篇,其中第一/通訊作者發表 CCF-A 類論文60余篇,谷歌學術引用近萬次。擔任CCF-A類期刊IEEE TIFS等SCI期刊編委,多次擔任CVPR、ICLR、ACM MM、ECCV等學術會議領域主席。主持國自科-香港聯合基金、湖北省重點研發計劃等10余項科研項目。獲谷歌優秀獎學金、ICCV2021 無人機特定行人檢索賽道冠軍、2021-2024斯坦福排行榜 “全球前2%頂尖科學家”、2022年度百度AI華人青年學者等榮譽。
中國·浙江 湖州市二環東路759號(313000) 浙ICP備10025412號 浙公網安備 33050202000195號 版權所有:黨委宣傳部