【
儀表網 研發快訊】 計算機視覺(Computer Vision)是人工智能領域的重要分支,旨在讓計算機像人一樣“看”懂圖像和視頻,在城市安全、智能駕駛、工業制造等方面具有廣泛應用價值。隨著移動互聯網的快速發展以及各類視頻拍攝設備的加速普及,如何“更細、更快、更準”地完成各類視覺任務成為領域發展的重要方向,亟需更高的“算力”來支撐。然而實際應用中,算力始終有限,致使前沿視覺算法難以落地。因此,如何在不損失精度和粒度的前提下,減少視覺任務的算力需求,是攻克領域痛點、加速應用落地的關鍵,具有研究意義。
鑒于此,中國石油大學青島軟件學院、計算機科學與技術學院陳程立詔教授團隊以仿生智能為手段,參考視腦交叉、視覺余暉、瞬時記憶等能夠使人類在復雜環境中快速、準確地聚焦“重要內容”的生理機制,提出系列仿生視覺顯著性方法,大幅改善對復雜環境的感知粒度,提升對重要目標的檢測精度,并降低后繼高層次視覺任務的算力開銷。相關成果已在IEEE Transactions on Pattern Analysis and Machine Intelligence《IEEE模式分析與機器智能匯刊》、IEEE Transactions on Circuits and Systems for Video Technology《IEEE視頻技術電路與系統匯刊》、IEEE Transactions on Intelligent Transportation Systems《IEEE智能交通系統匯刊》、IEEE Transactions on Vehicular Technology《IEEE車輛技術匯刊》、IEEE Transactions on Instrumentation and Measurement《IEEE儀器與測量匯刊》、AAAI《人工智能大會》、Science China Information Sciences《中國科學:信息科學》等多個人工智能領域重要刊物和會議發表。相關研究工作得到山東省自然科學基金優秀青年項目、國家自然科學基金面上項目、青年項目、山東省青創團隊項目支持。
全景視頻導航是類腦視覺研究中的關鍵應用,旨在通過模擬人類大腦的視覺處理機制,優化沉浸式視頻內容的語義表達與導航效率。針對全景視頻導航可用監督數據稀缺痛點,團隊提出了一種全新的弱監督學習方法,通過模擬人類語義驅動的注意力分配與高階認知表征過程,精準捕獲全景視頻內容的語義重要性,構建了能夠精準評估和優先排序語義重要性的導航框架,為降低后繼高層次虛擬現實應用的算力開銷提供了創新理論支持。該研究成果以“Saliency-Free and Aesthetic-Aware Panoramic Video Navigation”為題發表在人工智能領域影響力最高的期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。陳程立詔教授是論文第一作者。
在全景視頻中,常用的注視收集方式是佩戴頭戴式
顯示器(HMD)自由瀏覽并記錄注視點。但由于用戶無法持續旋轉頭部,采集的數據往往局限于局部視野,難以全面反映整體重要性。為此,團隊提出了WinDB(全景視頻動態模糊輔助窗口方法),無需HMD即可無盲區采集注視數據,更準確呈現整體重要性。基于WinDB,團隊構建了一個全新的大規模數據集,并系統性揭示了頻繁且密集的“注視點轉移”現象。相關成果以“WinDB: HMD-Free and Distortion-Free Panoptic Video Fixation Learning”為題發表在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。陳程立詔教授是論文唯一通訊作者。
主流的視覺顯著性檢測方法常采用弱監督技術來降低學習過程對有標注數據的需求,但面對復雜場景,以人工方式進行像素級標注費時費力,可用于模型訓練的數據始終不足。針對這一問題,團隊提出了一種輕量級的標注方法——“點”標注——用戶僅需要用鼠標在圖片上標注幾個離散的點,就能達到和傳統像素級精細標注近似(98%~99%)的模型訓練效果。新方法能夠極大地豐富可用監督數據,緩解數據饑渴痛點。相關成果以“Pixel is All You Need: Adversarial Spatio-Temporal Ensemble Active Learning for Salient Object Detection”為題發表在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。陳程立詔教授是論文唯一通訊作者。
視頻異常檢測旨在在復雜動態環境中準確識別出異常行為。針對現有方法在處理場景相關異常時普遍存在的泛化能力弱、上下文理解不足的問題,團隊提出了一種基于知識圖譜的場景-動作解耦與交織模型。該模型通過引入場景與動作解耦機制,分別提取干凈的背景場景與人體骨骼動作特征,并構建知識圖譜對二者的復雜關系進行顯式建模。隨后,模型利用特征交織策略融合場景與動作信息,生成更具語義理解的異常評分,同時通過不確定性優化機制,進一步提高了邊界樣本的檢測精度和模型泛化性能。相關成果以“Unveiling Context-Related Anomalies: Knowledge Graph Empowered Decoupling of Scene and Action for Human-Related Video Anomaly Detection”為題發表在《IEEE Transactions on Circuits and Systems for Video Technology》上。陳程立詔教授是論文第一作者。
圖像質量評估旨在預測圖像在各種失真條件下的感知質量得分。傳統研究通常將自然圖像與屏幕內容圖像分開處理,分別針對其獨特的內容與失真特性設計獨立模型。然而,由于兩類圖像在內容組成、失真類型及主觀評分
標準等方面存在顯著差異,現有方法難以實現自然圖像與屏幕圖像質量評估任務之間的聯合提升。針對這一挑戰,研究團隊提出了一種統一的圖像質量評估框架UNI-IQA,通過引入內容感知數據切換模塊,首次在自然圖像與屏幕圖像之間實現了基于內容區域劃分的端到端相互促進學習。相關成果以“UNI-IQA: A Unified Approach for Mutual Promotion of Natural and Screen Content Image Quality Assessment”為題發表在《IEEE Transactions on Circuits and Systems for Video Technology》上。陳程立詔教授是論文唯一通訊作者。
RGB-D顯著性目標檢測(SOD)作為計算機視覺中的重要任務,廣泛應用于自動駕駛、交通監控等場景。然而,現有方法模型多基于通用數據集訓練,在面對特定交通場景時存在嚴重的領域偏移問題,導致檢測性能顯著下降。針對這一挑戰,研究團隊提出了一種面向交通場景的RGB-D SOD領域自適應方法,通過弱監督方式自動構建高質量的可訓練數據集,顯著提升模型在特定場景下的檢測能力,在常規數據集和實際交通數據集上均取得了優異性能。相關成果以“Adapting Generic RGB-D Salient Object Detection for Specific Traffic Scenarios”為題發表在《IEEE Transactions on Intelligent Transportation Systems》上。陳程立詔教授是論文第一作者。
特征選擇是全景導航中的關鍵步驟,旨在從原始數據中篩選出最相關、最有用的特征,以提升導航性能。團隊提出一種任務意識的特征選擇模型,該模型利用不同任務傾向特征的類型,構造最優的特征選擇方案,并通過分析特征與任務相關性,采用了特征路由機制。此外,根據不同任務和特征的關系,設計了相互自我訓練策略,顯著提升了模型的性能。相關成果以“SiamTADT: A Task-Aware Drone Tracker for Aerial Autonomous Vehicles”為題發表在《IEEE Transactions on Vehicular Technology》上。陳程立詔教授是論文唯一通訊作者。
全景圖像(360°圖像)中的物體排序是全景感知與圖像檢索中的關鍵問題,旨在對場景中所有物體進行精細化重要性排序。針對現有顯著性排序方法僅關注顯著物體、忽略非顯著重要物體的問題,研究團隊提出了一種面向360°場景的“細粒度”重要性排序方法(FOIR-360)。該方法通過局部視角劃分與迭代抹除策略生成高質量偽標簽,結合局部排名聚合與多標簽融合機制,訓練出具備端到端預測能力的PanoRank網絡,實現全景物體的重要性排序。同時,研究團隊制定了新的注釋協議,建立了首個細粒度全景排序數據集360Rank,有效促進了任務標準化發展。相關成果以“Fine-Grained Perception in Panoramic Scenes: A Novel Task, Dataset, and Method for Object Importance Ranking”為題發表在《AAAI2025》(國際人工智能大會)上。陳程立詔教授是論文唯一通訊作者。
近年來,陳程立詔教授主要從事仿生視覺顯著性方面的研究工作,牽頭組建了山東省優秀青年創新團隊,承擔山東省自然科學基金優秀青年項目,國家自然科學基金面上、青年項目等10余項,以第一或通訊作者發表IEEE/ACM系列匯刊論文45篇、CCFA類(CCF A 類期刊和會議通常代表計算機領域內具有最高學術水平和影響力的出版物)論文29篇,引用3000+,獲評第十四屆青島市青年科技獎、山東省人工智能優秀青年獎、山東省人工智能自然科學二等獎、ACM中國新星獎(青島),連續入選全球前2%頂尖科學家榜單,在仿生智能領域形成了一定的國際影響力。
所有評論僅代表網友意見,與本站立場無關。