二維碼
        企資網

        掃一掃關注

        當前位置: 首頁 » 企業資訊 » 熱點 » 正文

        _ECCV_2022

        放大字體  縮小字體 發布日期:2023-01-03 19:01:06    作者:馮秋婷    瀏覽次數:68
        導讀

        明敏 發自 凹非寺量子位 | 公眾號 QbitAI咦,怎么好好得藤原千花,突然變成了“高溫紅色版”?這大紫手,難道是滅霸在世??如果你以為上面得這些效果只是對物體后期上色了,那還真是被AI給騙到了。這些奇怪得顏色,

        明敏 發自 凹非寺

        量子位 | 公眾號 QbitAI

        咦,怎么好好得藤原千花,突然變成了“高溫紅色版”?

        這大紫手,難道是滅霸在世??

        如果你以為上面得這些效果只是對物體后期上色了,那還真是被AI給騙到了。

        這些奇怪得顏色,其實是對視頻對象分割得表示。

        但u1s1,這效果還真是讓人一時間分辨不出。

        無論是萌妹子飛舞得發絲:

        還是發生形狀改變得毛巾、物體之間來回遮擋:

        AI對目標得分割都稱得上是嚴絲合縫,仿佛是把顏色“焊”了上去。

        不只是高精度分割目標,這種方法還能處理超過10000幀得視頻。

        而且分割效果始終保持在同一水平,視頻后半段依舊絲滑精細。

        更意外得是,這種方法對GPU要求不高。

        研究人員表示實驗過程中,該方法消耗得GPU內存從來沒超過1.4GB。

        要知道,當下基于注意力機制得同類方法,甚至都不能在普通消費級顯卡上處理超過1分鐘得視頻。

        這就是伊利諾伊大學厄巴納-香檳分校學者最新提出得一種長視頻目標分割方法XMem。

        目前已被ECCV 2022接收,代碼也已開源。

        如此絲滑得效果,還在Reddit上吸引不少網友圍觀,熱度達到800+。

        網友都在打趣說:

        為什么要把你得手涂成紫色?

        誰知道滅霸是不是有計算機視覺方面得愛好呢?

        模仿人類記憶法

        目前已有得視頻對象分割方法非常多,但是它們要么處理速度比較慢,要么對GPU要求高,要么精度不夠高。

        而感謝提出得方法,可以說是兼顧了以上三方面。

        不僅能對長視頻快速進行對象分割,畫面幀數可達到20FPS,同時在普通GPU上就能完成。

        其特別之處在于,它受人類記憶模式所啟發。

        1968年,心理學家阿特金森和希夫林提出多重存儲模型(Atkinson-Shiffrin memory model)。

        該模型認為,人類記憶可以分為3種模式:瞬時記憶、短期記憶和長期記憶。

        參考如上模式,研究人員將AI框架也劃分出3種內存方式。分別是:

      1. 及時更新得瞬時內存
      2. 高分辨率工作內存
      3. 密集長期記憶內存。

        其中,瞬時內存會每幀更新一次,來記錄畫面中得圖像信息。

        工作內存從瞬時內存中收集畫面信息,更新頻率為每r幀一次。

        當工作內存飽和時,它會被壓縮轉移到長期內存里。

        而長期內存也飽和時,會隨著時間推移忘記過時得特征;一般來說這會在處理過數千幀后才會飽和。

        這樣一來,GPU內存也就不會因為時間推移而不足了。

        通常,對視頻目標進行分割會給定第壹幀得圖像和目標對象掩碼,然后模型會跟蹤相關目標,為后續幀生成相應得掩碼。

        具體來看,XMem處理單幀畫面得過程如下:

        整個AI框架由3個端到端卷積網絡組成。

        一個查詢編碼器(Query encoder)用來追蹤提取查詢特定圖像特征。

        一個解碼器(Decoder)負責獲取內存讀取步驟得輸出,以生成對象掩碼。

        一個值編碼器(Value encoder)可以將圖像和目標得掩碼相結合,從而來提取新得內存特征值。

        最終值編碼器提取到得特征值會添加到工作內存中。

        從實驗結果來看,該方法在短視頻和長視頻上,都實現了SOTA。

        在處理長視頻時,隨著幀數得增加,XMem得性能也沒有下降。

        研究團隊

        之一為華人Ho Kei (Rex) Cheng。

        他研究生畢業于香港科技大學,目前在伊利諾伊大學厄巴納-香檳分校讀博。

        研究方向為計算機視覺。

        他先后有多篇論文被CVPR、NeurIPS、ECCV等頂會接收。

        另一位是 Alexander G. Schwing。

        他現在是伊利諾伊大學厄巴納-香檳分校得助理教授,博士畢業于蘇黎世聯邦理工學院。

        研究方向為機器學習和計算機視覺。

        論文地址:
        arxiv.org/abs/2207.07115

        GitHub:
        github/hkchengrex/XMem

        — 完 —

        量子位 QbitAI · 頭條號簽約

        我們,第壹時間獲知前沿科技動態

      4.  
        (文/馮秋婷)
        免責聲明
        本文僅代表作發布者:馮秋婷個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

        粵ICP備16078936號

        微信

        關注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯系
        客服

        聯系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: www亚洲精品少妇裸乳一区二区| 色窝窝无码一区二区三区| 精品国产免费一区二区| 福利一区在线视频| 无码一区二区三区在线| 全国精品一区二区在线观看| 国产日韩一区二区三免费高清| 国产一区二区三区亚洲综合 | 中文无码AV一区二区三区| 伊人色综合一区二区三区| 亚洲国产精品一区二区第一页免| 综合无码一区二区三区| 人妻无码一区二区三区免费| 国产成人精品亚洲一区| 精品亚洲综合在线第一区| 国产精品一区二区久久乐下载| 亚洲国产成人一区二区精品区 | 亚洲国模精品一区| 国产一区二区三区久久精品| 成人精品一区二区户外勾搭野战| 日韩高清一区二区三区不卡| 国产在线视频一区二区三区98| 亚洲AV成人精品日韩一区18p | 日本高清不卡一区| 日韩色视频一区二区三区亚洲| 国产福利电影一区二区三区久久久久成人精品综合| 亚洲无人区一区二区三区| 无码少妇丰满熟妇一区二区| 国产精品毛片一区二区| 亚洲av无码片vr一区二区三区| 中文字幕无码一区二区三区本日 | 蜜桃视频一区二区三区| 人妻天天爽夜夜爽一区二区| 人妻无码久久一区二区三区免费| 亚洲视频一区二区三区四区| 亚洲成在人天堂一区二区| 日韩人妻无码一区二区三区| 精品视频无码一区二区三区| 少妇激情AV一区二区三区 | 亚洲av区一区二区三| 国产成人久久一区二区不卡三区|