Facebook近日宣布開放Detectron,即該公司基于深度學(xué)習(xí)框架的計(jì)算機(jī)視覺(jué)對(duì)象檢測(cè)算法平臺(tái)。
Facebook近日宣布開放Detectron,即該公司基于深度學(xué)習(xí)框架的計(jì)算機(jī)視覺(jué)對(duì)象檢測(cè)算法平臺(tái)。該公司表示,開放項(xiàng)目的動(dòng)機(jī)在于加速計(jì)算機(jī)視覺(jué)研究,F(xiàn)acebook團(tuán)隊(duì)正在使用該平臺(tái)開發(fā)各種應(yīng)用,包括增強(qiáng)現(xiàn)實(shí)技術(shù)。
在我最近的一篇文章中,詳細(xì)介紹了增強(qiáng)現(xiàn)實(shí)如今面臨的三大挑戰(zhàn),其中的實(shí)時(shí)對(duì)象分類是最大的障礙之一:
要讓計(jì)算機(jī)視覺(jué)理解“杯子”的含義,而不是僅僅看到一個(gè)形狀,這是一個(gè)不容小覷的問(wèn)題。所以這么多年來(lái),我們?cè)贏R演示作品中總會(huì)看到人們把基準(zhǔn)標(biāo)記附加到對(duì)象身上,以實(shí)現(xiàn)更細(xì)致的追蹤和交互。為什么會(huì)如此困難呢?第一個(gè)挑戰(zhàn)在于分類。杯子有數(shù)千種形狀、大小、顏色和紋理。有些杯子擁有特殊的屬性和特殊的用途(如燒杯),也就是說(shuō)不同的杯子的使用場(chǎng)合和背景也有所不同。想象一下,編寫這么一個(gè)可以幫助計(jì)算機(jī)理解上述所有概念的算法是多大的挑戰(zhàn)。你也可以想象,編寫一個(gè)向計(jì)算機(jī)解釋杯子和碗之間區(qū)別的代碼是多么地困難。
該文章還指出,“深度學(xué)習(xí)”有可能是實(shí)時(shí)對(duì)象分類的其中一種解決方案——這種學(xué)習(xí)涉及“訓(xùn)練”計(jì)算機(jī)去解讀它所看到的事物,而不是人工去編寫檢測(cè)程序。本周,F(xiàn)acebook已經(jīng)正式開源了他們的對(duì)象檢測(cè)算法,這可能會(huì)加速能進(jìn)行實(shí)時(shí)對(duì)象分類的系統(tǒng)的開發(fā),從而讓增強(qiáng)現(xiàn)實(shí)發(fā)揮真正的功效。
如果沒(méi)有對(duì)特定環(huán)境進(jìn)行預(yù)編程,與我們周圍世界進(jìn)行交互的增強(qiáng)現(xiàn)實(shí)將需要對(duì)我們附近的情況有粗略了解。比方說(shuō),如果你正戴著一款A(yù)R眼鏡,你希望把烤箱的溫度投影到烤箱上方,同時(shí)在冰箱上方投影出已經(jīng)快要吃完的食物,這時(shí)AR眼鏡將需要了解烤箱和冰箱的形狀。由于烤箱和冰箱涵蓋的形狀、樣式以及擺放位置都不盡相同,這將成為一項(xiàng)極具挑戰(zhàn)性的任務(wù)。
在深度學(xué)習(xí)算法的鏡頭下,對(duì)象分類是什么樣子的
Facebook的人工智能研究團(tuán)隊(duì)與其他相關(guān)團(tuán)隊(duì)一直在研究,如何利用深度學(xué)習(xí)來(lái)幫助計(jì)算機(jī)解決對(duì)象檢測(cè)的問(wèn)題,而這一基于Caffe2深度學(xué)習(xí)框架的對(duì)象檢測(cè)算法就叫作Detectron。在正式托管至GitHub后,現(xiàn)在任何人都可以自行嘗試。Facebook希望,Detectron開源后能幫助世界各地的計(jì)算機(jī)視覺(jué)研究人員進(jìn)行新的嘗試,并不斷改進(jìn)最新的技術(shù)。
該項(xiàng)目的GitHub頁(yè)面上寫道:“Detectron旨在為對(duì)象檢測(cè)研究提供高質(zhì)量、高性能的代碼庫(kù)。Detectron的設(shè)計(jì)十分靈活,能夠支持新研究的快速實(shí)施與評(píng)估?!?/p>
算法可以檢測(cè)視頻輸入,并能夠猜測(cè)出構(gòu)成場(chǎng)景的離散對(duì)象。“檢測(cè)和識(shí)別人類與物體的交互作用 (Gkioxari et al)”等研究項(xiàng)目已經(jīng)在使用Detectron了,并以其為基礎(chǔ)來(lái)了解人類在特定環(huán)境中利用物體作出的行為。這是向正確的方向邁出的一步,以幫助計(jì)算機(jī)理解我們正在做的事情,從而能夠?yàn)槊β档奈覀兲峁┯袃r(jià)值的信息。
除了人工智能研究之外,Detectron還被用于Facebook的其他內(nèi)部團(tuán)隊(duì);Facebook在Detectron的開源聲明中寫道:“各支團(tuán)隊(duì)正在利用這個(gè)平臺(tái)來(lái)為各種應(yīng)用進(jìn)行定制模型訓(xùn)練,其中也包括增強(qiáng)現(xiàn)實(shí)和社區(qū)完整性研究?!?/p>
目前尚不清楚具體是哪支團(tuán)隊(duì)正在把Detectron用于增強(qiáng)現(xiàn)實(shí),不過(guò)很可能就是Oculus。早在F8大會(huì)期間,Oculus的首席科學(xué)家Michael Abrash就曾探討過(guò),增強(qiáng)現(xiàn)實(shí)將如何并于何時(shí)徹底改變我們的生活。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)