欧美日韩国产一区二区三区,自拍偷自拍亚洲精品播放,亚洲人成电影网站色…,久久视频一区二区

當(dāng)前位置: 首頁 ?  新聞中心 ?  行業(yè)新聞 ? 南洋理工大學(xué)開發(fā)高精度手勢識別機(jī)器學(xué)習(xí)架構(gòu)

南洋理工大學(xué)開發(fā)高精度手勢識別機(jī)器學(xué)習(xí)架構(gòu)

通望科技 2020-08-28 2290

新加坡南洋理工大學(xué)和澳大利亞悉尼理工大學(xué)最近開發(fā)了一種旨在以高精度識別手勢的機(jī)器學(xué)習(xí)架構(gòu),而方式是通過分析可伸縮應(yīng)變傳感器捕捉到的圖像。研究人員已經(jīng)將論文發(fā)表在《Nature Electronics(自然電子)》中,并表示新架構(gòu)的靈感來自人類大腦。

南陽理工大學(xué)的陳曉東教授表示:“我們的項(xiàng)目概念源于人腦處理信息的方式。在人腦中,思維、計(jì)劃、靈感等高感性活動(dòng)不僅依賴于特定的感官信息,其同時(shí)屬于不同感官的多種感官信息的綜合整合。這啟發(fā)了我們結(jié)合視覺信息和體感信息來實(shí)現(xiàn)高精度的手勢識別。”

 b10a42729e2b42a64248eac5f00b43d1.png

在解決實(shí)際任務(wù)時(shí),人類通常會(huì)整合從周圍環(huán)境收集的視覺信息和體感信息。這兩種類型的信息彼此互補(bǔ),而可以更好地幫助人類理解問題涉及的所有要素。

所以在開發(fā)手勢識別技術(shù)時(shí),陳曉東教授及同事確保它能夠整合由多個(gè)傳感器收集的不同類型信息。最終,團(tuán)隊(duì)的目標(biāo)是建立一個(gè)能夠以高精度識別人類手勢的架構(gòu)。

陳曉東教授解釋道:“為了達(dá)到我們的目標(biāo),我們通過設(shè)計(jì)和制造可伸展的舒適傳感器來改進(jìn)傳感器的數(shù)據(jù)質(zhì)量。與現(xiàn)有的可穿戴傳感器相比,這種傳感器可以收集更精確的手勢體感數(shù)據(jù)。另外,我們開發(fā)了一種生物啟發(fā)式的體感視覺(Bioinspired Somatosensory-Visual;BSV)學(xué)習(xí)架構(gòu),它可以合理地融合視覺信息和體感信息,這類似于大腦中的體感-視覺融合結(jié)構(gòu)。”

所述的BSV學(xué)習(xí)架構(gòu)復(fù)刻了人腦是如何以多種方式融合體感信息和視覺信息,但方式是通過一個(gè)仿生生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

另外,機(jī)器學(xué)習(xí)架構(gòu)中的一些分段網(wǎng)絡(luò)將如同大腦神經(jīng)網(wǎng)絡(luò)一樣處理相同的模態(tài)感覺數(shù)據(jù)。例如,分段卷積神經(jīng)網(wǎng)絡(luò)(CNN)專門執(zhí)行卷積運(yùn)算,復(fù)制生物神經(jīng)系統(tǒng)內(nèi)局部感受場的功能,從而模擬人腦視覺處理部分發(fā)生的初始視覺信息處理。

 af48da0805c578a54ae39223cb813a86.png

最后,研究人員設(shè)計(jì)的架構(gòu)使用了新開發(fā)的稀疏神經(jīng)網(wǎng)絡(luò)來融合特征。這個(gè)網(wǎng)絡(luò)復(fù)刻了大腦多傳感神經(jīng)元是如何表示視覺信息和體感信息之間高效初始交互。

陳曉東教授表示:“我們開發(fā)的技術(shù)有三個(gè)獨(dú)特的特點(diǎn)。首先,它可以處理視覺和體感信息的早期交互。其次,CNN的卷積運(yùn)算類似于生物神經(jīng)系統(tǒng)中的局部感受場的功能,它可以自動(dòng)學(xué)習(xí)層次化的深空特征,并從原始圖像中提取平移不變特征。最后,我們提出了一種基于弗羅貝尼烏斯定理?xiàng)l件數(shù)的疏剪策略來實(shí)現(xiàn)高效的稀疏神經(jīng)網(wǎng)絡(luò)。”

在一系列的初步評估中,這種BSV學(xué)習(xí)架構(gòu)的結(jié)果優(yōu)于單模態(tài)識別方法(即只單獨(dú)處理視覺或體感數(shù)據(jù),而不是同時(shí)考慮兩者)。值得注意的是,與過去開發(fā)的三種多模式識別技術(shù)(加權(quán)平均融合(SV-V)、加權(quán)注意力融合(SV-T)和加權(quán)乘法融合(SV-M)架構(gòu)相比,它能夠更準(zhǔn)確地識別人類手勢。

陳曉東教授說道:“與單模態(tài)識別方法和常見的多模態(tài)識別方法(SV-V、SV-T和SV-M)相比,我們的仿生學(xué)習(xí)架構(gòu)可以達(dá)到最佳的識別精度。在圖像噪點(diǎn)大、曝光不足或曝光過多的非理想情況下,它依然能夠保持較高的識別精度。”

所述的大腦啟發(fā)式架構(gòu)最終可以支持一系列的用例,如能夠讀懂病人肢體語言的醫(yī)療機(jī)器人,幫助創(chuàng)造更先進(jìn)的虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)系統(tǒng)等等。

他表示:“它獨(dú)特的仿生特性使得我們的架構(gòu)優(yōu)于大多數(shù)現(xiàn)有的方法,我們的實(shí)驗(yàn)結(jié)果已經(jīng)證實(shí)了這一點(diǎn)。我們的下一步計(jì)劃是根據(jù)視覺數(shù)據(jù)和傳感器數(shù)據(jù)的仿生融合構(gòu)建一個(gè)VR和AR系統(tǒng)。”

原文來自映維網(wǎng):https://yivian.com/news/77347.html


感謝朋友們一路的支持和提出的寶貴建議

服務(wù)熱線

13357700300

在線客服

主站蜘蛛池模板: 读书| 湘潭市| 临夏市| 安义县| 襄汾县| 黄陵县| 冕宁县| 太仆寺旗| 库伦旗| 乌鲁木齐市| 萨迦县| 宜州市| 台北市| 麟游县| 八宿县| 红原县| 冀州市| 射洪县| 建始县| 龙江县| 浦县| 海阳市| 登封市| 浏阳市| 大石桥市| 河间市| 伊宁市| 若尔盖县| 闽清县| 灵丘县| 合肥市| 永济市| 达孜县| 吉林市| 天柱县| 洛隆县| 韶关市| 聂荣县| 沾益县| 卫辉市| 固阳县|