《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > AI還能這么玩兒?過濾音質讓音樂更悅耳

AI還能這么玩兒?過濾音質讓音樂更悅耳

2018-07-09
關鍵詞: PixelPlayer 人工智能

  一般利用均衡器可以將音樂中的低音部分調出來,但是麻省理工學院的計算機科學和人工智能實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發現了更好的解決方案。他們所研發的新系統 PixelPlayer,能夠利用人工智能來區分和過濾聲音,讓音樂聽起來更洪亮或更柔和。

  將指定視頻錄入經過充分訓練的 PixelPlayer,系統隨機能夠過濾伴奏,同時識別音源,接著計算圖像中每個像素的音量,然后通過“空間定位”確定產生相似音波的片段。

  今年9月,德國慕尼黑即將舉行歐洲計算機視覺會議(European Conference on Computer Vision),會議中要發表的一篇新論文則詳細論述了“像素的聲音(The Sound of Pixels)”。麻省理工學院計算機科學和人工智能實驗室的博士生,同時也是這篇論文的合著者 Zhao Hang 同學表示,“最好的情況就是,我們能識別出哪種樂器發出怎樣的聲音。”

  PixelPlayer 的核心是一種基于樂器組合多模態訓練的神經網絡,數據集采用了 Youtube 上 714 條未經修剪且未經標記的視頻。其中,總時長為 60 小時的 500 條視頻用于訓練,剩余的則用于驗證和測試。在訓練過程中,研究人員分別根據原聲吉他、大提琴、單簧管、長笛和其他樂器向系統饋入了算法。

  這只是 PixelPlayer 多重機器學習框架的一個部分。經過訓練后的視頻分析算法將從剪輯幀中提取出視覺特征,這就是系統的第二個神經網絡,即音頻分析網絡。音頻分析網絡將聲音拆分為片段,并從中提取特征。最后,音頻合成網絡將把上述兩個網絡輸出的特定像素和聲波關聯起來。

  PixelPlayer 進行完全自監督的學習,人們無需對數據注釋,而且系統目前已經能識別 20 種樂器。Zhao Hang 說,較大的數據集增強了系統的識別量,但識別樂器子類的能力卻不佳。系統也可以識別音樂元素,例如小提琴的諧波頻率。

  研究人員認為 PixelPlayer 可以進行聲音剪輯,或者幫助機器人理解動物、車輛和其他物體所制造的環境聲音。他們寫到,“我們希望我們的工作能夠開辟新的研究途徑,從視覺和聽覺信號角度實現聲源分離”。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 中文字幕日韩wm二在线看| 人人狠狠综合久久亚洲婷婷| 69堂在线观看| 成人妇女免费播放久久久| 亚洲国产一区二区三区在线观看| 精品国产一区AV天美传媒| 国产成人午夜性a一级毛片| 99久久精品免费看国产| 无码高潮少妇毛多水多水免费| 亚洲国产欧美久久香综合| 粗大的内捧猛烈进出小视频| 国产午夜精品一二区理论影院 | 狠狠躁日日躁夜夜躁2022麻豆| 国产乱人伦偷精品视频| 六月婷婷中文字幕| 天天看片日日夜夜| 中文字幕日韩一区二区三区不卡| 最新亚洲春色av无码专区| 亚洲欧美激情精品一区二区| 精品国产a∨无码一区二区三区 | 日韩高清一级毛片| 亚洲欧美日韩成人一区在线| 精品国产杨幂在线观看| 国产伦精品一区二区三区| 亚洲人成在线播放网站岛国| 国模极品一区二区三区| 一区二区三区四区在线观看视频| 日本不卡高清中文字幕免费| 亚欧日韩毛片在线看免费网站| 欧美裸体xxxx极品少妇| 免费在线看视频| 美女黄频免费网站| 国产卡一卡二卡3卡乱码免费| 老司机亚洲精品| 国产黄网在线观看| porn在线精品视频| 成人精品一区二区久久| 久久九九99热这里只有精品| 机巴太粗太硬弄死你| 亚洲成AV人片在WWW色猫咪| 狂野欧美性猛xxxx乱大交|