《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 小米開源人車家生態戰略關鍵技術組件

小米開源人車家生態戰略關鍵技術組件

2025-08-05
來源:快科技
關鍵詞: 小米 大模型

8月4日消息,小米正式發布并開源聲音理解大模型MiDashengLM-7B,該模型是小米“人車家全生態”戰略的關鍵技術組件。

MiDashengLM通過統一理解語音、環境聲與音樂的跨領域能力,不僅能聽懂用戶周圍發生了什么事情,還能分析發現這些事情的隱藏含義,提高用戶場景理解的泛化性。

1.jpg

基于MiDashengLM的模型通過自然語言和用戶交互,為用戶提更人性化的溝通和反饋,比如在用戶練習唱歌或練習外語時提供發音反饋并制定針對性提升方案,又比如在用戶駕駛車輛時實時對用戶關于環境聲音的提問做出解答,其應用場景有廣闊的空間。

結合高效的推理部署性能,MiDashengLM將廣泛賦能智能座艙、智能家居等場景,推動多模態交互體驗升級。

2.png

基于Xiaomi Dasheng音頻編碼器和Qwen2.5-Omni-7B Thinker自回歸解碼器構建,通過通用音頻描述訓練策略,實現對語音、環境聲音和音樂的統一理解。

訓練數據100%來自公開數據集,涵蓋五大類110萬小時資源,以Apache License 2.0協議發布,支持學術和商業應用。

3.png

核心優勢:

性能領先:在22個公開評測集上刷新多模態大模型最好成績(SOTA),在音頻描述、聲音理解、音頻問答任務中表現突出,同時具備可用的語音識別能力。其音頻編碼器Xiaomi Dasheng在X-ARES Benchmark多項關鍵任務,尤其是非語音類理解任務上顯著優于Whisper。

推理效率高:單樣本推理的首Token延遲(TTFT)僅為業界先進模型的1/4;同等顯存下數據吞吐效率是業界先進模型的20倍以上,80GB GPU上處理30秒音頻并生成100個token時,batch size可達512,而同類模型在batch size 16時即顯存溢出。

訓練范式革新:采用通用音頻描述對齊范式,通過非單調全局語義映射,學習音頻場景深層語義關聯,避免傳統ASR轉錄數據對齊的局限,數據利用率高,還能捕捉說話人情感、空間混響等關鍵聲學特征。

4.png


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 久久天天躁狠狠躁夜夜躁2020 | 精品一区二区三区在线观看| 精品国产Av一区二区三区| 精品卡2卡3卡4卡免费| 狼群资源网在线视频免费观看| 狠狠干2019| 欧美国产综合视频| 日韩美女hd高清电影| 日日碰狠狠添天天爽爽爽 | 男生和女生一起差差差很痛的视频| 男男高h粗暴黄车文| 欧美黑寡妇黑粗硬一级在线视频| 欧美va在线播放免费观看| 日本高清有码视频| 成年人电影在线播放| 天天操天天干天天舔| 国产精品嫩草影院在线| 国产人妖ts在线视频播放| 古代肉多荤话文高h| 亚洲毛片基地日韩毛片基地| 国产白领丝袜办公室在线视频| 国产成人无码免费看片软件| 国产乱理伦片在线看夜| 伊人色综合九久久天天蜜桃| 亚洲av无码一区二区二三区| 东京一本一道一二三区| 18禁亚洲深夜福利人口| 肌肌对肌肤肤30分钟软件大全免费| 特区爱奴在线观看| 日本边添边摸边做边爱边| 多人交换伦交视频| 国产伦子系列视频6| 亚洲精品99久久久久中文字幕| 久久国产经典视频| 97精品伊人久久久大香线焦| 野花社区在线观看www| 欧美金发大战黑人video| 日本丰满岳乱妇在线观看| 国产自国产自愉自愉免费24区| 国产一级片视频| 亚洲成电影在线观看青青|