《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 馬斯克:現實世界中用于訓練AI模型的數據已經所剩無幾

馬斯克:現實世界中用于訓練AI模型的數據已經所剩無幾

2025-01-10
來源:IT之家
關鍵詞: AI模型 人工智能

1 月 9 日消息,據 TechCrunch 報道,馬斯克與其他人工智能專家一致認為,現實世界中用于訓練 AI 模型的數據幾乎已經耗盡。

0.png

在周三晚間與 Stagwell 董事會主席馬克?佩恩的直播對話中,馬斯克表示:“我們現在基本上已經消耗掉了所有人類知識的積累…… 用于人工智能訓練的數據。這個現象基本上是去年發生的。”

馬斯克此番言論與前 OpenAI 首席科學家伊利亞?蘇茨克弗(Ilya Sutskever)在去年 12 月的 NeurIPS 會議上的觀點相似。蘇茨克弗曾指出,AI 行業已經達到了所謂的“數據峰值”,并預測未來缺乏足夠的訓練數據,將迫使 AI 模型的開發方式發生改變。

馬斯克認為,合成數據(IT之家注:即人工智能模型自我生成的數據)是未來的解決方案。“補充現實世界數據的唯一途徑是通過合成數據,也就是讓 AI 自己生成訓練數據。AI 會進行自我評估,并通過這一自我學習的過程不斷優化自己。”

目前,許多科技公司,包括微軟、Meta、OpenAI 和 Anthropic 等,已經開始使用合成數據來訓練他們的主力 AI 模型。據 Gartner 估計,到 2024 年,用于人工智能和數據分析項目的 60% 數據將是通過合成方式生成的。

使用合成數據的一個顯著優勢是降低成本。人工智能初創公司 Writer 表示,其 Palmyra X 004 模型幾乎完全依賴合成數據進行開發,開發成本僅為 70 萬美元,而一個規模相似的 OpenAI 模型的開發成本大約為 460 萬美元。

然而,合成數據也存在一定的風險。研究表明,合成數據可能會導致模型性能下降,輸出結果不僅缺乏創新性,而且可能變得更加偏頗,最終嚴重影響其功能性。因為模型是通過自己生成合成數據進行訓練的,如果這些數據本身帶有偏見或局限性,那么最終模型的輸出也會受到這些因素的影響。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产精品日韩欧美一区二区| 暖暖免费中国高清在线| 国产乱码一二三区精品| 97香蕉久久夜色精品国产| 无码人妻精品中文字幕| 亚洲国产三级在线观看| 福利在线小视频| 国产凌凌漆免费观看国语高清| 91欧美精品激情在线观看最新| 成人国产一区二区三区精品| 久久综合狠狠色综合伊人| 特大巨黑吊av在线播放| 国产91精品一区| 另类欧美视频二区| 在线观看亚洲精品国产| 中国一级毛片免费看视频| 明星女友开挂吧电视剧在线观看| 亚洲精品www久久久久久| 精品小视频在线| 国产区综合另类亚洲欧美| 2018天天操天天干| 天天操天天干视频| 中文字幕亚洲欧美在线不卡| 日韩精品无码专区免费播放| 亚洲日韩一区二区三区| 粉嫩虎白女P虎白女在线| 国产一区二区三精品久久久无广告| 四虎国产精品高清在线观看| 国内揄拍国内精品| www.好吊妞| 扒开女同学下面粉粉嫩嫩| 五月天婷五月天综合网站| 欧美最猛黑人xxxx黑人猛交 | 久久久久亚洲av无码专区| 欧美深夜福利视频| 女人被躁到高潮嗷嗷叫游戏| 久久久亚洲欧洲日产国码aⅴ| 桃花阁成人网在线观看| 亚洲欧美日韩另类在线专区| 男女猛烈激情XX00免费视频| 啊快点再快点好深视频免费|