人工智能相關文章 DeepSeek:人工智能的微信時刻? 短短一周,杭州深度求索人工智能基礎技術研究有限公司開發的DeepSeek火爆出圈。它不僅拿下了美國和中國區App Store免費榜的雙料第一,還成為首個超越OpenAI ChatGPT的AI助手類應用。 發表于:2/6/2025 AMD宣布已將DeepSeek模型集成到GPU AMD宣布已將DeepSeek模型集成到GPU 針對Al推理進行優化 發表于:2/6/2025 DeepSeek繞過英偉達CUDA積極適配國產GPU 如果DeepSeek成功改用國產GPU,英偉達在人工智能領域的壟斷地位將被打破…… DeepSeek自上線以來便以迅猛的速度在全球范圍內獲得了廣泛關注,其日活用戶數在短時間內突破2000萬,成為全球增速最快的AI應用之一。作為一家中國人工智能初創企業,外部算力(主要是GPU)限制逐漸成為制約其進一步發展的瓶頸,如今他們正致力于通過優化其大模型技術的硬件兼容性來應對潛在的外部算力限制。 發表于:2/6/2025 OpenAI放大招:免費開放ChatGPT搜索,無需注冊 與谷歌那種傳統收錄模式的搜索引擎相比,ChatGPT搜索可以更快抓取網絡信息,能實現分鐘級別的解析,這對于股票、體育、財經等,需要第一時間快速獲取新聞內容的行業幫助非常大。 發表于:2/6/2025 DeepSeek V3和R1模型完成海光DCU適配并正式上線 近日,海光信息技術團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配,并正式上線! 發表于:2/4/2025 DeepSeek掀起AI算力革命 近日,中國人工智能(AI)大模型技術廠商DeepSeek(深度求索)發布的推理大模型DeepSeek-R1火爆網絡,其不僅性能比肩OpenAI o1 ,并且其所需的訓練成本可能只有后者的約1/20,API的定價更是只有后者的約1/28,相當于使用成本降低了約97%。這不僅引發了外界對于OpenAI、Meta、谷歌等眾多大模型廠商嚴重依賴于高成本的英偉達AI芯片持續堆算力的“大力出奇跡”模式的質疑,也導致了市場對于眾多市值已大漲的AI芯片股的價值需要重估的擔憂。 受此影響,在美國當地時間1月27日的美股交易當中,Marvell大跌19.1%、博通大跌17.4%、英偉達大跌16.97%,臺積電大跌13.33%、美光大跌11.71%、AMD大跌6.37%、ASML大跌5.75%。 發表于:1/30/2025 周鴻祎談DeepSeek遭大規模網絡攻擊事件 DeepSeek遭大規模網絡攻擊 周鴻祎:能攻破360服務器的黑客還沒出生 發表于:1/29/2025 DeepSeek超越ChatGPT,登頂蘋果美國區免費APP下載排行榜 1月27日,Deepseek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。 發表于:1/27/2025 NVIDIA 的“三臺計算機”方案開啟機器人進化新時代 NVIDIA Cosmos是一個“世界基礎模型”,可以生成高度逼真、類似視頻游戲的環境,用于機器人訓練。在這里,“世界”指的并不是地球,而是機器人交互的環境,例如機器人操作的房間內可見區域。通過采用這種結合現實與合成數據的創新工作流,NVIDIA正為機器人領域的重大進步鋪平道路。 發表于:1/24/2025 中國聯通發布元景思維鏈大模型 1月24日消息,今日,中國聯通宣布,聯通數據智能有限公司日前發布元景思維鏈大模型。 目前,元景思維鏈模型已在GitHub、魔搭、始智等社區全面開源。 作為央企首個開源的通用思維鏈大模型,元景思維鏈大模型既擁有強大慢思考能力,又具備不限于數學的多學科、多場景通用推理能力,且能做到針對不同任務和難度的自適應慢思考,大幅降低資源消耗。 中國聯通表示,主流榜單的測評結果顯示,元景思維鏈大模型的表現超過了目前最好的通用語言模型(OpenAI GPT-4o和Deepseek V3)以及開源思維鏈模型通義千問QwQ。 發表于:1/24/2025 OpenAI推出首個智能體Operator 當地時間 1 月 23 日,OpenAI 正式推出了其首款 AI智能體 Operator。 它可以通過自帶的瀏覽器獨立瀏覽網頁,并通過鍵入、單擊和滾動來與之交互,能夠完成填寫表格、訂購日常用品,甚至是創建表情包的任務。 發表于:1/24/2025 HTC宣布將部分XR業務2.5億美元出售給谷歌 繼2017年以11億美元將部分手機業務出售給谷歌(Google)之后,HTC于2025年1月23日又宣布將其部分XR業務以2.5億美元出售給谷歌。 HTC指出,據雙方的協議,HTC 將收到谷歌所支付的交易價金2.5億美元,HTC的部分XR研發團隊成員將加入谷歌。在此次協議中,HTC的XR知識產權將以非專屬授權將方式授權給谷歌使用。此次交易預計將于今年第一季度完成。在簽署這項協議后,HTC和谷歌將繼續探討未來的合作機會。 發表于:1/23/2025 北電數智紅湖·可信數據空間,央國企數智化轉型的數據基石 隨著大模型浪潮席卷而來,央國企正成為一股先鋒力量,積極利用AI等創新技術革新業務模式。盡管行業整體對AI大模型熱情高漲,但在AI技術與自身業務場景深度融合且實現有效落地和適配的過程中,仍面臨一些桎梏。北電數智紅湖·可信數據空間的出現,則為央國企提供了破解數據流通與使用難題、加速數智化轉型的新思路。 發表于:1/23/2025 北京大學與智元機器人聯合實驗室發布OmniManip架構 1 月 23 日消息,如何將視覺語?基礎模型(Vision Language Models, VLMs)應?于機器?以實現通?操作是具身智能領域的?個核?問題,這??標的實現受兩?關鍵挑戰制約: VLM 缺少精確的 3D 理解能?:通過對?學習范式訓練、僅以 2D 圖像 / ?本作為輸?的 VLM 的天然局限; ?法輸出低層次動作:將 VLM 在機器?數據上進?微調以得到視覺 - 語? - 動作(VLA)模型是?種有前景的解決?案,但?前仍受到數據收集成本和泛化能?的限制。 發表于:1/23/2025 中國電信完成業內首個千卡千億參數模型500公里聯合訓練試商用 近日,在中國電信集團公司統一組織下,中國電信研究院、天翼云、北京電信成功完成業內首個1024卡千億參數商用大模型分布式聯合訓練真實用戶試商用,通過武清到瀛海之間的真實光路環回實現了500公里長距互聯分布式訓練,訓練性能達到單數據中心的97%以上,這一重大突破為大模型訓練的跨地域協同發展開辟了新的道路。 發表于:1/23/2025 ?…38394041424344454647…?