今年,以ChatGPT為代表的新AI熱潮奔涌而來,“大模型熱潮”也從國外涌向了國內。
國產大模型“神仙打架”
AI大模型,指的是擁有數百萬以上參數規模的深度神經網絡模型。這類模型在經過專門的訓練后,即可對海量數據進行復雜處理和任務處理。由OpenAI開發的ChatGPT之所以擁有強大的對話交互能力,背靠的正是名為“GPT”的AI預訓練模型。
繼百度文心一言之后,三六零、阿里、華為、京東、騰訊等大模型陸續浮出水面,國內AI大模型的追逐戰正在愈演愈烈。
4月7日,阿里云公開“阿里版GPT”通義千問邀測入口,引發強烈關注。4月11日,阿里云再放大招——阿里巴巴所有產品未來將接入“通義千問”大模型。與百度于3月中旬上線的“文心一言”大模型工具類似,“通義千問”也具備與用戶進行多輪對話的能力,并支持代碼編程、文案創作等功能。
4月8日,在人工智能大模型技術高峰論壇上,華為云人工智能領域首席科學家田奇介紹了盤古大模型的進展及其應用狀況。據介紹,該模型利用了深度學習與自然語言處理技術,并且采用海量中文語料庫對其進行培訓。
同日,京東也宣布將在今年發布“ChatJD”,定位為產業版本ChatGPT。目前京東的大模型主要聚焦于文本、語音、對話和數字人生成等4個方面開展工作,比如給商品自動生成長度不等的文案,包括標題、賣點文案和直播文案等。
4月9日,360宣布,將基于360GPT大模型開發人工智能產品矩陣“360智腦”,未來將其率先落地在“360搜索”場景,后續面向電商、營銷、辦公等場景深度落地。
4月10日,商湯科技公布“日日新SenseNova”大模型體系雛形,并現場演示了該模型體系下“商量SenseChat”語言工具的超長文本閱讀理解、健康咨詢等創新能力。
同日,游戲起家的昆侖萬維也對外預告,不日將發布和奇點智源合作自研的大模型成果——“天工”3.5,并宣稱這是“中國第一個真正實現智能涌現的國產大語言模型”。
4月11日,字節跳動旗下辦公軟件飛書發布視頻,預告專屬智能助手“My AI”,區別于其他大廠的AI智能工具,“My AI”似乎無意再復制一個類似ChatGPT的語言大模型,更類似微軟推出的Office Copilot。
4月14日,騰訊云正式發布新一代HCC(High-Performance Computing Cluster)高性能計算集群。騰訊方面實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。
如今,包括百度、騰訊、阿里、華為、京東、360等多家國內科技巨頭均已宣布在生成式AI產業有相應布局,5月,騰訊混元大模型也即將發布。
與此同時,大模型在學術界也成了“香餑餑”。早在今年2月,復旦大學邱錫鵬教授團隊發布國內首個類ChatGPT模型MOSS。3月,中國人民大學盧志武團隊自主研發多模態對話大模型并落地了第一款應用“元乘象ChatImg”……
根據公開信息不完全統計,目前國內至少已經有30多家大模型亮相,其中不乏參數規模甚至超過ChatGPT規模的大模型,廠商涵蓋了互聯網巨頭、AI上市公司、服務器龍頭企業、科研院所與一級市場創業公司。
此外,隨著ChatGPT的火爆,國內還火速興起了AI大模型的創業風潮。
2023年2月,原美團聯合創始人王慧文發布“AI英雄榜”,并火速啟動A輪融資;隨后,創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創始人李志飛等掀起了AI大模型創業狂潮;阿里AI大牛賈揚清亦被爆出投身AI創業;還有一系列整合AI的新產品雨后春筍般涌現。
可以預計,在中國規模龐大的互聯網用戶的支撐下,國內企業在算法和算力上有望不斷實現突破并取得領先。從算力到應用,已經按下了AI大模型發展的加速鍵。
國產大模型多為ToB
當前,國產大語言模型均未對公眾大面積開放,也沒有明確的ToC入口,未來發展大多也走ToB路線。
當前已正式上線的三家中,百度、商湯有關負責人曾向媒體表示,自家大模型為toB產品。阿里方面在4月11日舉辦的阿里云峰會上也宣稱,未來“通義千問”將主要面對企業定制個性化服務。
而在已有消息的幾家中,科大訊飛、網易有道兩家皆已透露了基于公司類GPT技術所要落地的產品;京東的“ChatJD”明確定位為產業版本ChatGPT;而華為“盤古”系列下的NLP大模型主要面向智能文檔搜索、智能ERP、小語種大模型等行業,多處理類案檢索、企業財務異常檢測等商業場景。
整體看來,國內大語言模型賽道的公司在開發模型后,更傾向于將相關模型嫁接到自家的C端服務中,或者走私有化部署、企業定制等路線。
而在與海外相同賽道的公司對比之后,不難得出第二個特點——相比海外,國內廠商更傾向于“每家必備”一個大模型。
當前,海外頭部科技公司如OpenAI、谷歌等,其開發都以基礎模型(Foundation Models)為主,不管是ChatGPT、Gpt4,還是PaLM-E,都是類似AI基礎設施的基礎大模型。其他公司,要么索性走開源社區的路線,要么像美國云服務巨頭Salesforce一樣,直接與OpenAI合作接入ChatGPT使用。在某種程度上,可以說是“大家都在規定范圍里各自賺錢”。
誰是下一個OpenAI?
國內科技企業圍繞AI大模型上演“百團大戰”背后,誰能憑硬實力拔得頭籌?
IDC中國助理研究總監盧言霞接受中新經緯采訪時認為,當前各家公司密集發布大模型或公布大模型進展,主要還是被市場熱度倒逼的?!笆聦嵣?,行業成熟期遠未到來,目前仍是起步階段。但這種密集發布會推動大模型技術的落地,加速商業化?!北R言霞說。
中國電子商務專家服務中心副主任、知名互聯網專家郭濤在接受證券日報采訪時表示:“目前,國內AI大模型正處在從實驗室走向大規模商業化的早期階段,存在核心技術不成熟、成熟落地場景較少、生態系統不健全等突出問題。”深度科技研究院院長張孝榮也認為,國內AI大模型研發的水平還在實驗室階段,相關算法尚未成型。
浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任盤和林進一步介紹道,大模型生成式AI是弱智能向強智能的跨越,國內AI企業尚未跨越關鍵門檻。當前國內AI主要是中小模型,比如人臉識別,圖像識別,簡單語音對話,語義理解,應用范圍很廣,但在大模型應用方面,一方面海外更成熟的AI如今很難在國內落地,而國內又缺乏相關產品,所以還沒有應用。
值得注意的是,在大模型“百花齊放”的當下,大多數公司看到的是機會,但也不排除有些公司是“炒概念”。對于投資者來說,還需要仔細甄別其中的風險。
民生證券研報認為,大模型表面不再稀缺后,實質格局更像“太極拳”:易學難精。因為開源基礎以及大公司本身的算力儲備與資金實力,單純發布一個大模型門檻沒有市場想象那么高。但是能夠擁有高質量數據場景助力持續迭代,使得逐步性能逼近ChatGPT的大模型預計最終仍是“鳳毛麟角”。市場會逐步凝結共識:得數據者得天下,數據是差異化競爭關鍵。
多國“圍剿”ChatGPT,我國也出手監管AI
從國外AI大模型發展邏輯來看,當AI強大到一定地步,如GPT-4時,監管就顯得很有必要。
當地時間3月31日,意大利個人數據保護局宣布,從即日起禁止使用聊天機器人ChatGPT,并限制開發這一平臺的OpenAI公司處理意大利用戶信息。
隨后,4月3日,德國聯邦數據保護專員Ulrich Kelber表示,德國可能會效仿意大利,以數據安全方面的擔憂為由,屏蔽ChatGPT。
法國和愛爾蘭方面也聯系了意大利數據監管機構,并討論了調查結果,同時,加拿大隱私專員辦公室(OPC)宣布開始調查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未經同意收集、使用和披露個人信息”等投訴。
不僅如此,多國企業和機構也開始調查或采取措施限制使用該軟件。
3月末,韓國三星半導體部門發生了3起因員工在ChatGPT上輸入設備信息及重要會議摘要,導致公司機密外泄風險陡增的事件。
臺積電、軟銀、日立、富士通、日本瑞穗金融集團等企業也開始限制ChatGPT等交互式人工智能服務在商業運作中的使用。
此外,摩根大通已經限制員工使用ChatGPT,亞馬遜、微軟和沃爾瑪也已向員工發出警告,要求員工謹慎使用生成式AI服務,埃森哲則警告員工不要將客戶信息暴露在ChatGPT中。
與此同時,另一個引發關注的焦點是,如今GPT-4可能具備“自我進化”的能力。前谷歌大腦研究工程師Eric Jang發現,GPT-4能夠以合理的方式批評自己的成果,“AI是否能夠超越人類”這個終極難題再度浮現。
曾有微軟研究員發推說GPT-4根本無法寫出“不押韻”的詩歌。然而,當再去詢問GPT-4是否完成了任務。這時,它道歉后,生成了一個不押韻的詩,可以說是滿分。
似乎,人工智能發展到現在,已經成為令人“不安”的存在。
國內方面,國家互聯網信息辦公室就《生成式人工智能服務管理辦法(征求意見稿)》(簡稱《征求意見稿》)公開征求意見,《征求意見稿》共21條,從生成式人工智能服務商的準入,到算法設計、訓練數據選擇、模型到內容,以及用戶實名和個人隱私、商業秘密等方面提出了相關要求。這意味著,當下爆火的生成式AI產業將迎來首份監管文件。
其中管理辦法涉及的生成式人工智能包括基于算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。并對利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務的組織和個人(簡稱“提供者”)的責任進行了規定。
對于生成式人工智能產品,提供者需要按照《互聯網信息服務深度合成管理規定》對生成的圖片、視頻等內容進行標識等。
在合理的控制下,大模型成為AI時代的基礎設施已是可以預見的事。在日趨激烈的國產AI賽道上,誰能更好地把控算法、算力、數據、產品、場景這五個維度,誰就能獲得更多的可能性。