摘要:千呼萬喚始出來。
“怎么上半年,就聽不到你們的一點消息呢?”
外界對華為大模型最關心的這個問題,在今天的開發者大會上,華為高管開場便做了解釋:
華為的盤古大模型,不會寫詩,只會做事。
翻譯翻譯就是:很酷,不聊天。
2023年7月7日,華為開發者大會2023在東莞舉辦。會上,華為常務董事、華為云CEO張平安最先登臺演講,并發布了盤古大模型3.0,強調稱“華為做AI的方向始終是AI for industries(工業人工智能)”。
本次發布的盤古大模型3.0,亦是面向行業。
區別于最早一批發布的通用大模型,如百度文心一言、訊飛星火等低門檻接觸、隨意對話的新一代人工智能,華為并未將自家大模型的重心放在C端。
從現場演示來看,盤古并非沒有對話和問答功能,而是華為選擇將這些ToC功能先放在行業場景中,再來看效果。
對于這家國內科技巨頭而言,多年以來專精于B端業務的模式,或許已經成為慣性。
大模型之戰,華為有備而來
沒有寫作繪畫,沒有詩和遠方,華為給盤古大模型的定調就是“完全面向行業”的大模型。
背后,則是一套系統——包括自然語言、多模態、視覺、預測大模型和科學計算五個基礎大模型,以及針對政務、金融、制造、礦山等行業設計的專用大模型,和臺風預測、藥物制造等場景大模型。
早在2021年年報中,華為就已經提及“盤古預訓練大模型”和生物醫學、圖文音多模態等數個應用案例,公司的布局遠早于2022年末掀起的這場AI之戰。
圖/2021華為年報
顯然,老師傅有備而來。
會上,華為以盤古大模型在氣象和采礦等場景的作用為案例做了演示。
在煤礦行業,華為將盤古大模型應用到礦山開采及運輸等7大業務流程、1000余個場景中,實現無人、少人安全作業。據悉,盤古礦山大模型已經在全國8個礦井規模使用。
而在氣象領域,盤古大模型也提前十天成功預測了臺風瑪雅的移動路徑,以及寒潮的來臨。資料顯示,盤古氣象大模型是首個精度超過傳統數值預報方法的AI模型,速度相比傳統數值預報提速一萬倍以上,可以在秒級時間內完成未來全球一個小時到7天的天氣預報。7月6日,國際科技期刊《nature》刊發盤古氣象大模型文章,審稿人稱,“華為云盤古氣象大模型讓人們重新審視氣象預報模型的未來,模型的開放將推動該領域的發展。
只是略顯遺憾,或者說略有欠缺的是,本次開發者大會上華為演示的臺風預測、礦山開采等大模型應用,實際上都是在2022年年報中已有場景。
驚喜不多,華為給外界的印象仍是沉穩。
卡脖子的GPU,搞定了?
值得注意的是,華為還在會中提及了自身的AI算力底座。
大模型行業的一個現狀是——算力決定能力,而在GPU芯片等硬件領域,華為被卡脖子已有多年。
大家知道,其他人都可以用行業里最成熟的GPU、最成熟的軟件,但華為不可以。
張平安一句話點出了華為在AI賽道的硬件阻力——沒有現成的裝備,華為只能依賴自研AI根技術。
好在,華為很爭氣。
“我們在最底層,構建了以鯤鵬、昇騰為基礎的,AI昇騰云算力底座。并在昇騰之上,提供了計算框架CANN……昇騰云的效能不僅不落后,反而領先于業界主流GPU?!?/p>
資料顯示,華為通過針對技術、傳輸以及使用場景的優化,使盤古大模型訓練效率對比業界主流GPU平均提升1.1倍。
并且,這些算力底座除了支持自家AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。針對昇騰云服務的商用,華為在貴安和烏蘭察布兩地上線了兩個新的AI算力中心,用以承載客戶的算力需求。
目前,美團已陸續將數十個AI應用遷移到昇騰云,大模型算法也將遷移到云端。按照華為的盤算,依托算力硬件和自研技術等優勢,未來將會有更多B端客戶,帶著場景排隊上門,即插即用。
只是,在半數大模型廠商已經卷向B端,謀求對接企業的當下,盤古大模型在B端絕非沒有對手。
華為很能打,但AI的變數實在太多。
來源|AI藍媒匯 作者|伊柒