摘要:以技術(shù)為支點(diǎn),繁榮整個大模型產(chǎn)業(yè)生態(tài)。
逐漸駛向深海的大模型賽道,迎來一個拐點(diǎn)時刻。
這個拐點(diǎn),與大模型從上游到下游的全鏈路密切相關(guān):算力硬件、行業(yè)規(guī)范和市場需求三方面因素疊加,讓大模型元年的八月比過去任何時候都更熱鬧。
當(dāng)然,也更重要——用科大訊飛董事長劉慶峰的話說,這是中國通用人工智能發(fā)展的關(guān)鍵的節(jié)點(diǎn),一個里程碑式的節(jié)點(diǎn)。
2023年8月15日,國家網(wǎng)信辦等七部委聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》開始施行;同日,科大訊飛發(fā)布訊飛星火認(rèn)知大模型的2.0版本,搭載星火大模型V2.0的多項(xiàng)應(yīng)用和產(chǎn)品,并聯(lián)合華為推出了自研算力硬件“訊飛星火一體機(jī);短短兩天后的8月17日,訊飛又聯(lián)合奇瑞高端塔尖品牌星途,官宣了星火認(rèn)知大模型即將“上車”——星火將以名為“LION AI”的大模型平臺為底層框架和技術(shù)基礎(chǔ),搭載到星途星紀(jì)元ES車型上,為車內(nèi)場景提供AI支持。
伴隨市場需求的迅速增長,行業(yè)規(guī)范同步生效,再配合AI頭部大廠強(qiáng)強(qiáng)聯(lián)合打造的算力底座、探索新一代應(yīng)用場景,一條完整的國產(chǎn)大模型進(jìn)擊之路已然非常清晰。
變革時刻,訊飛的選擇是主動破局——針對當(dāng)前的大模型落地需求及行業(yè)痛點(diǎn),訊飛針對性升級了大模型的多項(xiàng)功能,并搶先達(dá)成了算力底座的自主可控。
作為國內(nèi)多年AI行業(yè)的頭部企業(yè)科大訊飛,成為拐點(diǎn)時刻沖在最前的行家。
化繁為簡,讓“星火”賦能千行百業(yè)
大道至簡,在大模型應(yīng)用方面同樣適用。
據(jù)《中國人工智能大模型地圖研究報告》統(tǒng)計,在大模型引發(fā)的新一輪人工智能應(yīng)用熱潮中,目前國內(nèi)10億參數(shù)規(guī)模以上的大模型已有79個。除科大訊飛外,百度、騰訊、阿里巴巴等互聯(lián)網(wǎng)巨頭也都發(fā)布了各自的大模型。
但參數(shù)規(guī)模并非大模型賽道的真正勝負(fù)手,關(guān)鍵還在于能否滿足用戶需求。如若將大模型視作一款產(chǎn)品,那它的第一性同樣是“用戶價值”——這種價值根源于用戶需求,有需求的產(chǎn)品才有價值。
滿足市場需求,成為大模型企業(yè)必須思考的問題。
科大訊飛的解題方法,是“聚焦”——針對行業(yè)需求及痛點(diǎn),訊飛星火2.0的各項(xiàng)優(yōu)化升級都具體應(yīng)用展開,優(yōu)化使用門檻的同時也能降本增效。
作為大模型“智慧”標(biāo)志的代碼能力,是認(rèn)知大模型最為廣泛的應(yīng)用維度之一,也是構(gòu)建和鏈接數(shù)字世界的有效手段。此次發(fā)布的星火2.0,對大模型的代碼能力進(jìn)行了五個維度的升級,包括代碼生成、代碼補(bǔ)齊、代碼糾錯、代碼解釋和單元測試生成。
從普通人用小視頻做表情包的需求,到專業(yè)程序員使用Python畫紅色的心形線、畫出馬鞍面方程三維立體圖并設(shè)置漸變色的指令,現(xiàn)場演示中訊飛星火2.0都迅速給出了非常標(biāo)準(zhǔn)的正確答案。
資料顯示,根據(jù)OpenAI構(gòu)建的代碼能力公開測試集HumanEval,星火V1.5Python語言的效果只有41分,V2.0已經(jīng)到了61分、接近ChatGPT。根據(jù)認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室構(gòu)建的代碼真實(shí)場景使用測試集,星火的代碼生成和補(bǔ)齊維度上已經(jīng)超過了ChatGPT。根據(jù)訊飛的計劃,星火代碼各維度的能力將在今年10月24日超越ChatGPT,明年上半年或?qū)?biāo)GPT-4。
劉慶峰在發(fā)布會上表示,強(qiáng)大的代碼能力“可以大幅降低數(shù)字經(jīng)濟(jì)的創(chuàng)業(yè)門檻和成本。”
最新官宣的星火大模型與星途汽車的合作,亦是讓大模型進(jìn)入“日常”的范例。劉慶峰稱,科大訊飛與奇瑞圍繞交互智能與服務(wù)智能進(jìn)行深度協(xié)同融合,將為星途星紀(jì)元用戶帶來可溝通、可服務(wù)、有情感、千人千面的人車交互體驗(yàn)。
用更智能、更有情感的“AI語音助手”解決當(dāng)前人機(jī)交互核心痛點(diǎn),讓“車內(nèi)”這個愈發(fā)高頻出現(xiàn)的場景獲得了“簡單易用”的AI加持。
而在訊飛始終擅長的智慧教育領(lǐng)域,星火同樣在飛速進(jìn)化。
今年6月9日,科大訊飛曾發(fā)布訊飛語伴APP。而在本次星火2.0的升級中,結(jié)合進(jìn)一步強(qiáng)化的多模態(tài)能力,訊飛語伴的2.0版本除了能夠進(jìn)行主題對話、虛擬人對話外,還推出了口語模考和情景交流,用AI實(shí)現(xiàn)了真人式的陪練。
據(jù)了解,目前口語模考功能已支持CET、雅思、托福等大型權(quán)威考試。
技術(shù)獲得重大突破的同時,搭載訊飛星火認(rèn)知大模型核心能力的應(yīng)用和產(chǎn)品也越來越豐富:既有代碼快速生成或者改Bug的智能編程助手iFlyCode1.0,能夠進(jìn)行視頻創(chuàng)作的訊飛智作2.0,還有幫助教師設(shè)計教學(xué)活動、一鍵生成課件的星火教師助手,面向?qū)W生口語練習(xí)的星火語伴2.0,訊飛AI學(xué)習(xí)機(jī)也升級AI編程空間和AI創(chuàng)意畫板。
在大模型應(yīng)用階段,所謂“賦能”不再是一味拔高數(shù)據(jù),而是讓能力的提升,既可以幫助專業(yè)人員效率、將自己從繁瑣事務(wù)中抽離去創(chuàng)造價值,也能幫助非專業(yè)的“小白”零門檻進(jìn)入AI時代。讓“簡單易用”的大模型打造個人AI助手,去釋放每個人的可能。
大模型國產(chǎn)化,從算力底座開始
曾有證券分析師預(yù)測,隨著國內(nèi)通用人工智能產(chǎn)業(yè)發(fā)展,AI大模型在訓(xùn)練與推理階段或產(chǎn)生相當(dāng)于1.1萬臺至3.8萬臺高端AI服務(wù)器的算力需求。以英偉達(dá)單片A100 GPU產(chǎn)品售價10萬元、AI加速卡價值量占服務(wù)器整機(jī)約70%計算,則對應(yīng)126億元至434億元增量AI服務(wù)器市場規(guī)模。
而在當(dāng)前火熱的算力硬件市場中,來自外部的極限施壓又讓國內(nèi)AI企業(yè)在研發(fā)和運(yùn)行階段都極為困難。
華為昇騰計算業(yè)務(wù)CTO周斌曾表示,全球AI訓(xùn)練所需的計算量呈指數(shù)級增長,大約每隔4個月,AI的訓(xùn)練計算需求就會翻倍。大模型是一次長跑,擁有頂尖技術(shù)但缺乏算力硬件支持,對所有AI企業(yè)都是一種長期的不確定性。
這種不確定性,只能由AI大廠直面困難,用研發(fā)解決——訊飛與華為聯(lián)合,給出了第一份解答:今年7月6日,科大訊飛公布訊飛星火將與華為昇騰AI合作,打造基于中國自主創(chuàng)新的通用智能新底座。
而在此次星火2.0發(fā)布會上,訊飛與華為合作的星火一體機(jī)首次亮相。
訊飛擁有自研大模型訓(xùn)練平臺,具備訓(xùn)練和數(shù)據(jù)閉環(huán)全流程設(shè)計、訓(xùn)練和推理一體化設(shè)計、大規(guī)模異構(gòu)算力兼容、支持混合云架構(gòu)易拓展等優(yōu)勢,而華為基于昇騰AI基礎(chǔ)軟硬件的高算力AI芯片、高性能算子庫、多卡高速互聯(lián)、分布式存儲等優(yōu)勢。此番合作,無疑是一次“強(qiáng)強(qiáng)聯(lián)合”。劉慶峰坦言,認(rèn)知大模型深度賦能時代已經(jīng)到來,健康發(fā)展亟需構(gòu)建安全可控保障。這種安全可控的保障事關(guān)技術(shù)和數(shù)據(jù)安全,他認(rèn)為認(rèn)知大模型在行業(yè)深度應(yīng)用有三方面的關(guān)鍵要素:
首先是安全可控——大模型對千行百業(yè)的賦能,要根植在自主可控、算力安全平臺上;其次是場景驅(qū)動,劉慶峰認(rèn)為只有“在看得見摸得著的場景上”,才能實(shí)實(shí)在在產(chǎn)生應(yīng)用價值,用統(tǒng)計數(shù)據(jù)來證明大模型的最終效果;第三則是要解決不同企業(yè)進(jìn)行專項(xiàng)訓(xùn)練的需求:“構(gòu)建私有化專屬大模型,(能夠)保護(hù)用戶的專有數(shù)據(jù)和知識產(chǎn)權(quán),并提升行業(yè)應(yīng)用效果。”
據(jù)了解,星火一體機(jī)可提供對話開發(fā)、任務(wù)編排、插件執(zhí)行、知識接入、提示工程等5種定制優(yōu)化模式,以及辦公、代碼、客服、運(yùn)維、營銷、采購等10種以上即開即用的豐富場景包,支持3種模型尺寸供用戶選擇。目前,訊飛星火已完成的在金融、政務(wù)、汽車等領(lǐng)域的9個專屬大模型的數(shù)據(jù)顯示,在場景任務(wù)優(yōu)化和域知識增強(qiáng)等方面平均效果能夠提升20%。
算力底座畢竟是大模型產(chǎn)業(yè)剛需,科大訊飛和華為聯(lián)合攻關(guān)算力卡脖子的問題后,將能夠?yàn)槠髽I(yè)提供專屬的大模型,聯(lián)合打造全國產(chǎn)化AI一體化方案。客戶也可以在國產(chǎn)自主創(chuàng)新的平臺上,更方便、更自主、更安全可控地私有化部署大模型。
而算力底座的夯實(shí),或?qū)⒊蔀閲鴥?nèi)大模型行業(yè)進(jìn)擊的跳板。
AI普惠,訊飛跑通大模型產(chǎn)業(yè)全鏈路
ChatGPT元年,OpenAI風(fēng)光無限,但為OpenAI母公司提供算力硬件的英偉達(dá),活得甚至比OpenAI更好。
長期將星火與ChatGPT對標(biāo)的科大訊飛,并沒有忽略AI背后的基礎(chǔ)硬件。此番星火大模型升級疊加星火一體機(jī)推出,訊飛階段性補(bǔ)齊了大模型產(chǎn)業(yè)全鏈路的主要版圖。
MIT中國最新發(fā)布的大模型評測報告顯示,在8個一級大類的600道題目的測試和盲評中,訊飛星火認(rèn)知大模型V2.0在6個大類中得分率排名第一,在此次評測中表現(xiàn)突出,以 81.5 分(百分制計)的成績在本次評測中登頂,榮獲“最聰明”的國產(chǎn)大模型稱號。
硬件、技術(shù)、應(yīng)用,科大訊飛的目標(biāo)顯然不只是打開星火大模型的市場,而是用技術(shù)繁榮整個大模型產(chǎn)業(yè)生態(tài)。
“中國人工智能的發(fā)展絕不是單個企業(yè)、單個科研院所使命,而是整個社會的機(jī)會,生態(tài)的發(fā)展決定了產(chǎn)業(yè)的繁榮”,劉慶峰發(fā)布會上表示,AI的最終目標(biāo)應(yīng)當(dāng)是普惠,讓每個人都能觸及尖端技術(shù),釋放與AI同行之人的價值。
數(shù)據(jù)統(tǒng)計顯示,自5月6日訊飛星火發(fā)布以來,100天間開發(fā)者數(shù)量同比增長282%,開發(fā)者行業(yè)分布中排名第一的是“企業(yè)服務(wù)”,“這說明大模型真正開始賦能到剛需應(yīng)用中。”
算力底座是路基,產(chǎn)品和功能是大模型通路的入口。做到將技術(shù)和應(yīng)用同步升級后,才能避免被“卡脖子”,保證AI產(chǎn)業(yè)的長期高質(zhì)量發(fā)展,讓大模型賦能所有伙伴、所有個體和行業(yè)。
而這,也正是從業(yè)者期許的“讓AI普惠的大未來,真正到來”。
來源|AI藍(lán)媒匯 作者|伊柒