(相關資料圖)
中新網北京8月9日電 題:周鴻祎:讓通用大模型“走下神壇”,真正進入千家萬戶
中新財經記者 夏賓
ISC2023第十一屆互聯網安全大會9日在京召開,會議期間,360集團創始人周鴻祎在接受中新財經等媒體采訪時直言,通用大模型熱了一陣之后,大家都在反思通用大模型存在的一些問題。
圖為360集團創始人周鴻祎在第十一屆互聯網安全大會期間接受中新財經等媒體采訪。 主辦方供圖。在周鴻祎看來,通用大模型涉及的問題有兩個方面。一是要真正打造一個超強的“全知全能”的大模型所需要的算力和訓練成本都非常高,這對于中國市場而言還需要一點時間。
二是通用大模型對普通用戶使用起來并不太友好,需要用戶變成一個提示詞或者指令專家,在中國要發展大模型,現階段從國家政策來看,仍應圍繞產業數字化這一戰略來發展大模型。
“所以看通用大模型,我提出來走垂直化、產業化、專業化、企業化之路。因為在企業發展過程當中,有非常多的小場景比較適合大模型,垂直化、產業化的大模型選擇的場景相對小切口,對于能力要求不一定那么強。”周鴻祎解釋說,這甚至有點像偏科生,不一定要求綜合能力很強,如果做這樣的大模型,難度反而會降低,而對于企業來說可承受的成本代價包括交付時間,也會減少很多。
周鴻祎透露,360正在訓練數字安全大模型,基于其龐大的網絡安全大數據,現在要補上真正的深度學習的大語言模型能力,讓它從數據大腦真正變成智慧大腦。
他認為,在安全領域,未來還會有各種各樣的垂直類大模型,就可以解決不同問題。如果垂直類大模型不需要用千億或萬億模型,可能用百億、十億、幾十億模型,這樣模型的整個訓練時間、調試成本、部署成本等大概會比GPT的成本低百倍以上,如此才有可能讓大模型“走下神壇”,讓大模型賦能百行千業、走進千家萬戶,才能真正掀起新一輪工業革命。(完)