獨家丨周鴻祎x朱嘯虎:沒10億美金閑錢,別碰通用大模型
2024-04-01 21:34 周鴻祎 朱嘯虎 AI 通用大模型

2獨家丨周鴻祎x朱嘯虎:沒10億美金閑錢,別碰通用大模型

編輯:任佳敏

3月28日,2024黑馬AI培訓戰略發布會上,一場主題為《每一家中小企業都有一個AI夢》的先鋒論壇,引發了萬千創業者的關注和熱議。

這場先鋒論壇邀請到了兩位AI創投圈的先鋒人物——360集團創始人周鴻祎、金沙江創投主管合伙人朱嘯虎。

本次論壇的主持人,由創業黑馬執行總裁羅浛予擔任。在近50分鐘的對話中,他們從中小企業AI智能化升級,聊到了創業者怎樣在垂直場景中殺出重圍,還聊到了AIGC創業領域的底層投資邏輯……

當天,我們先第一時間整理了兩位老師的金句《現場金句!周鴻祎x朱嘯虎:ChatGPT很快就會碰到瓶頸》

今天再次奉上現場的完整實錄。如下,Enjoy:

2023年AI大模型席卷全球,2024年“人工智能+”被寫進政府工作報告,將AI產業創業浪潮帶上了一個新高度。黑馬這么多的創業者們,同樣不甘心被這個時代所拋棄。他們都希望從自身需求出發,找出一條實現AI智能化升級的新路徑。

今天我們先鋒對話的主題是《每一家中小企業都有一個AI夢》,正好可以圍繞中小企業實現AI智能化暢聊一場。

01

AI在中國不是只有一條路

羅浛予:周總之前說過:“第一,創業者不要再去碰通用大模型了,沒有意義。第二,也不要在通用大模型之上做一些簡單的套殼、很薄的應用,這樣傳統大模型只要出一個工具,你就完蛋了。”朱總最近也說過,自己不看大模型,只看能賺錢的AI項目。

特別想問兩位,在垂直場景方面,你們更看好哪些應用場景,可以具體給創業者們一些建議嗎?

77_副本

周鴻祎:我先辟個謠?,F在外界把我和朱嘯虎分到了不同陣營,其實不是。我們倆很多觀點都是英雄所見略同,因為都投過很多公司,也被忽悠過,都是血淋淋的教訓。

有的話以訛傳訛,好像我們倆一副賺錢嘴臉,都是所謂的實用派。有些公司冰清玉潔,出淤泥而不染,就是用夢想改變世界,被稱為信仰派。這完全是胡說八道。

我非常認同牛文文說的,今天所有推動人工智能發展的都是AI信仰派,你不相信AI是一場真智能革命,今天就不會來到這里。我做AI場景應用,朱嘯虎投資AI創業公司,都是在用實際行動推動AI發展。

但AI在中國的發展不是只有一條路,所有人都看好Open AI,但美國的發展也不是只有Open AI一條路。有人把AI發展當做曼哈頓工程,消耗國家級算力和能源,最后走向AGI,這條路我們非常敬仰,也非常佩服。另外一條路,是在開源社區,通過開源的力量、開源的大模型去發展AI。

我非常堅信中國走第二條路,就是場景化道路。如果AI永遠是10萬張卡、100萬張卡才玩得起,這成本已經高到無法產生工業革命了。當年超級電腦發明出來時,并沒有帶來工業革命,最后是PC帶來了信息工業革命。因為PC走進千家萬戶,改變了百行千業,才推動了行業發展。

政府工作報告提出了“人工智能+”,就是指朱嘯虎所說的這種道路。人工智能技術再好,也要回答一個問題:它能幫老百姓解決什么場景的問題,能幫企業做什么樣的事?我們不需要等AGI,AGI可能還得三年。我們也不需要等到大模型能力超過GPT-4、GPT-5,才去做企業推廣。

實際上,牛文文現在做的事情,就可以通過走企業級路線,把模型做小、做專,把模型的成本從原子彈變成茶葉蛋。不只是大中企業,即便是中小企業,也可以用得起,實現真正的數字平權,拉平智能鴻溝。

關于創業者不要碰大模型,朱嘯虎說過這句話嗎?我的原話是,建議沒有足夠的資金和技術積累的創業者,別去碰通用大模型。

比如,如果真有一個創業公司很有理想,確實又遇到了金主爸爸投了10億美金,且這10億美金不要求短期內賺錢,想怎么花就怎么花,這沒問題,你可以去做。否則,絕大多數創業者在資金有限的情況下,面臨巨頭領先者的競爭,再去卷通用大模型,是不可能成功的。

對于AGI的競爭,算力越來越是一個卡脖子的問題了,算力背后又是能源問題。你做模型做不過Open AI,后面還有LLama2這種開源模型。昨天Databricks又開源了一個1320億參數的大模型,能力也超強。你處于這個夾縫中,只有理想和口號是不可能成功的。

88_副本

朱嘯虎:今天我為了表示自己有信仰,特別穿了一件皮夾克致敬黃教主(黃仁勛)。前面周總講得很好,大模型變化非???,昨天美國開源的Databricks,只花了1000萬美金,用兩個月時間就訓練出了一個相當于GPT-3.5的大模型。

我們一直在講,通用大模型是個“先行者劣勢”的方向模式。先行者在前面試錯,成本巨高無比,而后面跟進的成本卻越來越低。今年減一點,明年再降一些,你跟在后面是很舒服的。

今年能花1000萬美金、2個月時間訓練出一個GPT-3.5,明年1000萬美金就可以訓練出一個GPT-4。那我為什么要在前面試錯呢?今天中國融資環境沒有這么多資金,跟在后面會是非常舒服的狀態。

從過去的PC時代到移動互聯網時代,中國人都是在后面跟進。只要美國放緩,中國在工業落地方面就能遠遠領先美國。你看英特爾X86,基本上每3-4 年就出現一個新的 X86 架構。從286、386、586推出之后,節奏就放緩了。沒過幾年時間,聯想收購了IBM。

所以,對創業者來說,現在卷通用大模型沒有意義,我們搶用戶、搶場景、搶數據,更有意義。

今天對已經有場景和用戶的創業者來說,加一個AI很容易。相反,很多通用大模型想切場景、切用戶會非常難。因為他們不懂垂直場景,也不懂銷售。管理一個銷售團隊的難度是很大的,這反而是在座創業者們的優勢。

周鴻祎:我補充一點。在過去一年里,我們找了100家企業,做了很多嘗試,有很多失敗案例,也有找到了成功的方法。牛文文提到企業如何破局AI,我4月8日本來要講一個免費課,專門講企業方法論,今天可以提前分享一點。

當年AMR并沒有像X86那樣,拼頻率、核數和算力。AMR最后是怎么成功的?ARM是拼輕量級,拼低功率,多年后ARM通過迂回策略,照樣成為了CPU王者,甚至在某些方面取代了X86。所以,模型不只一條路,不是越往大做越好,從千億到萬億。除了Open AI的路,還有另外一條路,就是大模型是越做越專。

在企業中做場景時,誰見過有一套IT軟件,既能管員工,又能管生產,還能管財務?這樣的軟件是不存在的。

在企業的定向應用場景里,只需要大模型解決單個場景里的專有問題。培養一個專業大模型,不需要會寫古詩,也不需要解奧數題,它只需要做一件事。企業只需要用專有數據和知識進行訓練,和企業之前的業務系統進行緊密整合。

我們用實踐證明了,企業在這個單項能力上是可以超過GPT-4的。

所以,企業級的大模型不需要用千億、百億,甚至幾十億的大模型就可以做。今天國內外幾十億、百億的開源模型非常多。換句話說,今天大模型不是白菜價了,而是免費了。企業的焦點不在于模型的選擇,而是你有什么樣的場景,有什么樣的知識,如何和企業業務相結合。這已經被證明,是大模型的一個現實方向。

昨天開源的Databricks,還有馬斯克開源的Grok,看起來參數很大,但里面都是基于混合專家(MoE)架構。說白了,就是由8個或16個小模型構成的,未來可能會有32個。每一個小模型只做自己最擅長的事情,且參數量都是百億級的,最后再用幾十個小模型拼湊成千億模型。

把一個模型參數從千億變到百億,看起來參數小了10倍,但是成本、復雜度、訓練和推理成本,可不是小了10倍,而是小了幾百倍,甚至上千倍。一個千億模型,沒有幾千張卡根本沒法訓練。但今天一個百億參數的開源模型,做單一任務,用一臺電腦、一個4090的顯卡,單機單卡都能跑起來。

現在大模型還有一個趨勢,就是大模型上終端、大模型上PC。這證明了,大模型在企業應用場景中,把模型越做越小、越做越專,是有可能的。

朱嘯虎:我覺得大模型就像一所大學,比如北大文科比較牛,清華理科比較強,大模型本身只是個基礎設施。最重要的是MoE(Mixed Expert Models,混合專家模型),核心是每一個E(Experts,專家),把E微調,讓它變強大。這是垂直應用場景適合做的事情。

周總剛提到美國算力消耗越來越大。我個人感覺,可能是Open AI的效率特別低。因為它在前面試錯,沒辦法,它不知道哪個更高效。GPT-4是30%的合成數據,GPT-5已經是90%的合成數據了??亢铣蓴祿硖岣叽竽P偷哪芰?,肯定很快會到上限。

任何時代都會有“永動機謬論”。AI時代的永動機謬論,就是靠計算機不斷合成數據,反復提升大模型的能力。這也是GPT-5需要幾十萬張卡的原因,因為它合成數據的效率非常低,大部分合成數據沒有信息價值,不可能做到熵減,就需要靠很大的合成數據量來創造部分的熵減。

我個人覺得,這種方法很快會碰到瓶頸。為什么我對中國追趕AI大模型很樂觀呢?就是因為這個曲線會很快到瓶頸。如果美國Open AI后面比較難,中國很快趕上還是有可能的。

周鴻祎:第一,我們看歷史,心懷夢想的小公司不是打不過大公司。前提是大公司處于懵逼狀態,對一個事看清、看不起、看不上,給了小公司機會。

谷歌的八個員工發明了Transformer,但谷歌根本不重視,后來這八個員工都離職了。Open AI撿到Transformer如獲至寶,給了Transformer差不多7年到8年的發展時間。小公司所有成功的例子,都是利用了這一點。但今天所有的人都知道Transformer很重要,所有人都知道要卷大模型,這樣留給小公司的空間就不是很多了。

如果有夢想的創業者要碰大模型,能顛覆Transformer,那你就去顛覆。你可以提出一套新架構,不像Transformer開銷這么大,那就有成功的機會。

如果技術路線還是七年前的,工程方法也是Open AI用過的,最后拼的還是算力,那最后的結果是什么?朱嘯虎看得比較明白。

所以,我還是講,沒有10億美金閑錢的創業者,就不要碰通用大模型了。

02

問答式的ChatGPT

肯定不是AI時代的殺手級應用

羅浛予:兩位老師都建議要在垂直場景中找機會,但,大家都涌入垂直場景廝殺的時候,創業者怎么做深做專才能殺出重圍?如果沒投資,前期又不那么容易盈利,該從哪些維度入手?

朱嘯虎:真正的垂直場景,其實不需要燒錢。

我們最小的一個公司用1張卡,提高了50%的效率。從我的實踐來看,+AI是門檻很低的事情,只要一跟進就是能看到效果,創造很多價值。很多創業者做應用端的創新,成本肯定不高,關鍵是懂垂直場景和用戶需求。知道什么樣的產品形態,可以給用戶創造一個數量級的價值。

周鴻祎:目前中國互聯網場景,已經被巨頭公司占盡了,大家都免費的話,你也很難收費,這不太適合沒有融到資的創業者。

但中國市場還是有很好的機會,它的特點是很碎片,按企業、按行業、按規模分成了很多區隔市場。好處是,即便是BAT、華為這樣的巨頭,也很難一下子壟斷,且企業愿意為降本增效掏錢。

過去企業軟件一直覺得SaaS軟件不容易掙錢,主要你給用戶創造降本增效的價值沒有那么大。如果今天AI確實能起到提升效率、降低成本的作用,企業是愿意付錢的。

但從場景選擇來說,我給三個建議:

建議一,場景選擇要非常小切口,不要做宏大敘事。

今天不要高估AI的能力,也不要低估AI的潛力。有人說,我做一個醫療大模型或教育大模型,這句話說得太籠統。必須把這個行業打開看,找50到100個的細致場景。比如,你能幫醫生在病例潤色和生成方面找到一個場景。所以,場景選擇特別重要。「創業黑馬」之前提出過“重度垂直”,一個是要足夠垂,一個是要足夠深。

建議二,要有足夠多的知識壁壘。

大模型把網上的“亮知識”都找到了,其實企業內部有很多知識是“暗知識”,只是在網上找不到,甚至老板本人都不一定有。如果你能想辦法,把有行業、企業know how的深度知識拿到,你的訓練就會有成果。否則,通用大模型一升級就能直接碾壓你。所以,重點是知識的選擇和知識的訓練。

建議三,別太迷信聊天機器人。

其實ChatGPT做了一個聊天機器人是為了讓大家愿意接受AI,本質這是一個科普行為。但在企業內部,聊天機器人并不是最好的人機交互界面。如果你給企業交付的是聊天機器人,各位作為企業家會知道,這很難用。

在企業內部,大模型有點像一個發動機。但用戶要的不是發動機,而是車。所以你得想辦法再給它做一個底盤和四個輪子,還得加上座椅。也就是說,你要最終通過智能體框架,把大模型跟企業之前的業務系統融在一起。這樣大模型才不是游離在企業信息系統之外的、孤立的問答機器人。

所以,Copilot的模式在中國收不到錢,要跟企業業務深度組合才可以。很多功夫都得用在大模型之外,只訓練大模型是遠遠不夠的。

朱嘯虎:我補充一下,我特別同意周總關于ChatGPT的看法。

從PC互聯網到移動互聯網,本質是從搜索引擎轉變到推薦引擎。為什么推薦更好呢?因為它更方便好用。問答式的ChatGPT,肯定不是AI時代的殺手級應用。因為它對用戶的要求更高,需要用戶想各種辦法提問,才能得到更好的答案,這對用戶的挑戰很大。所以,最后讓用戶問起來更簡單方便、更容易得到好答案的,才是AI時代的殺手級應用。

周鴻祎:對,ChatGPT剛出來時,大家都很迷戀Prompt,甚至有大佬說 Prompt Engineer 會變成一個新職業。但是Prompt簡直是反人性,不但很難寫,而且每次我寫一樣的東西,給我的答案還不一樣。自然語言讓人和人之間都很難溝通理解,更何況你和機器之間呢?

03

做殺手級應用之前

先找到殺手級場景

羅浛予:剛才我們聊了很多AI行業To B的模式。對做To C生意的AI創業者來說,在不燒錢或少燒錢的情況下,應該如何優化現有商業模式?

周鴻祎:To C領域,在做殺手級應用之前,應該先找到殺手級場景。去年的大模型,成功的地方是趕上了ChatGPT-3.5,不成功的地方是大家在To C的時候,就像朱嘯虎說的,都只是做了一個聊天機器人。

最近kimi比較火,360瀏覽器也跟著火了一把?;鸬谋澈笥幸粋€關鍵,是大家放棄了把自己作為全功能AI產品的定位,而是選了幾個真正能打動一些小眾用戶的場景。

比如,讀書能不能讀快點,我每天需要讀各種論文,外文又不怎么樣,能不能幫我分析論文。Kimi啟發360瀏覽器換了一個思路,我們找了一個明星場景。

所以,功能打動不了用戶,只有場景能打動人。從需求場景出發,來創造應用級產品,解決場景需求。大模型基本都是藏在后面解決問題的。

我最近看到一句話,“先選擇應用場景,再來定義應用, PMF(Product Market Fit,產品市場匹配度)實驗成功了,再訓練自己的模型。”

在垂直應用方面,大模型不一定做得很好。360AI瀏覽器用了5個小模型,分別做翻譯、搜索、閱讀理解、腦圖生成。五個百億級模型加起來,比千億級模型成本更低、速度更快。

在To C領域,要深刻地去找一些非常垂直的場景,我把它叫明星場景,用場景才能驅動產品設計、訓練自己的垂直大模型。

朱嘯虎:C端應用,我們太熟悉了。中國在互聯網上嘗試過太多C端應用場景了。

比如說,用5分鐘讀完一本書。以前有幾個APP做得挺好,他們的用戶場景為什么能引爆?因為讓用戶可以分享打卡朋友圈,告訴朋友們我看完了這本書,我很上進。但取消打卡功能以后,月活躍度馬上下去了。

現在年輕人覺得5分鐘看完一本書都很累,最好在抖音里用30秒鐘告訴我這本書講的什么內容?,F在的消費者既需要告訴自己朋友,我很上進,又不愿意花很長時間。讓GPT幫我2分鐘看一本書,這個需求也很難做得太大。

我相信大家都知道這個場景的用戶留存很差。你丟一個PPT讓ChatGPT總結財報,可能只有分析師才會用,讓消費者去用,這太難了。

今天的ChatGPT在消費者端怎么應用,可能要等到明年iphone裝了大模型再說。當一個手機有了幾個大模型后,才會發現在哪些C端應用可以引爆。但總體方向是,讓消費者更方便、更容易偷懶。

04

“為什么我不看好Midjourney?”

羅浛予:看來,朱總認為現在的To C商業化還有點早。

周鴻祎:我也同意這個說法。最近看了奧特曼的創業分享,很贊同他的觀點。奧特曼講,他在YC當總裁時,你可以先選一個小眾人群,做出一個他們喜歡的東西。如果得到了驗證,可以再看人群能不能擴展。

現在大家都在探索To C,但To B能找到的場景遠比To C要多?,F在還有一種殺手級應用——虛擬女友,但這很容易做成「not suitable for work」,不太適合中國的創業者做。

朱嘯虎:看字節跳動的發展史,從內涵段子、今日頭條到抖音,一脈相承,都關注用戶留存、用戶活躍、用戶時長,Engagement(用戶在App上的互動行為,如瀏覽、評論、點贊、分享等)。C端應用的核心就是能看到這些數據。

那今天的ChatGPT肯定做不到,它還沒有出現一個剛需高頻的場景。為什么我不看好Midjourney?因為C端做文生圖,肯定不是高頻場景。Midjourney的迭代速度很快,效果也在快速提高。但等它的迭代速度放緩后,必然會被高頻用戶場景的入口取代掉。

所以,在C端應用場景上,背后的邏輯始終都一樣:你是不是一個剛需高頻的入口場景?不是這樣的場景,最終還是沒有辦法做好防守。

05

“我不太相信AGI”

羅浛予:咱們今天發布會的主題是“每個中小企業都有一個AI夢”,不僅AI創業者有AI夢,也有很多產業希望借助AI降本增效,給傳統產業升一下級。那么,中小企業應該如何實現AI智能化升級?

周鴻祎:我覺得牛文文剛才總結得很好,我換了一種說法。

第一步,中小企業應該建立AI信仰(就是牛文文說的認知)。

AI信仰可以概括為四句話:第一,你信不信這是真AI?第二,你信不信這是一場工業革命,未來5-10年會席卷所有行業?第三,你信不信AI會重塑產品和內部管理的每一個鏈條?第四,你信不信用AI的公司會淘汰掉輕視AI的公司?

如果一個企業都不相信AI,這就是看不上、看不起,自然就看不清、看不懂。

第二步,AI的科普教育非常重要。AI跟云計算、大數據最大的不同,是很多企業員工可以不懂云計算、大數據,但并不妨礙他們用好大數據。但AI對業務的結合和每個人的生活、工作方式挨得太近。所以,從企業領導到基層都需要去了解AI。

現在網上很多制造焦慮的賬號,弄得大家對AI很敵視、很恐懼、很有距離感。怎么解決這個問題?我建議中小企業老板花點錢,無論是用GPT還是國內大模型,甚至將來牛文文也會給中小企業做私有化部署的大模型。

一定要讓員工每天都用,可能通用大模型能解決生活辦公的一些常見問題,還不能解決具體問題。但讓你的員工花幾個月去了解和熟悉AI,還是很重要的。

第三步,規劃應用AI。我發現,應用AI是需要業務來推動的。我們做AI的公司,最多給你提供很多工具,但對你的業務不了解。到底你的業務中有哪些場景適合做AI,還是要靠業務驅動。這就需要公司設置一個首席AI官的角色。

第四步,企業需要大量的知識。注意,不是數據。數據不等于信息,信息不等于知識,知識不等于智慧。實際上,做企業級大模型時,越智慧的知識,越是知識的數據,才更有價值。而這些需要在企業里去深度挖掘和搜集。

第五步,利用現有的成熟工具,把自己的私有大模型訓練起來。現在的訓練成本,已經低到幾百萬、幾十萬級別。而且,企業私有大模型融合了企業對業務的理解和企業獨有的知識,進而成為了企業的核心資產。確實沒錢的企業,也可以用SaaS服務商針對中小企業提供的應用。

2024年企業給自己提一個目標:至少讓自己的員工用一下大模型,至少讓他們對大模型不陌生。在企業內部管理流程、外部產品服務流程中,找一個場景用SaaS或私有大模型,解決自己的具體問題。這樣你在2024年就能超越很多同行了。

朱嘯虎:我覺得,AI是必須要去擁抱的,就像今天的企業無法想象沒有電腦和手機的生活。今天AI對效率的提升,甚至超過了之前的PC電腦。我們看到很多人在營銷端、客戶服務端,可以輕松提高30%到50%的效率。

我不太相信AGI,但是幫助企業提升30%到50%的效率,在未來幾年內很輕松就能實現。

06

未來每個企業將有多個專家模型

羅浛予:朱總還有什么問題拋給周總的嗎?

朱嘯虎:我很好奇360在消費端的AI是什么樣的邏輯,用戶留存和用戶時長怎么樣?

周鴻祎:這幾年360在AI端,其實在做To B、安全和To C三個場景。當然,主攻方向還是To B。

第一,我們做了一個安全大模型,自己掌握安全能力、數據和工具,做成了一個垂直模型。這個模型既為中國上百萬家企業提供服務,如取代無數安全專家,或在高水平安全專家配合下,給企業解決實時攻擊、實時發現、實時阻攔的問題。

第二,我們還給自己設計了一個大目標——解決AI大模型本身的安全問題。這個問題非常復雜,技術安全、數據安全、內容安全,甚至還涉及到道德文化,還有對硅基生物的控制問題。

第三,中國有這么多中小企業客戶,能看到很多場景機會,所以我們選擇為企業提供大模型的基礎設施。企業要做大模型,最重要的是保證知識大模型和情報大模型的供給。

在互聯網上,還是有幾個月活用戶超三四億的搜索和瀏覽器。我們在努力探索To C場景下怎樣讓大模型賦能場景。目前來講,大模型在To C方向的用戶預期太高,除非你真正實現AGI,否則總有回答不好的地方。所以,我們放棄了給用戶做全面回答的能力,而是先尋找一些垂直場景,先提高用戶的滿意度。

目前來看,雖然搜索受到了推薦和問答的影響,但是搜索依然是一個很大的基礎服務?,F在你不用在幾百個爛網頁里挑你要的答案,我們可以直接給你一個比較完整的答案,且可以自動生成腦圖,讓你能一次性得到比較全面的結果。

第四,瀏覽器是目前為數不多的、能完成用戶期望值70%-80%的To C場景。像其他很多場景就更不靠譜了。這也是為什么很長時間以來,全世界除了虛擬女友獲得蓬勃發展以外,微軟、谷歌都沒有在個人消費場景找到適合AI 的新應用點。

朱嘯虎:周總很務實,任何新興技術一定是首先在企業端采用,比如大哥大和PC電腦。因為一開始出來比較貴,而它又能幫企業降本增效。AI在C端的應用,確實還要等一兩年時間,這也比較符合中國目前的情況。

周鴻祎:我分享一點。你投資的公司也有這個特點。先選應用場景,再按照應用場景的用戶體驗給大模型提要求,這樣大模型的目標非常明確。最后的成本非常低,商業化速度也非???。

反過來,通用大模型基本上沒有8000個功能,也有1萬個功能。今年寫詩,明年閱讀,后年寫小作文。改來改去,用戶總能找到你回答不了的問題,這種時間周期是非常漫長的。而且,很多能力是用不到的,但是它運行時也必須全部加載,這些千億級大模型都要放在一個集群上運營,回答一次問題要好幾毛錢,反應速度還慢。

如果你找到用戶場景之后,只需要優化用戶需要的功能,還可以把這些功能分布在不同的垂直模型里。我們用差不多接近10個百億模型,每個百億模型的成本更低和速度更快。這個方法也更適用于企業級應用。

我猜想,未來一個企業里會有多個專家模型,將來可能還會有專家模型的大市場。比如,我把牛文文的天啟大模型買過來,把朱嘯虎投資過的模型買過來。

去年谷歌Transformer八子之一Llion Jones成立了新公司——Sakana AI(Sakana,來源于日語さかな,意為“魚”),專門做垂直小模型,他在研究把大模型和小模型糅合起來,把小模型的參數權重和另外一個模型合在一起。就像生物進化一樣,把有用的能力繼承下來,把沒用的能力淘汰掉。比如,把學日文和解數學題的小模型結合起來,生成一個解日文數學題的小模型,并保證了高品質和高性能。

未來大模型有兩個趨勢:一個是模型垂直化,一個是模型縮小化。比如,華為肯定要把模型上手機,小米也會這么做。大模型跟終端硬件做結合,也是中國創業者的機會。到時候比拼的不再只是參數,更不是一味地卷算力。

07

聯想的“貿工技”路線

依然最適合中國創業者

羅浛予:感覺周總好像還有點意猶未盡,你還想問朱總什么問題,可以盡管問。

周鴻祎:我覺得朱嘯虎的道理講得很好,但是很狡猾,就是不把投過的好公司分享給我們,是害怕我們抄襲嗎?舉兩個例子,讓大家知道你喜歡的公司是什么樣子。

朱嘯虎:那我具體舉兩個例子。比如,我們投的「FancyTech」就是用 AI 生成廣告視頻。我們聚焦在廣告視頻這個細分領域做得很好,這個公司已經在美國都拿到頭部客戶了。美國的Sora很厲害,它的目標是直接做電影。但到現在成本很高,還不能公開給用戶使用。

另一個例子是AI 視頻面試。我覺得,在兩三年之內,中國所有的校招全部會普遍使用 AI 視頻面試,因為確實能降低太多成本了。

你讓一個員工去面試一個大學生,要30分鐘左右,時間成本非常高?,F在用 AI 系統面試可以做得非常好,且可以體現出這家企業的技術非常領先。最高峰期,有一個客戶要求,一天面試10000人。所以,去年他們已累計面試了 100 萬人,今年第一季度就做完了去年50%的業績,預計今年整體業績至少翻 3 倍。

周鴻祎:他們不是在做一個HR大模型,而是做簡歷采集、識別和梳理,以及與面試者產生對話。把這兩個環節做好,就解決了很多企業的痛點和剛需,對模型的要求也比較低,一個4090單卡就跑起來了。

這就是我說的,一定要選對垂直場景,場景不怕小。有個說法叫小切口、大縱深。雖然切口小,但影響的企業是數以百萬計。

其次是重度垂直,跟行業結合得很深,比如做廣告視頻或視頻剪輯。在視頻內容的產生方面跟Sora比,是以卵擊石。但在做廣告視頻方面下很多功夫后,這個軟件能降低做事情的難度,提升工作效率,也一樣有價值。

很多軟件不是在跟Sora直接競爭,而是把Sora看作視頻來源。在Sora外面加一套復雜的工作流,這才是重度垂直的思路。

朱嘯虎:周總說得很好,在AI上面包一層,特別適合中國的創業企業。

周鴻祎:最后,我更正一下,我跟朱嘯虎還是很有AI夢想的人,也是很有理想的人,怎么就被說成很現實的人呢?

羅浛予:有人說,在中國AI少談夢,多賺錢。兩位怎么看?

周鴻祎:我覺得,不要把夢想和賺錢對立起來。

首先,人一定要有夢想,沒有夢想堅持不下去。第二,沒有夢想,也凝聚不了團隊,別人追隨不了你。第三,沒有夢想,你也沒有方向感。

但不能光談夢想,夢想都是有代價的,要么自己掏錢,要么騙朱嘯虎的錢花。你能形成自我造血能力,讓更多VC對你有信心,融到更多錢,才能跑得更遠。如果完全不考慮現實的操作,你就只能做夢,因為你連拿VC的錢支撐自己做夢的資格都沒有。

嘴上有夢想的人太多了,每個人都說我要當喬布斯,我要改變世界,最后夢想還是要靠一步一個小目標,積小勝而成大勝。

朱嘯虎:可以看看聯想,過了幾十年,聯想的“貿工技”路線,依然最適合中國創業者。依然是先養活自己,腳踏實地,同時要記著遠方的夢想。

羅浛予:今天的先鋒對話結束了,感謝兩位帶來這么多精彩觀點。

簡單總結一下:

1、今天所有推動人工智能發展的都是AI信仰派;

2、AI在中國的發展不是只有一條路;

3、中國很適合走場景化道路,選對垂直場景,小切口、大縱深;

4、想做To C場景的AI創業者,在做殺手級應用前,要先找到殺手級的場景;

5、希望通過AI實現智能化升級的企業,要建立AI信仰、做好AI科普、規劃應用AI、訓練私有大模型。

6.對創業者來說,現在卷通用大模型沒有意義,我們搶用戶、搶場景、搶數據,更有意義。

Just do it !