“我知道(大模型)未來一定會(huì)興起,要早一點(diǎn)做準(zhǔn)備,否則就來不及了。”
圖片來源|受訪者
創(chuàng)業(yè)之前,瀾舟科技創(chuàng)始人兼CEO周明在微軟亞洲研究院已經(jīng)領(lǐng)導(dǎo)團(tuán)隊(duì)做了3年多的大模型!拔④浉鶲penAI有合作,我們團(tuán)隊(duì)也跟他們有一些接觸,拿他們的GPT-2做一些實(shí)驗(yàn)!2020年,周明辭去了微軟亞洲研究院副院長的職位,離開了工作21年的微軟,準(zhǔn)備創(chuàng)業(yè)。“我知道(大模型)未來一定會(huì)興起,要早一點(diǎn)做準(zhǔn)備,否則就來不及了!這個(gè)決定并沒有獲得所有人的認(rèn)同,有人勸周明,“你折騰這干什么?”很多朋友也被他的堅(jiān)持所打動(dòng),選擇“能幫就幫一下”。“要不看起來我苦哈哈的!敝苊餍ΨQ。有了創(chuàng)業(yè)的打算后,周明第一時(shí)間找到了李開復(fù)。1999年,李開復(fù)把周明從清華招聘到微軟亞洲研究院。李開復(fù)對周明的創(chuàng)業(yè)想法表示大力支持。他首先聘請周明加入創(chuàng)新工場擔(dān)任首席科學(xué)家,熟悉創(chuàng)業(yè)環(huán)境,一點(diǎn)點(diǎn)開始孵化一個(gè)NLP(自然語言處理)團(tuán)隊(duì)。“開復(fù)給我提供了很多幫助,包括團(tuán)隊(duì)方向、找人和融資等方面都給予了大力幫助。我們創(chuàng)業(yè)到今天還算走得順利,在很多關(guān)鍵節(jié)點(diǎn)上開復(fù)和創(chuàng)新工場都給予了支持!2021年6月,周明創(chuàng)辦了瀾舟科技,沿著AI的NLP方向創(chuàng)業(yè)。他領(lǐng)導(dǎo)團(tuán)隊(duì)研發(fā)的“孟子預(yù)訓(xùn)練模型”,打造了搜索、生成、翻譯、對話等一系列功能引擎和垂直場景應(yīng)用。2021年,“孟子”模型以10億參數(shù),登頂中文語言理解權(quán)威評測基準(zhǔn)CLUE;孟子新一代認(rèn)知服務(wù)引擎在HICOOL 2021全球創(chuàng)業(yè)大賽中榮獲一等獎(jiǎng)暨人工智能和金融賽道第一名。4月底在接受《中國企業(yè)家》專訪時(shí),周明表示,他們最近又新推出了孟子GPT大模型,面向To B領(lǐng)域,服務(wù)企業(yè)典型場景,幫助企業(yè)降本提效。
2022年11月30日,ChatGPT的公布讓我眼前一亮。過去,我覺得大模型是未來,但沒有想到它這么快進(jìn)入普通人的視線。大家都可以用(ChatGPT),而且效果如此之好,這令我非常吃驚。我立刻意識到:人工智能的新時(shí)代要來臨了。于是,從去年12月起,我們開始行動(dòng)。為了“搶跑”,我們克服困難,馬上準(zhǔn)備算力、搜集和清洗數(shù)據(jù)等工作,然后開始訓(xùn)練模型。在花費(fèi)巨大努力后,我們終于訓(xùn)練出一個(gè)有多輪對話問答能力的模型 (孟子GPT模型)。現(xiàn)在回看,我們算國內(nèi)最早動(dòng)起來的團(tuán)隊(duì)之一,因?yàn)槲覀冞^去兩年來通過孟子模型積累了算法、工程、數(shù)據(jù)等各方面的能力,所以動(dòng)起來相對比較快。從1985年開始,我就一直從事自然語言的研究,經(jīng)歷過NLP的規(guī)則系統(tǒng)、統(tǒng)計(jì)模型、深度學(xué)習(xí)模型等各個(gè)時(shí)代。2017年谷歌推出Transformer的時(shí)候,我們在微軟亞洲研究院也馬上做了一些大模型的嘗試,包括融合了BERT和GPT的優(yōu)點(diǎn)的統(tǒng)一的預(yù)訓(xùn)練模型(UNILM)。在這過程中,我逐漸覺得大模型將是自然語言和人工智能的未來。到了2020年,我有了創(chuàng)業(yè)的打算,我的設(shè)想是做一個(gè)特別好用的大模型,各行各業(yè)都可以即插即用,從而提高生產(chǎn)能力,所以孵化了瀾舟團(tuán)隊(duì)。此后兩年里,我們的團(tuán)隊(duì)就一直在做大模型。但過程并不是一帆風(fēng)順的。一開始,我們想著煉一個(gè)大模型,但是發(fā)現(xiàn)代價(jià)很大。我后來仔細(xì)研究To B和To C的細(xì)分,認(rèn)真分析了在這兩條賽道上發(fā)展的優(yōu)劣,發(fā)現(xiàn)創(chuàng)業(yè)公司在To C業(yè)務(wù)上,跟大公司相比沒有競爭優(yōu)勢,所以我決定優(yōu)先發(fā)展to B業(yè)務(wù)。后來我走訪了很多客戶,客戶考慮到成本因素,建議我盡可能把模型輕量化。我們當(dāng)時(shí)考慮的是做To B業(yè)務(wù),一旦拿到單子,企業(yè)就有了現(xiàn)金流,對增強(qiáng)團(tuán)隊(duì)信心有很大幫助。所以我決定應(yīng)該先在B端煉輕量化模型。發(fā)展起來后,可考慮用To C的方式來獲客。瀾舟現(xiàn)在的發(fā)展路線也是如此,主要做To B企業(yè)服務(wù),將模型嘗試應(yīng)用在很多領(lǐng)域,如金融行業(yè)、網(wǎng)文娛樂、營銷廣告等。企業(yè)服務(wù)做好之后我們就有現(xiàn)金流回來,從而將技術(shù)打磨得更好,實(shí)現(xiàn)滾動(dòng)式發(fā)展。此外,我們也做了像翻譯、文本生成、小說生成等To C業(yè)務(wù)借以獲客。雖然用戶付費(fèi)意愿比較低,但如果有用戶喜歡,能夠幫助推廣產(chǎn)品品牌或轉(zhuǎn)換付費(fèi),形成傳播/流量效應(yīng)后,帶來To B的合作客戶。在過去兩年工作基礎(chǔ)上,我們今年主要任務(wù)是,抓緊研究ChatGPT代表的新范式,用更多的數(shù)據(jù)、更大的模型,做出類ChatGPT模型(孟子GPT大模型),它不僅可以進(jìn)行多輪對話、回答問題,也能把AI1.0的單功能引擎如翻譯、搜索、信息抽取等無縫連接起來。我們有充足的儲(chǔ)備去支持這些工作。今年2月份,新一輪的融資已經(jīng)到賬,我們會(huì)把大部分資金用在算力、數(shù)據(jù)以及人才上,將To B模型做好,并獲得收入,從而實(shí)現(xiàn)正循環(huán)。我向往“兩條腿走路”,一方面煉模型,一方面用模型,兩者構(gòu)成反饋鏈,加速各自能力的提升,打造一個(gè)創(chuàng)新閉環(huán)。
2.做好“人”的功課
創(chuàng)立瀾舟科技,是一個(gè)實(shí)現(xiàn)團(tuán)隊(duì)突破的過程。成功的要素很多,但是就像英偉達(dá)老板黃仁勛說的,“成功最重要的是韌性”,我對此深有同感。
從微軟離開時(shí),我沒有帶走團(tuán)隊(duì)任何一個(gè)人。這意味著起步非常困難。我當(dāng)時(shí)甚至覺得人應(yīng)該給自己制造一點(diǎn)困難,你一旦克服了困難,就能達(dá)到勇氣和能力上的更高境界。剛開始創(chuàng)業(yè)時(shí),整個(gè)團(tuán)隊(duì)只有我自己。不久,創(chuàng)新工場其他團(tuán)隊(duì)的幾位伙伴被我吸引,覺得瀾舟好像有“前途”,就主動(dòng)加入進(jìn)來。他們并沒有NLP的背景,但是在我的鼓勵(lì)下,努力開始在NLP領(lǐng)域?qū)W習(xí),隨后我又招了兩名實(shí)習(xí)生,我們5個(gè)人就慢慢開始訓(xùn)練模型。招聘是我們的“老大難”。畢竟當(dāng)時(shí)我們只是一個(gè)看不到明顯前景的小型創(chuàng)業(yè)團(tuán)隊(duì),也許唯一打動(dòng)人的辦法就是,跟面試者講未來的機(jī)會(huì)和情懷。我也通過我的一些學(xué)生、我的老朋友等熟人的信任關(guān)系招進(jìn)來第一批人,包括實(shí)習(xí)生,好不容易到了10個(gè)人。我們這樣一個(gè)“輕量化”的團(tuán)隊(duì)研發(fā)做出的孟子模型獲得了中文預(yù)訓(xùn)練模型CLUE測評的第一名,我們隨后又在北京HICOOL創(chuàng)新大賽獲得最高獎(jiǎng)。這些成績?yōu)槲覀兇蜷_一定的品牌知名度,逐漸有人從各個(gè)渠道了解我們并加入進(jìn)來,一點(diǎn)點(diǎn)滾雪球式地將團(tuán)隊(duì)發(fā)展成今天的50人團(tuán)隊(duì),其中90%以上都是技術(shù)人員。人才來了后,如何把他培養(yǎng)起來,并讓他喜歡公司,也是一個(gè)很大的挑戰(zhàn)。因?yàn)閳F(tuán)隊(duì)逐漸有了名氣之后,其他公司的“挖角”不可避免。為此我們做了很多功課。首先是建立企業(yè)文化,為員工樹立互助的職業(yè)發(fā)展觀。我們試圖打造一個(gè)大家互相幫助、互相成就、新人可以得到學(xué)習(xí)、鍛煉和尊重的工作環(huán)境,并提供一個(gè)施展身手的平臺(tái)。第二是組織培訓(xùn)討論等形式的交流會(huì)。我們一直有每月一次(ChatGPT出現(xiàn)后改為兩月一次)的披薩DAY“傳統(tǒng)”,員工們可以一邊吃披薩,一邊交流學(xué)習(xí),增進(jìn)彼此之間的理解。每次的披薩DAY都由員工們輪流組織承辦,以此鍛煉每個(gè)人的協(xié)調(diào)組織能力和溝通能力。第三,我們還鼓勵(lì)員工做內(nèi)部/外部講座,讓他體驗(yàn)到學(xué)術(shù)水平上升的成就感。除此之外,我也不可避免地面臨初創(chuàng)業(yè)時(shí)的茫然。畢竟之前在微軟研究院時(shí),我作為研究員/科學(xué)家,只需要注重算法技術(shù),其他各方面都有微軟平臺(tái),或者同事幫忙照顧解決。但創(chuàng)業(yè)之后,平臺(tái)紅利沒有了,方方面面都要靠自己,不僅要從零建設(shè)團(tuán)隊(duì),還要自己去談融資、業(yè)務(wù)等。這對于我來說都是全新的嘗試和考驗(yàn)。一開始談投資的時(shí)候,每輪我都要見至少20~30家機(jī)構(gòu),最終可能只有一兩家機(jī)構(gòu)愿意投。在這過程中,對內(nèi),我們要做出項(xiàng)目的核心技術(shù);對外,我要表述出我們的實(shí)力以及清晰的戰(zhàn)略方向,還要掌握與投資人的溝通技巧。
如何實(shí)現(xiàn)業(yè)務(wù)盈利也成了我必須要考慮的事。剛開始創(chuàng)業(yè)時(shí),我既不知道用戶在哪,也不知道用戶需求是什么,這種情況下,做出的模型也很難被直接投入使用。我覺得一定要走近客戶,才能了解客戶痛點(diǎn),產(chǎn)出有用的產(chǎn)品。于是我們跟華夏基金成立一個(gè)聯(lián)合實(shí)驗(yàn)室,經(jīng)常走訪,盡量了解對方的需求。帶著用戶的反饋,不斷完善大模型能力,讓我們訓(xùn)練的大模型真正實(shí)用。我們在過去兩年煉大模型方面積累了很多經(jīng)驗(yàn),而且我們在To B業(yè)務(wù)上也建立了不錯(cuò)的合作伙伴關(guān)系和生態(tài),從技術(shù)到落地形成了閉環(huán)。在ChatGPT引發(fā)大模型熱潮后,我們提出了更高的目標(biāo)。要儲(chǔ)備更多算力、數(shù)據(jù),更快地迭代模型,更好地滿足客戶需求,實(shí)現(xiàn)應(yīng)用落地。在我的規(guī)劃里,瀾舟團(tuán)隊(duì)會(huì)保持短小精干的狀態(tài)。今年我們有51人,明年可能達(dá)到100人左右,未來也不會(huì)猛漲。煉大模型需要訓(xùn)練有素的人才,厲害的人1個(gè)可能頂10個(gè)。我認(rèn)為百人團(tuán)隊(duì)?wèi)?yīng)該是可以長期穩(wěn)定的一個(gè)規(guī)模。
3.科學(xué)家創(chuàng)業(yè)的必備要求
最近兩個(gè)月,煉模型需要不斷測試、修正、訓(xùn)練、調(diào)優(yōu)等過程。我們團(tuán)隊(duì)的人都感到壓力很大。不過,我并不太著急,我覺得煉大模型不要太過于著急,不可能“畢其功于一役”,它是一個(gè)持續(xù)的過程。對每個(gè)組的工作,我們都做好了規(guī)劃,設(shè)立了若干check point。大家按照既定方針,按照計(jì)劃緊湊、有效、有序地往前推進(jìn)就可以了。我不會(huì)推著團(tuán)隊(duì)去“不舍晝夜”地加班。我認(rèn)為既然這是一個(gè)長期奮斗的過程,短期內(nèi)不停加班趕出一個(gè)比較粗糙的模型發(fā)布出來,也許可以一時(shí)之間造勢,但并不是長久之計(jì)。某些大廠急于發(fā)布,肯定有自己的考慮,因?yàn)樗赡芟M靹荩覀兎浅@斫。而我追求的是穩(wěn)扎穩(wěn)打,把事情做得穩(wěn),真水平做出來,尤其是To B企業(yè)服務(wù),要做到令客戶滿意,這才是最重要的試金石。作為領(lǐng)導(dǎo),我要做好統(tǒng)籌布局,把握好每個(gè)人的方向,促進(jìn)他們互相之間的配合,使得他們能最高效地工作,而不是強(qiáng)求他們的最長工作時(shí)間。作為一名科學(xué)家/研究員轉(zhuǎn)型創(chuàng)業(yè),面對這個(gè)全新的“工作領(lǐng)域”,我覺得要做很多調(diào)整。首先要磨煉心智,因?yàn)閯?chuàng)始人需要做各種權(quán)衡,甚至有一些痛苦的決定。其次要做前瞻性的思考。有時(shí)我會(huì)覺得焦頭爛額,沒有時(shí)間去思考未來的發(fā)展,因此我試圖平衡自己的時(shí)間,比如利用周末去思考未來3-5年的發(fā)展戰(zhàn)略,想得更明白后,再跟團(tuán)隊(duì)進(jìn)行有效溝通。在這過程中,我每次都抱著學(xué)習(xí)的態(tài)度,我知道自己換了新的領(lǐng)域、新的角色,會(huì)有很多我不清楚的地方,虛心請教別人、看一些資料,試圖做出對我來講最正確的決定,不固執(zhí)己見,有人提醒(有道理)我就及時(shí)調(diào)整。由于技術(shù)發(fā)展日新月異,我雖然不能保證像以前一樣讀paper、看書、看資料、使勁摳算法,但我一直保持清醒的進(jìn)取心,新技術(shù)出現(xiàn)了,我就馬上去學(xué)習(xí),去了解它的大致思路,它有什么用、誰用了,適合不適合我們?yōu)懼郯l(fā)展。如果適合,我會(huì)快速指定同事去了解,想辦法用在項(xiàng)目中。
保持對新鮮事物、新鮮技術(shù)的好奇心,這是必備的。因此,我日常的學(xué)習(xí)分散到了工作生活的點(diǎn)點(diǎn)滴滴中,比如朋友圈、新聞、論壇等等都是我的學(xué)習(xí)渠道;其次,我也會(huì)通過這些途徑去與人交流,了解別人的看法。第三就是要總結(jié),我每周都會(huì)寫周報(bào),將我學(xué)到的知識、體會(huì)落到“紙面”上,再分享給同事們,這對于我來說是一個(gè)萃取提煉的過程,不僅能提升自己,也帶給別人一些啟發(fā)。對于公司的未來發(fā)展,我給自己定下了十年的目標(biāo)。我想用10年的努力,形成有戰(zhàn)斗力的公司文化,使它可以經(jīng)受任何挫折,成為中國乃至世界上最有影響力的NLP團(tuán)隊(duì)。
(圖文來源于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系刪除)