大模型沖浪者的故事
2024-06-20 14:39:40 來源:法人雜志 作者:李遼

◎文 《法人》雜志全媒體記者 李遼

當下,作為大模型企業(yè)的從業(yè)者,北京瑞泊控股(集團)有限公司(下稱“瑞泊”)董事長乙壤月正忙于接待各方來客及出席各種高端論壇和行業(yè)峰會,隨時分享自己最新的觀點和見解,應對日益增長的公眾期待。短短一年多時間,伴隨著大模型的突然走紅,瑞泊從無人關注到成為媒體追逐的焦點,承受著與之前截然不同的壓力和挑戰(zhàn)。

圖片

▲乙壤月 宋逗/攝

同樣忙碌的,還有北京網智天元科技股份有限公司(下稱“網智天元”)創(chuàng)始人莫倩。盡管網智天元已經是國家級專精特新“小巨人”企業(yè),但隨著技術的飛速演進,他和公司正在進行著從大數據分析到大模型的全面轉型。如今,他的壓力似乎比之前更大,因為大模型背后的潛力與可能性無窮無盡。

圖片

▲莫倩 宋逗/攝

等待拐點

莫倩的北京網智天元科技股份有限公司(下稱“網智天元”)2007年便已成立,一直在垂直行業(yè)提供大數據分析處理的產品和服務。

2017年6月12日,谷歌大腦團隊發(fā)布了一篇論文,宣告transformer架構的橫空出世。這是人工智能圈子里的爆炸性新聞,也是計算機專業(yè)出身的莫倩認為最振奮人心的時刻。

彼時,“一帶一路”國際合作高峰論壇首次舉辦后不久,國家急需構建一個具備多元處理能力的大數據平臺,對國際輿論進行深入梳理與分析。面對全球26種不同語言的挑戰(zhàn),這個大數據平臺必須具備卓越的翻譯能力。“當時,傳統(tǒng)機器翻譯還依賴于統(tǒng)計學方法,但transformer的出現,讓我們得以構建一個接近人類認知能力的翻譯大模型?!蹦换貞洝?/p>

時間緊迫,任務艱巨,莫倩團隊開始了緊鑼密鼓的項目籌備。競標時,國內幾乎所有從事機器翻譯和大數據處理的頭部公司都參與其中。網智天元憑借對transformer技術的深刻理解和掌握,實現了彎道超車,擊敗了包括知名互聯(lián)網大廠和專業(yè)機器翻譯企業(yè)在內的強勁對手。

這一契機,讓網智天元與大模型結下了深厚的緣分,并連續(xù)成為“一帶一路”國際合作高峰論壇第二屆、第三屆的服務提供商?;貞浧饋恚徊唤锌褐挥凶プ〖夹g拐點,才能在競爭中保持領先。

同樣在2017年,乙壤月離開了互聯(lián)網大廠,創(chuàng)立了瑞泊。憑借對金融資產配置經驗的積累,他帶領團隊選擇切入金融行業(yè),專攻金融智能系統(tǒng)研發(fā)。由于涉及大量文本和非文本數據,需要運用自然語言處理模型?!坝谑牵覀冺樌沓烧碌剡M入了大模型領域?!币胰涝抡f,“當時大模型的概念還不為大家關注,所以我們在介紹時自稱金融行業(yè)的智能決策公司。”

在GPT-3.5發(fā)布前,大模型仍然是一條孤獨的賽道?!皼]有多少同行者,甚至沒有什么競爭對手?!币胰涝禄貞?,當時大模型在全球范圍內尚未迎來拐點,你不知道這條技術路線何時能獲得突破?!爱吘?,很多技術即使等一輩子也沒能看到突破瓶頸?!?/p>

特別是新冠疫情三年,瑞泊陷入了前所未有的困境?!巴度肴康木唾Y源去打造一家前景莫測的技術公司,周圍人都說我們軸,親朋好友幾乎都勸我放棄?!?/p>

在摸索期,乙壤月經常捫心自問:“如此巨大的投入,倘若不能成功,是否意味著之前所有的努力與付出都付諸東流?是否應當采用一些更成熟的技術路線去解決問題?畢竟,那些路看起來更平坦、更穩(wěn)妥?!?/p>

2022年11月,Open AI發(fā)布了GPT-3.5,業(yè)內為之沸騰。當乙壤月看到新聞時,甚至有些喜極而泣:“這么多技術門派都在解決同一個問題,但現在只有大模型走出來了,我心里十分自豪?!彼芍杂X得,做一家技術公司是需要信仰的,而信仰就是,相信團隊、相信內心的判斷。

深耕垂類

通過深入分析,乙壤月認為,在通用大模型的賽道上,中國在算力芯片供應等多方面受到制約,算力與美國相比存在差距,但在垂類大模型的發(fā)展上,主要國家?guī)缀醵荚?023年上半年開始密集布局。“從時間維度看,中國并沒有落后,同時,中國產業(yè)多樣、配套完善,擁有極為豐富的應用場景,這些都是發(fā)展垂類大模型的顯著優(yōu)勢。只要我們能夠洞察并充分利用這些優(yōu)勢,就不會弱于美國。”

此外,雖然通用大模型吸引了眾多目光,但它更多面向普通民眾,并不能解決企業(yè)和行業(yè)面臨的具體問題?!叭绻覀兩罡诡惔竽P停粌H能為國家和社會創(chuàng)造更大價值,同時自身的機會也會更多?!?/p>

乙壤月舉例,如果讓通用大模型撰寫一篇醫(yī)療或金融領域的專業(yè)文章,它所依賴的往往是書本或互聯(lián)網上的公開資料,而這些資料在實際工作中缺乏足夠的專業(yè)性。在行業(yè)和企業(yè)中應用的大模型,需要經過特定的訓練和優(yōu)化。“通用大模型好比是通才,而垂類大模型則相當于專業(yè)領域的專家?!彼f。

莫倩也做了同樣的選擇。在選擇長期深耕的方向時,他認為通用大模型的競爭非常激烈,算力投入巨大,雖然自己的公司已具備一定規(guī)模,但長期承受如此巨大的資金壓力很不現實?!按竽P桶l(fā)展一日千里?!彼f,“往往投入巨資,耗時數月甚至數年研發(fā)出一個滿意的模型,但可能不出一個月,別人就訓練出了一個更好的模型?!?/p>

因此,他選擇與行業(yè)巨頭合作,專注于開發(fā)細分場景的垂類大模型。憑借過去10年在金融大數據服務領域積累的豐富數據,網智天元成為了華為、阿里、移動和電信等企業(yè)開發(fā)金融風險大模型的唯一合作伙伴。

瑞泊同樣在金融領域發(fā)力?!捌┤纾瑸楦邇糁等巳哼M行資產配置時,需要考慮股票、私募、公募、債券等多種投資工具。通用大模型和垂類大模型的差別,在這種情況下就非常明顯。后者可以根據每個人的具體需求,量身定制資產配置方案?!?/p>

如今,瑞泊還切入了航運行業(yè),就拿很簡單的翻譯來講:“如果使用互聯(lián)網大廠的通用大模型翻譯一篇普通文章,效果尚可以保證,而一旦涉及航運這樣的專業(yè)領域,通用大模型在處理許多專有名詞和術語時就顯得力不從心?!?/p>

未來暢想

大模型火了,乙壤月的重負有所減輕,但壓力仍如影隨形?!拔覀儾粩嘁娮C重大的技術突破和發(fā)現,同時迎來了各種重大的商業(yè)合作機遇。我們現在要承受的是任務交付的壓力和面對外界對我們的高期待?!睒I(yè)內仍在不斷涌現新興技術路線,是否應該跟進?他坦言,這些決策的壓力并不比以前輕松。

大模型迭代迅速的同時,瑞泊也處于快速的發(fā)展之中。今年,瑞泊對自己的定位進行了升級?!叭ツ?,大家都說我們是大模型企業(yè),現在我們把自己定位為關鍵行業(yè)的超腦構建者?!?/p>

乙壤月進一步闡釋,所謂的超腦,即超級大腦。“雖然大模型功能強大,但仍有其局限性。例如,在數值計算上可能出錯,也會有模型幻覺問題。大模型只是超腦的一個組成部分,我們的建設目標是如何規(guī)避大模型的短板,同時最大化其優(yōu)勢?!?/p>

他用一個更加形象的比喻來說明:“就像出去打仗,你需要的是一支完整的部隊,而不是一位將軍。大模型就像這位將軍,雖然能力出眾,但無法代替整個部隊。超腦就像部隊,用多種技術、多個核心部件的組合打造行業(yè)解決方案,能夠滿足企業(yè)多方面、多角度的需求。”

莫倩則提出了全域智能的概念。他認為,人工智能發(fā)展到終極階段必將成為全域智能?!叭斯ぶ悄艿牡谝粚邮切畔⒅悄埽涫芟抻诰W絡這個虛擬世界;第二層是認知智能,它能夠與人互動,改變人的認知和情感。如同網智天元正在研發(fā)一款能夠與兒童互動的玩具,能模擬父母的聲音,長時間陪伴兒童,正是認知智能的體現。”他說,第三層則是具身智能,即機器能夠與物理世界進行交互,就像電影《非誠勿擾3》中所描繪的場景。

他認為,全域智能將為人工智能打開無限可能性,將重新洗牌所有賽道,消融你熟悉的一切,對現有的格局進行徹底的顛覆,“那一天很快就會到來”。

編審|渠 洋

責編|白 馗

校對|張波 張雪慧

編輯:劉曉瑩