前阿里大數(shù)據(jù)中心高管、天壤CEO薛貴榮: AI將沖擊所有行業(yè) 人類(lèi)要學(xué)會(huì)和機(jī)器一起工作|連線(xiàn)創(chuàng)始人
原創(chuàng)
2023-03-31 21:22 星期五
科創(chuàng)板日?qǐng)?bào)記者 黃心怡
“在一些基礎(chǔ)工作被AI替代的同時(shí),也會(huì)衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國(guó)版ChatGPT要實(shí)現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時(shí)間差。”

《安安訪(fǎng)談錄》是界面財(cái)聯(lián)社執(zhí)行總裁徐安安出品的一檔深度訪(fǎng)談?lì)悪谀?。從投資角度對(duì)話(huà)1000位行業(yè)領(lǐng)軍人物,覆蓋傳媒創(chuàng)新、VC/PE、信息服務(wù)、金融科技、交易體系、戰(zhàn)略新興等方向。

科創(chuàng)板日?qǐng)?bào)《連線(xiàn)創(chuàng)始人/CEO》是由《安安訪(fǎng)談錄》出品的針對(duì)創(chuàng)新創(chuàng)業(yè)型未上市企業(yè)創(chuàng)始人的訪(fǎng)談欄目,以企業(yè)創(chuàng)始人/CEO的訪(fǎng)談為一手信源,讓成長(zhǎng)中的創(chuàng)業(yè)公司走入公眾和市場(chǎng)視野,并發(fā)掘最新技術(shù)和產(chǎn)業(yè)趨勢(shì)。

image

本期訪(fǎng)談人物:

天壤創(chuàng)始人兼首席執(zhí)行官 薛貴榮

“在一些基礎(chǔ)工作被AI替代的同時(shí),也會(huì)衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國(guó)版ChatGPT要實(shí)現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時(shí)間差?!?/p>

▍個(gè)人介紹

天壤創(chuàng)始人兼首席執(zhí)行官,人工智能與大數(shù)據(jù)領(lǐng)域科學(xué)家,國(guó)家科技部云計(jì)算專(zhuān)家組成員,原阿里媽媽首席數(shù)據(jù)科學(xué)家。首批全國(guó)優(yōu)秀博士論文獎(jiǎng)獲得者,國(guó)內(nèi)第一位在全球搜索領(lǐng)域頂級(jí)會(huì)議ACM SIGIR上發(fā)表論文的科學(xué)家,全球遷移學(xué)習(xí)領(lǐng)域開(kāi)創(chuàng)者和深度強(qiáng)化學(xué)習(xí)頂尖專(zhuān)家。薛貴榮博士曾在世界頂級(jí)會(huì)議NIPS、ICML、SIGKDD、SIGIR、WWW與世界頂級(jí)刊物ACM TOIS、ACM TIST等發(fā)表論文70余篇,擁有專(zhuān)利十余項(xiàng),論文引用達(dá)9000+。

▍第一標(biāo)簽

國(guó)內(nèi)深度強(qiáng)化學(xué)習(xí)領(lǐng)域開(kāi)拓者

▍公司簡(jiǎn)介

天壤成立于2016年,是專(zhuān)注于通用智能研究(AGI)的創(chuàng)新企業(yè),致力于解決人工智能的可用性和易用性問(wèn)題,實(shí)現(xiàn)以最小成本、最快速度賦能業(yè)務(wù)場(chǎng)景,讓智能像水電煤一樣便捷。

目前,已經(jīng)廣泛地服務(wù)于城市運(yùn)行、交通治理、金融保險(xiǎn)、商業(yè)零售、生物科技等場(chǎng)景。希望為人類(lèi)社會(huì)的可持續(xù)發(fā)展帶來(lái)突破性進(jìn)展,讓社會(huì)更便捷、更聰明、更智慧。

image

大模型近幾年持續(xù)火熱,薛貴榮認(rèn)為,ChatGPT能夠脫穎而出的根本原因是強(qiáng)化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng)。

“先預(yù)訓(xùn)練一個(gè)大模型,然后用強(qiáng)化學(xué)習(xí)去‘教導(dǎo)’模型,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),進(jìn)行‘自學(xué)習(xí)’。就像一個(gè)小孩對(duì)應(yīng)一個(gè)教導(dǎo)老師,不僅學(xué)習(xí)知識(shí),還學(xué)習(xí)方法,解決問(wèn)題的能力就可以持續(xù)提升。這才能代表真正的人工智能?!?/p>

薛貴榮指出,現(xiàn)如今的所有界面可能都會(huì)被重構(gòu),最終將變成人類(lèi)通過(guò)AI和數(shù)字世界進(jìn)行自然語(yǔ)言交流,可以直接向機(jī)器發(fā)送指令,解決問(wèn)題。

在2016年創(chuàng)立天壤之前,薛貴榮曾就職于阿里巴巴,先后任職阿里媽媽大數(shù)據(jù)中心負(fù)責(zé)人、阿里媽媽首席數(shù)據(jù)科學(xué)家等職務(wù),負(fù)責(zé)研發(fā)了阿里搜索引擎等平臺(tái)。

作為上海交通大學(xué)計(jì)算機(jī)系副教授,薛貴榮的研究方向主要為機(jī)器學(xué)習(xí)、信息檢索、互聯(lián)網(wǎng)營(yíng)銷(xiāo)、大規(guī)模數(shù)據(jù)分析和分布式計(jì)算,在世界頂級(jí)會(huì)議NIPS等發(fā)表論文70余篇,擁有專(zhuān)利十余項(xiàng)。

談及當(dāng)下ChatGPT所引領(lǐng)的人工智能熱潮,薛貴榮認(rèn)為未來(lái)兩年,會(huì)看到AI應(yīng)用的極度爆發(fā),人工智能技術(shù)將廣泛、深刻地改變各行各業(yè),并將帶來(lái)人機(jī)交互方式的巨大變革,所有的應(yīng)用和平臺(tái)要基于ChatGPT框架重新開(kāi)發(fā)。

在一些基礎(chǔ)工作被AI替代的同時(shí),也會(huì)衍生諸如人工智能培訓(xùn)師等新興行業(yè)。當(dāng)前中國(guó)版ChatGPT要實(shí)現(xiàn)追趕,最大的挑戰(zhàn)在于追趕時(shí)間差。”薛貴榮說(shuō)。

01

——————————

做中國(guó)版ChatGPT 算法創(chuàng)新和高質(zhì)量的數(shù)據(jù)缺一不可

對(duì)于ChatGPT熱潮背后的推動(dòng)力,薛貴榮認(rèn)為,首先是算力的提升,其次是算法的躍遷。Transformer把自然語(yǔ)言模型的上下文之間關(guān)系的學(xué)習(xí)能力,提升了新的臺(tái)階。

“過(guò)去基于卷積的神經(jīng)網(wǎng)絡(luò)依賴(lài)大量數(shù)據(jù),通過(guò)一層一層網(wǎng)絡(luò)的學(xué)習(xí),掌握如何把一個(gè)概念與另一個(gè)概念相關(guān)聯(lián)。但這種方式傳遞過(guò)程中往往容易產(chǎn)生信息的丟失。Transformer模型出現(xiàn)后,針對(duì)某兩個(gè)概念,機(jī)器可以更迅速、準(zhǔn)確地建立關(guān)系的連接。這種方式更接近于我們?nèi)祟?lèi)解決問(wèn)題的方式,可以考慮更復(fù)雜的事情。

同時(shí),ChatGPT引入了強(qiáng)化學(xué)習(xí)機(jī)制,加速推動(dòng)了通用人工智能的發(fā)展。

“在過(guò)去,標(biāo)數(shù)據(jù)是一個(gè)很困難的事兒,特別是標(biāo)這么大的規(guī)模。如今的ChatGPT基于大模型學(xué)到的知識(shí),并通過(guò)人類(lèi)的反饋進(jìn)行訓(xùn)練優(yōu)化。通過(guò)人的指導(dǎo),不斷告訴AI,這么回答是錯(cuò)的、這么回答是很有條理的。讓AI盡可能地掌握與人類(lèi)進(jìn)行溝通的‘技能’,以保證AI能夠像人類(lèi)一樣思考和回答問(wèn)題,并和人類(lèi)保持相似的價(jià)值觀(guān)?!?/p>

隨著ChatGPT帶動(dòng)人工智能產(chǎn)業(yè)成長(zhǎng),引起新一輪全球科技競(jìng)賽。中國(guó)的ChatGPT究竟該如何追趕?薛貴榮表示,國(guó)內(nèi)廠(chǎng)商要不惜代價(jià)地迎頭追趕,現(xiàn)在最重要的是追趕時(shí)間差。ChatGPT的智能化程度指數(shù)級(jí)增長(zhǎng)且與日俱增。其最終的迭代信息差和發(fā)展高度決定了我國(guó)與國(guó)外的平均智商差。

“大模型近幾年持續(xù)火熱,ChatGPT能夠脫穎而出的根本原因是強(qiáng)化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng)。第一,只有基于深度強(qiáng)化學(xué)習(xí)體系,模型才會(huì)有更好的反饋機(jī)制和價(jià)值判斷標(biāo)準(zhǔn),才能掌握更多優(yōu)質(zhì)數(shù)據(jù)和答案,才更逼近人類(lèi)智能。第二,只有對(duì)語(yǔ)料數(shù)據(jù)的抓取足夠充分,實(shí)現(xiàn)規(guī)模、深度、廣度的全覆蓋,才能提升高質(zhì)量數(shù)據(jù)密度,訓(xùn)練出好的大模型。要實(shí)現(xiàn)中國(guó)的ChatGPT大模型,這兩點(diǎn)缺一不可,而國(guó)內(nèi)廠(chǎng)商目前在這兩方面的探索還有較大提升空間?!?/p>

在模型方面,自然語(yǔ)言處理的兩大路線(xiàn)分別為谷歌BERT和OpenAI的GPT系列,兩者一直處于競(jìng)爭(zhēng)狀態(tài)。此前,BERT模型的表現(xiàn)更好,也導(dǎo)致國(guó)內(nèi)企業(yè)大多追隨的是谷歌BERT路線(xiàn),國(guó)內(nèi)的模型面臨技術(shù)路線(xiàn)的調(diào)整。

02

——————————

每個(gè)人都將擁有AI大腦

作為國(guó)家科技部云計(jì)算專(zhuān)家組成員,薛貴榮是國(guó)內(nèi)第一位在全球搜索領(lǐng)域頂級(jí)會(huì)議ACM SIGIR上發(fā)表論文的科學(xué)家。之后,也曾加入阿里巴巴,負(fù)責(zé)研發(fā)阿里全網(wǎng)搜索引擎。

2016年離開(kāi)阿里創(chuàng)立天壤后,薛貴榮堅(jiān)定了通用人工智能的探索道路?!白屆總€(gè)人都有一個(gè)AI大腦,是我們一直以來(lái)所堅(jiān)持的方向,也是我們最大的目標(biāo)?!?/p>

迄今,薛貴榮帶領(lǐng)團(tuán)隊(duì)先后在A(yíng)I圍棋、交通、生物科技等領(lǐng)域開(kāi)展探索,研發(fā)了AI圍棋TRGo、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)TRFold,以及國(guó)內(nèi)首個(gè)城市級(jí)交通調(diào)度系統(tǒng)TRTraffic、蛋白質(zhì)設(shè)計(jì)TRDesign等多個(gè)大模型。

薛貴榮向《科創(chuàng)板日?qǐng)?bào)》記者坦言,在創(chuàng)業(yè)過(guò)程中曾面臨中文版ChatGPT一樣的難題,即有標(biāo)注的數(shù)據(jù)量不夠。如果沒(méi)有高質(zhì)量的數(shù)據(jù),很難把技術(shù)做深。為此,天壤很早地就在實(shí)踐中引入了基于強(qiáng)化學(xué)習(xí)的數(shù)據(jù)增強(qiáng)機(jī)制。

“我們做強(qiáng)化學(xué)習(xí)在國(guó)內(nèi)是非常早的。2016年我們做AI圍棋的時(shí)候,用兩個(gè)機(jī)器人對(duì)抗的方法來(lái)生成大量的棋譜數(shù)據(jù),并通過(guò)優(yōu)勝劣汰的方式迭代優(yōu)化模型。那時(shí)候我們就發(fā)現(xiàn)用強(qiáng)化學(xué)習(xí)對(duì)模型的效果提升作用非常巨大,這個(gè)發(fā)現(xiàn)對(duì)當(dāng)時(shí)的我們來(lái)說(shuō)非常震撼,也證明我們找對(duì)了路子?!?/p>

薛貴榮認(rèn)為,生成高質(zhì)量數(shù)據(jù)的能力是天壤的優(yōu)勢(shì)。

“后來(lái)這套方法論我們?cè)谥悄芙煌I(lǐng)域進(jìn)行應(yīng)用。路上的信號(hào)燈基本上都是靠人力調(diào)控,調(diào)地好壞沒(méi)有很客觀(guān)的評(píng)價(jià)標(biāo)準(zhǔn)。同時(shí)信號(hào)燈又涉及上下游路口聯(lián)調(diào),流量24小時(shí)都在動(dòng)態(tài)變化,要獲取訓(xùn)練數(shù)據(jù)非常復(fù)雜。我們搭建交通模擬器來(lái)生成數(shù)據(jù),通過(guò)強(qiáng)化學(xué)習(xí)不斷的進(jìn)行模型的學(xué)習(xí)和數(shù)據(jù)生成,從而獲得高質(zhì)量的交通信號(hào)燈調(diào)控模型。

薛貴榮透露,在做蛋白質(zhì)研究時(shí),同樣采用了強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行數(shù)據(jù)增強(qiáng)?!跋扔媚P皖A(yù)測(cè)結(jié)果,然后再把預(yù)測(cè)好的數(shù)據(jù)投喂給模型訓(xùn)練,用數(shù)據(jù)增強(qiáng)的方式讓模型質(zhì)量有了大幅度的提升。經(jīng)過(guò)幾個(gè)大的復(fù)雜場(chǎng)景的實(shí)踐,我們研究大模型訓(xùn)練的路線(xiàn)越來(lái)越通用,也形成了統(tǒng)一的思路?!?/p>

“先預(yù)訓(xùn)練一個(gè)大模型,然后用強(qiáng)化學(xué)習(xí)去‘教導(dǎo)’模型,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),進(jìn)行‘自學(xué)習(xí)’。就像一個(gè)小孩對(duì)應(yīng)一個(gè)教導(dǎo)老師,不僅學(xué)習(xí)知識(shí),還學(xué)習(xí)方法,解決問(wèn)題的能力就可以持續(xù)提升。這才能代表真正的人工智能?!毖F榮總結(jié)。

從科學(xué)家變成創(chuàng)業(yè)者,薛貴榮直言這條路上確實(shí)荊棘重重。

“創(chuàng)業(yè)的關(guān)鍵,還是要有核心技術(shù),并且靠核心技術(shù)能夠帶動(dòng)商業(yè)。我覺(jué)得在國(guó)內(nèi),創(chuàng)業(yè)的門(mén)檻要足夠高,才能有機(jī)會(huì)?!?/p>

03

——————————

“這兩年AI應(yīng)用會(huì)極度爆發(fā),沖擊所有行業(yè)”

對(duì)未來(lái)人工智能的發(fā)展,薛貴榮表達(dá)了樂(lè)觀(guān)的態(tài)度。

“這兩年AI應(yīng)用會(huì)爆發(fā),而且會(huì)極度爆發(fā)。我覺(jué)得對(duì)所有的行業(yè)都會(huì)有沖擊。首當(dāng)其沖是客服會(huì)被顛覆,普通的律師、財(cái)務(wù)、人力等工作可能也會(huì)被替代。以后,人類(lèi)要學(xué)會(huì)和機(jī)器一起工作,這是競(jìng)爭(zhēng)力所在。機(jī)器將承擔(dān)絕大部分基礎(chǔ)性的工作,人類(lèi)主要做好‘指導(dǎo)’的角色,并把精力投入到更有創(chuàng)造性的事情上?!?/p>

在替代一些基礎(chǔ)工作的同時(shí),AI也將催生新的行業(yè),比如人工智能培訓(xùn)師。

“AI生產(chǎn)內(nèi)容的組織方式很重要。比如,讓AI提取財(cái)報(bào)的核心數(shù)據(jù),需要依賴(lài)人類(lèi)給他指令,告訴它重點(diǎn)是什么。將來(lái)會(huì)'提問(wèn)題'是一項(xiàng)很重要的能力。你問(wèn)的問(wèn)題越有挑戰(zhàn),越能持續(xù)幫助AI訓(xùn)練,升級(jí)AI應(yīng)用,AI回答問(wèn)題也將更加準(zhǔn)確、全面。這在未來(lái)幾年會(huì)是一個(gè)很大的行業(yè)。”

ChatGPT所引領(lǐng)的這波人工智能熱潮,也會(huì)帶來(lái)人機(jī)交互方式的巨大變革,所有的應(yīng)用和平臺(tái)要基于ChatGPT框架重新開(kāi)發(fā)。

“ChatGPT的成功不僅僅是新一代聊天機(jī)器人的突破,更是人工智能對(duì)整個(gè)信息產(chǎn)業(yè)帶來(lái)的革命,將帶來(lái)全要素生產(chǎn)率的極速提升?;贑hatGPT的全新的交互接口,所有的應(yīng)用、平臺(tái)、軟件將全部重新開(kāi)發(fā),代替以往Windows視窗作業(yè)系統(tǒng)?!?/p>

薛貴榮進(jìn)一步解釋?zhuān)艾F(xiàn)如今的所有界面可能都會(huì)被重構(gòu),最終將變成人類(lèi)通過(guò)AI和數(shù)字世界進(jìn)行自然語(yǔ)言交流??梢灾苯酉驒C(jī)器發(fā)送指令,解決問(wèn)題。人和數(shù)字世界的通道徹底被打通,AI將變得更加實(shí)用。你可以直接跟AI交流,來(lái)完成一個(gè)客戶(hù)email的回復(fù),完成一個(gè)廣告策劃的文案,也可以完成會(huì)議的關(guān)鍵內(nèi)容整理,獲取財(cái)報(bào)的關(guān)鍵數(shù)據(jù)。他會(huì)變成你個(gè)人的一個(gè)AI助手。越多的交流,他就會(huì)越能明白你的意圖,幫你解決各類(lèi)問(wèn)題?!?/p>

除了工作場(chǎng)景,行業(yè)和企業(yè)級(jí)的應(yīng)用,也將被完全顛覆?!安辉偈莻鹘y(tǒng)的交互方式,而是直接給AI下指令:把招聘需求、大量文稿翻譯,面試和財(cái)務(wù)報(bào)告的整理等等。”

當(dāng)然,這背后都需要大模型的支撐。薛貴榮認(rèn)為,未來(lái)模型會(huì)進(jìn)一步細(xì)分,除了通用模型外,還會(huì)衍生針對(duì)不同細(xì)分領(lǐng)域的行業(yè)模型,以及企業(yè)內(nèi)部模型、個(gè)人模型等等。

“總之ChatGPT讓我們看到大模型有希望實(shí)現(xiàn)通用人工智能。未來(lái)針對(duì)某個(gè)場(chǎng)景有Best Model(最佳模型),每個(gè)行業(yè)、每個(gè)企業(yè)都需要有一個(gè)ChatGPT,再結(jié)合個(gè)人模型。其中,個(gè)人模型里會(huì)包括你的基礎(chǔ)信息、喜好偏向等,便于A(yíng)I更準(zhǔn)確地為你提供個(gè)性化服務(wù)。”

收藏
113W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話(huà)題
7301 人關(guān)注