“科技迭代的速度越來越快,我們鉚足了勁往前去追,希望可以摸索出一些出路。作為科研工作者,我感到非常激動;同時,我還有一種緊迫感,在如此的歷史機遇面前,希望自己能夠不負時代,有所作為,為社會發(fā)展帶來更多的創(chuàng)新技術。”復旦大學教授薛向陽說。
為貫徹落實上海市委、市政府《關于全面推進上海城市數(shù)字化轉(zhuǎn)型的意見》精神,推動“經(jīng)濟、生活、治理”全面數(shù)字化轉(zhuǎn)型,引導全社會共建共治共享數(shù)字城市,在上海市城市數(shù)字化轉(zhuǎn)型領導小組辦公室、上海市經(jīng)濟和信息化委員會的指導下,上海市城市數(shù)字化轉(zhuǎn)型應用促進中心(上海市智慧城市建設促進中心)策劃推出《數(shù)智說》系列人物對話,與媒體平臺財聯(lián)社共同合作,邀請上海城市數(shù)字化轉(zhuǎn)型方面具有杰出影響力的專家大咖和領軍先鋒,從經(jīng)濟、生活、治理三大領域,闡述上海城市數(shù)字化轉(zhuǎn)型最新成果,展現(xiàn)城市數(shù)字化建設者們的前瞻性視野與可行性經(jīng)驗,并對上海建設國際數(shù)字之都的未來圖景進行展望,推動數(shù)字化轉(zhuǎn)型,賦能城市煥發(fā)新活力。
本期訪談人物:
復旦大學計算機科學技術學院教授、博士生導師 薛向陽
“科技迭代的速度越來越快,我們鉚足了勁往前去追,希望可以摸索出一些出路。作為科研工作者,我感到非常激動;同時,我還有一種緊迫感,在如此的歷史機遇面前,我希望自己能夠不負時代,有所作為,為社會發(fā)展帶來更多創(chuàng)新技術?!?/p>
ChatGPT的橫空出世讓人工智能再次成為熱詞,社會各界對它的探討與思考也逐漸走向了更深層次:眼下的人工智能已發(fā)展到了什么程度?再一次突破技術瓶頸還需哪些條件?在人工智能浪潮中,我國又處于怎樣的地位?
要回答這些問題,不妨去最前沿的科學研究領域看一看。復旦大學類腦人工智能科學與技術研究院副院長薛向陽教授長期浸潤于人工智能的科研一線,對人工智能有著大量的科研成果及產(chǎn)業(yè)化經(jīng)驗,日前,《科創(chuàng)板日報》記者與薛向陽教授進行了對話探討。
據(jù)介紹,早在上世紀70年代后期,復旦大學就開啟了人工智能兩個重要方向的研究,即計算機視覺和自然語言處理,目前已形成了一支頗具規(guī)模的AI研究團隊。薛向陽教授領導的計算機視覺團隊開發(fā)了計算機視覺算法庫,包含了圖像字符檢測與識別、行人重識別、單目三維目標檢測等性能領先的算法模型,顯著提升了檢測識別精度。此外,該AI研究團隊還自主開發(fā)了基于深度神經(jīng)網(wǎng)絡的自然語言處理算法庫,最近開源了大型語言模型MOSS,大大降低了自然語言處理技術的應用門檻……
從完成特定任務的小模型,到多任務大模型
“回顧我的學術生涯,激動二字是我最大的感觸?!毖ο蜿柗Q,這種激動之情,是算法的快速迭代發(fā)展所帶來的,“你很難再找到另一個行業(yè),可以在短短十多年內(nèi),發(fā)生如此高頻的迭代進化,而且,這種迭代進化還極大推動了社會經(jīng)濟的發(fā)展,引發(fā)了深刻的產(chǎn)業(yè)變革”。
薛向陽介紹稱,在過去短短十幾年的時間里,計算科學發(fā)生了“翻天覆地”的變化,“由于數(shù)據(jù)的爆發(fā)式增長、CPU/GPU計算能力的大幅提高、硬件的快速迭代和深度學習算法的發(fā)展成熟,計算科學領域取得了顯著的成就——其實,仔細算起來,深度學習算法也就發(fā)展了不到十年的時間”。
對此,作為科研工作者,薛教授最直接的感受是課題研究的方式變了。
“過去我們做研究,是一個任務、一個模型、一批數(shù)據(jù),各個課題小組根據(jù)任務‘單兵作戰(zhàn)’;現(xiàn)在有了大模型,它可以實現(xiàn)通用化,不再需要那么多單個的任務小組了。但是,大模型需要算力,動輒需要幾百上千個高性能GPU卡,這又讓學術研究的門檻提高了很多。”薛向陽表示。
更進一步來說,薛向陽認為,隨著大模型在日常生活中的逐漸滲透,未來的人才培養(yǎng)方式也會發(fā)生改變:相較于考試“得分”,學生的創(chuàng)造力及創(chuàng)新能力會顯得更加重要。
更值得一提的是,在這股技術浪潮面前,薛向陽坦言,中國還有自身獨特的優(yōu)勢。
“首先,中國具有多應用場景的優(yōu)勢,在由應用所驅(qū)動的研究領域,我們已經(jīng)處于全球領先水平;其次,在原創(chuàng)性的基礎研究方面,雖然目前國內(nèi)還有短板,但再有一段時間,想必也會有所突破?!毖ο蜿柗Q,從全球范圍來看,在人工智能研究領域取得重大突破的,有不少杰出的華人科學家。
因此,作為科研工作者,薛向陽既感覺到自己面對著巨大的機會窗口,可作為的空間廣闊,又明顯感到自己責任在肩:“科技迭代的速度越來越快,我們鉚足了勁往前去追,也希望可以摸索出一些出路。作為科研工作者,我感到非常激動;同時,我還有一種緊迫感,在如此的歷史機遇面前,希望自己能夠不負時代,有所作為,為社會發(fā)展帶來更多創(chuàng)新技術?!?/p>
腦科學研究的突破,將繼續(xù)促進算法的迭代
在進行科研攻關的過程中,薛向陽把自己的視線瞄向了腦科學。
據(jù)悉,人工智能的技術路線大致可分為兩條:一條以ChatGPT為代表,依靠海量數(shù)據(jù)和強大算力,通過對深度學習算法的不斷迭代,更好地建立起輸入和輸出之間非線性映射關系,這一類構建大模型方法可以稱之為功能類腦;另一條則是結構類腦的大模型構建方法,通過模擬仿真人腦規(guī)模的神經(jīng)網(wǎng)絡,稱之為數(shù)字孿生大腦,在此基礎上研究感知、學習、記憶、決策等認知功能。目前,復旦類腦智能科學與技術研究院在馮建峰院長領導下,有一支跨學科研究團隊正在開展這方面的探索研究。
薛向陽稱,他認為,第二條技術路線如果走通,可能會帶來比ChatGPT更具顛覆性的變革。
他進一步解釋稱,這一方面是因為深度學習算法具有一定的“先天限制”。比如,模型訓練依賴人工對數(shù)據(jù)進行標注;模型反映復雜關聯(lián)關系,缺乏透明性,對預測結果缺少合理解釋;模型易受對抗樣本攻擊,對應用場景穩(wěn)定性要求極高等等。
另一方面,基于數(shù)字孿生大腦開展其認知功能的研究,是類腦智能研究的一個新的探索方向。
“人腦有860億個神經(jīng)元,每個神經(jīng)元可能連接到1000~10000個其他神經(jīng)元,神經(jīng)信號經(jīng)由這些連接所形成的神經(jīng)環(huán)路進行信息的接受、傳遞和處理,其復雜程度是Chatgpt4的上百倍,而大腦能耗大致是15~30瓦。”薛向陽激動表示,如果有一天,計算機可以像人腦一樣進行計算,不僅耗能低,而且計算效率驚人,那么這又會為人類社會帶來什么呢?
實際上,人腦的強大特性已給到科學家們對于人工智能的新啟發(fā),這也是人工神經(jīng)元、類腦智能算法的基礎。
早在1943年,心理學家McCulloch和數(shù)學家Pitts參考了生物神經(jīng)元的結構,發(fā)表了抽象的神經(jīng)元模型MCP。以此為開端,學界接連提出了人工神經(jīng)網(wǎng)絡ANN和深度卷積神經(jīng)網(wǎng)絡CNN,最后實現(xiàn)了0到9的簡單字符識別,在其基礎上構建出了各種各樣的深度神經(jīng)網(wǎng)絡模型,成為今天我們所見到的各種大模型的肇始。
不過,薛向陽表示,所謂“知其然,知其所以然”,要學習人腦是如何對信息進行接受、傳遞和處理的,首先就要了解人腦的工作原理。但一直以來,礙于科學技術水平有限,人類對于人腦的研究始終有限。
在復旦大學,得益于各類項目支持,科研人員們把對人腦的研究往前推進了一大步:其類腦人工智能科學與技術研究院是國內(nèi)高校最早成立的腦科學與類腦前沿交叉研究機構之一,現(xiàn)在,通過數(shù)字孿生、核磁共振等技術,該研究院已完成了對人類的大腦全數(shù)字化仿生,進而在計算機上復刻出一個數(shù)字大腦。
“我們可以去了解大腦的結構,反解大腦結構,構建數(shù)字孿生大腦。腦科學家們可以基于該研究成果進行腦疾病發(fā)病機制的研究;后期,甚至可以接入一個機器人,將數(shù)字孿生腦植到機器人上……”薛向陽解釋稱,打開想象力,基于數(shù)字孿生腦,他們可以做的工作還有很多很多。
同時,薛向陽也坦言稱,這是一個龐大的工程,涉及認知神經(jīng)科學、計算生物學、計算精神病學、人工智能算法、類腦智能技術與轉(zhuǎn)化等前沿基礎和應用研究,需要打通芯片、算法等軟硬件方面的各項合作。最近,復旦大學大數(shù)據(jù)研究院在院長鄔江興院士領導下,正在探索用晶上系統(tǒng)實現(xiàn)全腦仿真,以其進一步提高芯片集成度和降低功耗,從而持續(xù)提升類腦智能系統(tǒng)的效能。