(資料圖)
今年以來,伴隨著ChatGPT的持續(xù)火爆,大模型也進入高速發(fā)展期,國內(nèi)外多家知名科技企業(yè)相繼推出自主研發(fā)的大模型產(chǎn)品。那么大模型的技術(shù)原理是什么呢?
5月18日,受邀參加2023中國家用電器技術(shù)大會(CHEATC2023)的中國科學技術(shù)大學機器人實驗室主任陳小平教授分享了他的研究和觀點,他同時還擔任中國人工智能學會人工智能倫理與治理委員會主委,在本次大會上陳小平教授發(fā)表了“人工智能的新發(fā)展:從大模型到柔性機器人”主題演講,介紹了人工智能大模型的技術(shù)原理,以及人工智能在應用層面的新技術(shù)趨勢。
中國科學技術(shù)大學教授陳小平
“大模型的根本原理就是在做預測”陳小平介紹道,人工智能發(fā)展到現(xiàn)在已經(jīng)開啟了第四次浪潮的進程,數(shù)據(jù)模型也由大數(shù)據(jù)驅(qū)動轉(zhuǎn)向大訓練驅(qū)動。和之前三次浪潮不同的是,新階段的人工智能對訓練數(shù)據(jù)的質(zhì)、量和獲取方式都有了全新的要求,最終形成能夠應用于大規(guī)模真實場景的實例模型。他強調(diào):“大模型并不是簡單的一兩種技術(shù),而是集成大量技術(shù)的智能系統(tǒng)。”
大模型的興起來源于生成式人工智能,當前,生成式人工智能已經(jīng)并不僅是簡單的進行語言和圖像等內(nèi)容的生成,而是基于對人的自然語言的精準處理來完成智能化人機交互。陳小平表示:“目前階段,我們對于機器的語言處理預期是會說人話、能聽懂人話、能回答問題,即使回答不一定正確。其中,基本的要求是說話要符合人的語言習慣。”由于人的語言習慣沒有科學標準但是有經(jīng)驗標準,那么機器如何掌握和利用人的語言習慣呢?陳小平表示:“大模型的基本研究思路和成功秘訣是:從人類大規(guī)模的語料中提取語言痕跡,并用于人機自然語言的交互之中。”
大模型通過從人類原始語料中提取包括字、詞、標點符號等語元,再根據(jù)前后語元的關(guān)聯(lián)性進行語元回看,最終實現(xiàn)行為的預測。原則上,回看的語元數(shù)量越多,預測的準確性就更高。“目前大模型回看的語元至少有4000個,有的甚至可以達到10萬個。”陳小平講到。大模型技術(shù)體系以預訓練模型為基礎(chǔ)大模型,再通過專門訓練的專用模型配合用戶引導模型來精準理解和回答用戶的問題。三大模型相互配合,人工智能回答的質(zhì)量可以實現(xiàn)大幅度提升。
大模型的出現(xiàn)確實給人工智能帶來了新的革新方向,但它并不能運用于現(xiàn)實場景的各個方面。陳小平認為,目前,中國人工智能亟需攻克的三大方面是智能制造、智慧農(nóng)業(yè)和普惠養(yǎng)老。“攻克這三大戰(zhàn)役,我們?nèi)虻母窬謱l(fā)生徹底的改變。”另一方面,大模型帶來巨大變化的同時也帶來了新的挑戰(zhàn)。比如,大模型在基于對人的功能進行模仿時,容易被認為是帶有了情感和意識。“這是因為人習慣性的將自己理解的含義投射到大模型上,認為大模型說話也帶有含義,但實際上是沒有的。”陳小平表示,大模型的應用還可能會產(chǎn)生公共安全、就業(yè)和長期影響。
除大模型外,陳小平教授還在“物理世界中的人工智能”方面帶來了新的科研成果。目前,我們投入應用的人工智能物理形態(tài)主要是剛性機器人,這種機器人的重復精度高,但靈巧性和安全性較低,適用于結(jié)構(gòu)化的環(huán)境中,而在非結(jié)構(gòu)化的環(huán)境中需要進行精準測量、建模和計算,技術(shù)要求較高,目前還不適用于大多數(shù)的行業(yè)。針對剛性機器人的這些缺點,陳小平提出了融差性原理,在智能機器人的操作對象的精準測量不可行、工作環(huán)境和操作對象的精準建模不可行、精準決策不可行這三個基本假設(shè)之下,研發(fā)了氣動蜂巢網(wǎng)絡(luò)軟體手臂。這種手臂在靈活度和負載能力方面均有良好的表現(xiàn),并且在有外力干擾和物體進行不規(guī)則運動時,均能實現(xiàn)精準化控制??梢灶A見,這種技術(shù)在家庭服務(wù)、情感交互、無人駕駛等領(lǐng)域有廣闊的應用前景。另一方面,陳小平團隊還將柔性手臂和剛性機器進行了結(jié)合,帶來了“剛?cè)岷弦皇肿?rdquo;的實驗結(jié)果,在不改程序和硬件參數(shù)、不使用力反饋傳感器的情況下,實現(xiàn)對多形態(tài)物品的精準抓握。
關(guān)鍵詞: