瀏覽數(shù)量: 478 作者: 本站編輯 發(fā)布時(shí)間: 2023-06-09 來源: 本站
紅紅火火,恍恍惚惚,大模型從GPT開始爆發(fā)到現(xiàn)在,越來越多人加入這場科技界的“諸神之戰(zhàn)”。不可否認(rèn),大模型確實(shí)為我們展示出了人工智能的強(qiáng)大之處。但在當(dāng)下的狂熱氣氛中,大家仿佛都變成了“追星”的狂熱粉絲。
但技術(shù)終究要落地到垂直細(xì)分產(chǎn)業(yè)中,才能發(fā)揮其應(yīng)有價(jià)值,這是一個(gè)積淀、積累的過程,之后才能走向真正的成熟。從大模型在金融垂直細(xì)分領(lǐng)域的落地來看,馬上消費(fèi)正加速馴服大模型這匹“野馬”,為其套上“籠頭”,增加“馬鞍”、“馬鐙”。
馴服金融大模型“野馬”
大模型本質(zhì)上是一種更高壓縮比的知識庫,這在當(dāng)下已經(jīng)成為共識。大模型不僅能存儲(chǔ)和運(yùn)用隱含于訓(xùn)練數(shù)據(jù)中的知識,還能新生成有邏輯的組合知識。具體來看,大模型之所以能表現(xiàn)出如此強(qiáng)悍的能力,主要經(jīng)歷了“原材料篩選”、“原材料配方”、“粗加工技術(shù)”“精加工技術(shù)”等四個(gè)步驟。大模型在對海量的網(wǎng)頁文本數(shù)據(jù)進(jìn)行質(zhì)量判斷和選取后,用于初步訓(xùn)練,然后將大量的知識編碼,再精調(diào)模型,選取問題供人工標(biāo)注。
對比搜索引擎,大模型可以更高效幫助我們提取有用的知識和信息,用“問題(prompt)”代替“傳統(tǒng)query”從大模型中查詢和提取知識。對于新知識的獲取從“主動(dòng)搜索”到“直接問專家”,就像從買菜做菜變成了直接用預(yù)制菜,而且專屬機(jī)器秘書可以記住你已有的知識水平,在此基礎(chǔ)上像老師一樣把你現(xiàn)在不知道的必要知識點(diǎn)自動(dòng)加入進(jìn)來,逐步教會(huì)你新知識。
作為重慶唯一獲得國家級高新技術(shù)企業(yè)認(rèn)定的金融機(jī)構(gòu),馬上消費(fèi)連續(xù)2年入圍國家工信部“新一代人工智能產(chǎn)業(yè)創(chuàng)新揭榜單位”,也正研究如何沿著Human Feedback這條ChatGPT已經(jīng)驗(yàn)證好的路徑將金融領(lǐng)域知識注入大模型。
馬上消費(fèi)人工智能研究院院長陸全表示,“如果把通用大模型看作一匹資質(zhì)超群的‘野馬’,打造專注于金融垂直領(lǐng)域和細(xì)分場景的大模型應(yīng)用就相當(dāng)于對野馬的馴化。”
首先,需要用專有的經(jīng)過加工的垂直領(lǐng)域的數(shù)據(jù)作為“草料”來“喂養(yǎng)”它。當(dāng)前馬上消費(fèi)的整體數(shù)據(jù)量已經(jīng)超過40PB,服務(wù)器超過8000臺(tái),每日數(shù)據(jù)交換量超過950億,其中實(shí)時(shí)數(shù)據(jù)接入量350億,每日投放數(shù)據(jù)量超過190億,而風(fēng)控Hbase調(diào)用量超過40萬次/s,相關(guān)指標(biāo)均在消費(fèi)金融領(lǐng)域處于領(lǐng)先位置。其次,要在垂直領(lǐng)域?qū)δP瓦M(jìn)行精調(diào)對齊訓(xùn)練,相當(dāng)于為野馬套上“籠頭”,再用大模型的推理加速技術(shù)為它加上“馬鞍”、“馬鐙”,讓這匹駿馬跑得更快、更可控。
“由于100億以下參數(shù)的模型無法具備很多能力”,馬上消費(fèi)人工智能研究院李寬補(bǔ)充道,“為此我們必須克服GPU和經(jīng)驗(yàn)的不足,以獲得對這種大小模型的‘精調(diào)訓(xùn)練’和‘推理使用’的能力,并在自身數(shù)據(jù)上做模型精調(diào);其中包括:基于自身數(shù)據(jù),設(shè)計(jì)和訓(xùn)練“問答對”,以保證既要保留原有大語言模型的常識和通用推理能力,又要能在獨(dú)有的金融垂直細(xì)分?jǐn)?shù)據(jù)上產(chǎn)生類似的能力擴(kuò)展。”
最后,要有足夠的應(yīng)用場景來供這匹駿馬奔馳和迭代,使用的人越多,評估反饋越多,模型迭代越快,才會(huì)越來越好。而在這一方面,馬上消費(fèi)等大型消費(fèi)金融機(jī)構(gòu)具有先天優(yōu)勢,能夠產(chǎn)生很強(qiáng)實(shí)際使用效果。
陸全院長還表示,相比來說,擺在中小型金融機(jī)構(gòu)面前的首道難關(guān)就是資源門檻,在強(qiáng)大動(dòng)力需求的作用下,它們會(huì)向金融行業(yè)內(nèi)大型機(jī)構(gòu)或具備技術(shù)優(yōu)勢的金融科技平臺(tái)需求協(xié)助,建立起相關(guān)的科技能力。
據(jù)最新數(shù)據(jù)顯示,馬上消費(fèi)的注冊用戶已突破1.5億,累計(jì)發(fā)放消費(fèi)貸款超過4000億元,合作金融機(jī)構(gòu)超200個(gè),合作商戶超100萬,形式了全渠道全場景開放生態(tài)。布萊恩·阿瑟在《技術(shù)的本質(zhì)》一書中曾提到,技術(shù)從本質(zhì)上來說是自創(chuàng)生的,所有新技術(shù)都不是無中生有被發(fā)明出來的,新技術(shù)都是從現(xiàn)存技術(shù)中組合出的一組新的要素。在馬上消費(fèi)副總經(jīng)理兼首席信息官蔣寧看來,ChatGPT巧妙地疊加了Transformer、有監(jiān)督微調(diào)訓(xùn)練、強(qiáng)化學(xué)習(xí)等技術(shù),成功展現(xiàn)了由于模型規(guī)模帶來的突現(xiàn)能力,經(jīng)過近幾年不斷迭代部署,量變的積累產(chǎn)生質(zhì)變,形成了ChatGPT的語言智能。
大模型的“金融產(chǎn)業(yè)之戰(zhàn)”
需要注意的是,大模型對我們來說是做好賦能。陸全院長認(rèn)為,大模型對我們社會(huì)生活的最終影響是“秘書平民化”。
比如,大模型可以幫助我們進(jìn)行各種寫作工作,講稿,郵件,論文,代碼等都可以先由AIGC生成供你修改的草稿;還可以進(jìn)行歸納性文字類工作,機(jī)器秘書可以按要求瀏覽大量指定文章,從中生成摘要;對于新知識的獲取從“主動(dòng)搜索”到“直接問專家”,而且專屬機(jī)器秘書可以記住你已有的知識水平,逐步教會(huì)你新知識;專屬機(jī)器秘書會(huì)記住和更了解你的各種偏好,幫你做個(gè)性化復(fù)雜的決策建議等等。
當(dāng)然,大模型可能會(huì)淘汰掉一些物種,但也會(huì)讓一些原有物種獲得新能力,比如智能客服。在這方面,馬上消費(fèi)對待大模型有著更為清醒的認(rèn)知,高效的智能客服可以替換人工坐席。
陸全院長還表示,在智能交互方面,通過配備機(jī)器人客服將金融知識及產(chǎn)品相關(guān)信息一條條添加到知識庫里,盡管“喂養(yǎng)”了很多數(shù)據(jù),也避免不了機(jī)器人回答的機(jī)械化和準(zhǔn)確性欠佳,因?yàn)樗淖R別能力是有限的,更多充當(dāng)協(xié)助人工客服的角色。而大模型本身具備大量通用知識,除了金融常識外,對于其他特殊內(nèi)容,可以通過知識注入的方式給到大模型,并且通過持續(xù)、充分的訓(xùn)練,能夠使大模型具備更加精準(zhǔn)的語義理解能力和強(qiáng)大自然語言生成能力。自然而然,大模型可以成為懂金融的“專家”。
不久前,全國首個(gè)數(shù)字警察“警小靈”,在重慶防范經(jīng)濟(jì)犯罪宣傳啟動(dòng)儀式現(xiàn)場亮相。“警小靈”就是由馬上消費(fèi)提供的技術(shù)支持,可以實(shí)現(xiàn)24小時(shí)不間斷為群眾提供專業(yè)、精準(zhǔn)、高效的咨詢服務(wù)。需要注意的是,隨著大模型的能力越來越強(qiáng)大,大模型標(biāo)準(zhǔn)的制定也越來越急迫,因?yàn)榇竽P偷目煽匦匀匀惠^差。
為此,馬上消費(fèi)積極推動(dòng)人工智能生成內(nèi)容(AIGC)標(biāo)準(zhǔn)的制定,從規(guī)范約束和風(fēng)險(xiǎn)監(jiān)控兩個(gè)方面來保證機(jī)器智能生成內(nèi)容的可信合規(guī)。截至目前,依托科技研發(fā)創(chuàng)新,馬上消費(fèi)已參與超30項(xiàng)金融科技標(biāo)準(zhǔn)編制工作,涉及研發(fā)運(yùn)營一體化能力成熟度、開發(fā)平臺(tái)通用能力要求等,獲得28項(xiàng)人工智能與交易安全領(lǐng)域備案認(rèn)證,在標(biāo)準(zhǔn)及認(rèn)證方面表現(xiàn)優(yōu)秀。在當(dāng)下這個(gè)充斥著技術(shù)誘惑的時(shí)代,我們更需要在技術(shù)工具面前保持足夠的清醒。正確認(rèn)識科技價(jià)值,才能實(shí)現(xiàn)“科技讓生活更美好”的目的。
江蘇省常州市鐘樓區(qū)懷德中路350號博濟(jì)文創(chuàng)園2#
版權(quán)所有 江蘇領(lǐng)藝網(wǎng)絡(luò)科技有限公司
備案號:蘇ICP備2021024929號