自從OpenAI發(fā)布GPT-3之后,大模型成為幾乎所有全球頭部人工智能(AI)公司的逐鹿目標(biāo)。
鈦媒體App 4月19日消息,百度集團(tuán)副總裁吳甜近日接受鈦媒體App等采訪時(shí)表示,百度產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”,目前已經(jīng)大規(guī)模應(yīng)用于百度內(nèi)部的各類產(chǎn)品,包含搜索、信息流、小度智能屏、百度地圖等。而“文心大模型”的個(gè)人、企業(yè)開發(fā)者數(shù)量已超過6萬(wàn)人。
吳甜強(qiáng)調(diào),“今年是文心大模型產(chǎn)業(yè)落地關(guān)鍵年”。
據(jù)悉,“大模型”是目前世界AI研究領(lǐng)域最熱門的話題之一。AI 技術(shù)發(fā)展到今天,GPT和BERT等參數(shù)量巨大的模型被人們開發(fā)出來(lái),他們?cè)谟?jì)算機(jī)視覺和自然語(yǔ)言處理等領(lǐng)域取得了前所未有的成就。
隨著數(shù)據(jù)井噴、算法進(jìn)步和算力突破,泛化能力和通用性強(qiáng)的預(yù)訓(xùn)練大模型,正在成為 AI 技術(shù)發(fā)展的關(guān)鍵方向,并成為 AI 產(chǎn)業(yè)應(yīng)用的重要推動(dòng)力,有望讓 AI 技術(shù)與各行各業(yè)的差異化場(chǎng)景深度融合,讓大部分企業(yè)的標(biāo)注數(shù)據(jù)更少、開發(fā)效率更高、應(yīng)用成本更低,從而大幅降低 AI 的應(yīng)用門檻。
2019年3月,百度發(fā)布中國(guó)首個(gè)正式開放的預(yù)訓(xùn)練模型ERNIE1.0;2021年12月,ERNIE 3.0升級(jí)為知識(shí)增強(qiáng)千億大模型“鵬城-百度·文心”,模型參數(shù)規(guī)模達(dá)到2600億,是目前全球最大中文單體模型。
同時(shí),2021年12月發(fā)布全新的文心大模型全景圖,文心大模型家族包含NLP(自然語(yǔ)言理解)大模型、CV(計(jì)算機(jī)視覺)大模型、跨模態(tài)大模型,以及工具與平臺(tái)。
在吳甜看來(lái),“文心大模型”作為產(chǎn)業(yè)級(jí)大模型,核心價(jià)值在于驅(qū)動(dòng) AI 技術(shù)的規(guī)模化應(yīng)用。
因此,為了進(jìn)一步降低應(yīng)用難度,百度還為“文心大模型”開發(fā)易上手、輕量化的部署工具平臺(tái),包括提供各類開發(fā)套件,零門檻AI 開發(fā)平臺(tái)EasyDL 、全功能AI 開發(fā)平臺(tái)BML等,讓不同群體都能低門檻實(shí)現(xiàn)AI技術(shù)應(yīng)用。
吳甜表示,通過百度AI開放平臺(tái),現(xiàn)在已經(jīng)有近1400項(xiàng)能力是開放給企業(yè)開發(fā)者使用的。
吳甜對(duì)鈦媒體App表示,基于百度飛槳平臺(tái)與百舸集群,“文心大模型”在算法、框架、算力層面實(shí)現(xiàn)了自主創(chuàng)新。通過大模型與國(guó)產(chǎn)深度學(xué)習(xí)框架融合發(fā)展。支撐“文心大模型”訓(xùn)練的是百度飛槳平臺(tái)自主研發(fā)的端到端、自適應(yīng)、分布式訓(xùn)練框架與4D混合并行技術(shù)。百度已經(jīng)構(gòu)建出自主創(chuàng)新的AI基底,能驅(qū)動(dòng) AI 規(guī)?;瘧?yīng)用。
目前,“文心大模型”已通過飛槳平臺(tái)、百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)落地應(yīng)用。其中在智能制造場(chǎng)景中,大模型可應(yīng)用于質(zhì)檢、巡檢這一類型以計(jì)算機(jī)視覺場(chǎng)景,以及數(shù)據(jù)設(shè)備的運(yùn)維等自然語(yǔ)言處理場(chǎng)景當(dāng)中。
具體案例方面,百度與中國(guó)人壽合作,針對(duì)保險(xiǎn)合同中條款文本進(jìn)行關(guān)鍵字段的提取?;谖男拇竽P?,實(shí)現(xiàn)了保險(xiǎn)合同條款的智能解析,自動(dòng)提取近40個(gè)維度的關(guān)鍵字段,業(yè)務(wù)處理效率大幅提升。
“基于企業(yè)自己積累的標(biāo)注信息,然后用‘文心大模型’與此前數(shù)據(jù)一起進(jìn)行二次訓(xùn)練,會(huì)幫助客戶做一些數(shù)據(jù)增強(qiáng)工作。再通過多次客戶反饋構(gòu)造數(shù)據(jù),進(jìn)行模型迭代,就達(dá)到實(shí)用狀態(tài)了?!眳翘饘?duì)鈦媒體App表示,真正使用時(shí),把大模型的能力嵌到私有云當(dāng)中,在保險(xiǎn)人員的工作流中嵌入一個(gè)功能,告訴他一些分析后的建議,然后基本上可以快速上手使用“文心大模型”能力了。
交付形態(tài)上,“文心大模型”主要有三種交付模式:通過調(diào)用API供開發(fā)者使用,百度EasyDL、BML全功能AI開發(fā)平臺(tái)(Baidu Machine Learning)等平臺(tái)上的嵌套工具,以及包含在一些面向場(chǎng)景的產(chǎn)品中交付,例如智能文檔分析TextMind,智能創(chuàng)作平臺(tái)等。
收益來(lái)源方面,作為一項(xiàng)基礎(chǔ)性質(zhì)的工作,“文心大模型”的收入來(lái)源,一方面百度自身的業(yè)務(wù)需求,另一方面是通過行業(yè)客戶的垂直場(chǎng)景結(jié)合,進(jìn)入百度智能云的營(yíng)收當(dāng)中。
不過,吳甜告訴鈦媒體App,“文心大模型”在前期訓(xùn)練的時(shí)候十分消耗算力,在百度搜索場(chǎng)景中,利用昆侖芯在進(jìn)行文心ERNIE的推理計(jì)算,每一天都是過億的流量在進(jìn)行計(jì)算。而但并不是所有企業(yè)都擁有這么大規(guī)模的算力平臺(tái),到企業(yè)場(chǎng)景真正使用大模型,很多只要進(jìn)行二次訓(xùn)練就可以了,二次訓(xùn)練并不會(huì)像訓(xùn)練千億基礎(chǔ)模型那么大的消耗。
對(duì)于大模型重復(fù)建設(shè)以及良性競(jìng)爭(zhēng)問題,吳甜表示,每一家企業(yè)和機(jī)構(gòu)最后會(huì)產(chǎn)生的價(jià)值和作用,其實(shí)是各自側(cè)重的?,F(xiàn)在還是有很大的創(chuàng)新空間。
(作者|林志佳)
關(guān)鍵詞: 文心大模型
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
西充县| 金寨县| 天津市| 罗定市| 运城市| 陆河县| 万盛区| 陈巴尔虎旗| 阳泉市| 时尚| 资兴市| 漳平市| 耿马| 吴川市| 周至县| 石泉县| 河西区| 都江堰市| 马关县| 赞皇县| 图们市| 讷河市| 拜城县| 赫章县| 双柏县| 安乡县| 醴陵市| 定兴县| 遵义市| 泰安市| 秀山| 隆回县| 建宁县| 甘孜| 汾西县| 潜山县| 东安县| 上栗县| 芮城县| 闽清县| 固始县|