自從OpenAI發(fā)布GPT-3之后,大模型成為幾乎所有全球頭部人工智能(AI)公司的逐鹿目標。
鈦媒體App 4月19日消息,百度集團副總裁吳甜近日接受鈦媒體App等采訪時表示,百度產(chǎn)業(yè)級知識增強大模型“文心”,目前已經(jīng)大規(guī)模應用于百度內(nèi)部的各類產(chǎn)品,包含搜索、信息流、小度智能屏、百度地圖等。而“文心大模型”的個人、企業(yè)開發(fā)者數(shù)量已超過6萬人。
吳甜強調(diào),“今年是文心大模型產(chǎn)業(yè)落地關鍵年”。
據(jù)悉,“大模型”是目前世界AI研究領域最熱門的話題之一。AI 技術發(fā)展到今天,GPT和BERT等參數(shù)量巨大的模型被人們開發(fā)出來,他們在計算機視覺和自然語言處理等領域取得了前所未有的成就。
隨著數(shù)據(jù)井噴、算法進步和算力突破,泛化能力和通用性強的預訓練大模型,正在成為 AI 技術發(fā)展的關鍵方向,并成為 AI 產(chǎn)業(yè)應用的重要推動力,有望讓 AI 技術與各行各業(yè)的差異化場景深度融合,讓大部分企業(yè)的標注數(shù)據(jù)更少、開發(fā)效率更高、應用成本更低,從而大幅降低 AI 的應用門檻。
2019年3月,百度發(fā)布中國首個正式開放的預訓練模型ERNIE1.0;2021年12月,ERNIE 3.0升級為知識增強千億大模型“鵬城-百度·文心”,模型參數(shù)規(guī)模達到2600億,是目前全球最大中文單體模型。
同時,2021年12月發(fā)布全新的文心大模型全景圖,文心大模型家族包含NLP(自然語言理解)大模型、CV(計算機視覺)大模型、跨模態(tài)大模型,以及工具與平臺。
在吳甜看來,“文心大模型”作為產(chǎn)業(yè)級大模型,核心價值在于驅(qū)動 AI 技術的規(guī)?;瘧?。
因此,為了進一步降低應用難度,百度還為“文心大模型”開發(fā)易上手、輕量化的部署工具平臺,包括提供各類開發(fā)套件,零門檻AI 開發(fā)平臺EasyDL 、全功能AI 開發(fā)平臺BML等,讓不同群體都能低門檻實現(xiàn)AI技術應用。
吳甜表示,通過百度AI開放平臺,現(xiàn)在已經(jīng)有近1400項能力是開放給企業(yè)開發(fā)者使用的。
吳甜對鈦媒體App表示,基于百度飛槳平臺與百舸集群,“文心大模型”在算法、框架、算力層面實現(xiàn)了自主創(chuàng)新。通過大模型與國產(chǎn)深度學習框架融合發(fā)展。支撐“文心大模型”訓練的是百度飛槳平臺自主研發(fā)的端到端、自適應、分布式訓練框架與4D混合并行技術。百度已經(jīng)構(gòu)建出自主創(chuàng)新的AI基底,能驅(qū)動 AI 規(guī)?;瘧?。
目前,“文心大模型”已通過飛槳平臺、百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)落地應用。其中在智能制造場景中,大模型可應用于質(zhì)檢、巡檢這一類型以計算機視覺場景,以及數(shù)據(jù)設備的運維等自然語言處理場景當中。
具體案例方面,百度與中國人壽合作,針對保險合同中條款文本進行關鍵字段的提取。基于文心大模型,實現(xiàn)了保險合同條款的智能解析,自動提取近40個維度的關鍵字段,業(yè)務處理效率大幅提升。
“基于企業(yè)自己積累的標注信息,然后用‘文心大模型’與此前數(shù)據(jù)一起進行二次訓練,會幫助客戶做一些數(shù)據(jù)增強工作。再通過多次客戶反饋構(gòu)造數(shù)據(jù),進行模型迭代,就達到實用狀態(tài)了?!眳翘饘︹伱襟wApp表示,真正使用時,把大模型的能力嵌到私有云當中,在保險人員的工作流中嵌入一個功能,告訴他一些分析后的建議,然后基本上可以快速上手使用“文心大模型”能力了。
交付形態(tài)上,“文心大模型”主要有三種交付模式:通過調(diào)用API供開發(fā)者使用,百度EasyDL、BML全功能AI開發(fā)平臺(Baidu Machine Learning)等平臺上的嵌套工具,以及包含在一些面向場景的產(chǎn)品中交付,例如智能文檔分析TextMind,智能創(chuàng)作平臺等。
收益來源方面,作為一項基礎性質(zhì)的工作,“文心大模型”的收入來源,一方面百度自身的業(yè)務需求,另一方面是通過行業(yè)客戶的垂直場景結(jié)合,進入百度智能云的營收當中。
不過,吳甜告訴鈦媒體App,“文心大模型”在前期訓練的時候十分消耗算力,在百度搜索場景中,利用昆侖芯在進行文心ERNIE的推理計算,每一天都是過億的流量在進行計算。而但并不是所有企業(yè)都擁有這么大規(guī)模的算力平臺,到企業(yè)場景真正使用大模型,很多只要進行二次訓練就可以了,二次訓練并不會像訓練千億基礎模型那么大的消耗。
對于大模型重復建設以及良性競爭問題,吳甜表示,每一家企業(yè)和機構(gòu)最后會產(chǎn)生的價值和作用,其實是各自側(cè)重的?,F(xiàn)在還是有很大的創(chuàng)新空間。
(作者|林志佳)
關鍵詞: 文心大模型
網(wǎng)站首頁 |網(wǎng)站簡介 | 關于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
红桥区| 南宁市| 新丰县| 剑河县| 安阳市| 柞水县| 镇远县| 齐齐哈尔市| 福安市| 琼中| 醴陵市| 剑川县| 东光县| 海林市| 汝南县| 吉隆县| 丹凤县| 清涧县| 宝鸡市| 剑河县| 贵德县| 临泽县| 张北县| 石林| 乐业县| 金溪县| 交口县| 吐鲁番市| 安多县| 新干县| 特克斯县| 宁海县| 黑龙江省| 信丰县| 玉溪市| 海淀区| 新化县| 武宣县| 抚州市| 鹤峰县| 丽江市|