日本人妻久久中文字幕精品,黄色内裤逼里插着的好看,手机在线观看一级午夜片,日韩免费久久人妻一区网站

網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
AI又對奧數(shù)下手,刷題刷出“模考”最好成績
時(shí)間:2022-02-04 15:20:07

AI 在最不擅長的數(shù)學(xué)方面,這次大幅刷新了最好成績。

其中關(guān)鍵角色是 OpenAI 給 Lean 做的一個(gè)定理證明器。

聽起來有點(diǎn)耳熟?沒錯(cuò),就是去年參加國際數(shù)學(xué)奧林匹克競賽(IMO)的“非人”選手 Lean~

自從 2013 年微軟研究院推出 Lean 以來,就一直嘗試讓 AI 在數(shù)學(xué)命題證明這方面取得進(jìn)展。

而這次也確實(shí)得到了回報(bào),OpenAI 新做的這個(gè)定理證明器讓它學(xué)會了解決一部分有難度的高中奧數(shù)題,包括美國的數(shù)學(xué)競賽 AMC12、AIME 甚至是國際奧數(shù)競賽中的題。

它首先會用語言模型將數(shù)學(xué)問題轉(zhuǎn)化為另一種形式,列出隱藏的條件和已知信息,然后來推理求證。

雖然在剛開始效果并不明顯,只能證明幾個(gè)命題。但是在不斷地搜索新的證明,經(jīng)過八次迭代之后,在 miniF2F 測試中,成功地把分?jǐn)?shù)從 29.3% 刷到了 41.2%。

我們來看看這 AI 是怎么在奧數(shù)題上施展拳腳的。

AI如何做奧數(shù)題

先來看一個(gè)簡單的問題熱熱身:

對于所有大于等于 9 的整數(shù) n,證明下圖中的式子是一個(gè)完全平方數(shù)。

按照普通人的思考方式,可以先把式中分子提出一個(gè) n 的階乘,與分母約去。

然后分子化簡為(n+1)2。這在形式上就是一個(gè)完全平方數(shù),問題得證。

那AI是怎么做的呢?

它首先從文本中提取了條件和已知信息,例如 n 是整數(shù)、n 大于等于 9。

接下來,它把需要證明的問題換了一種說法,改為:

存在一個(gè)整數(shù) x,使 x2和原式相等。

然后在解題的過程中,完全由模型直接生成了一個(gè)數(shù)學(xué)項(xiàng)“n+1”作為一個(gè)解:use n+1。接下來再去驗(yàn)證這個(gè)解是否成立。

如果沒有語言模型,這是不可能做到的。

這么看來這模型能耐了,還有了一些數(shù)學(xué)想法,再拿一道國際奧賽的改編題來考考它:

設(shè) a、b、c 是一個(gè)三角形的三條邊,證明 a2(b+c-a)+b2(c+a-b)+c2(a+b-c)≤3abc。

同樣地,AI 還是先把條件都列出來。不過這次還列出了與三角形有關(guān)的隱藏條件:

a、b、c 都是大于 0 的實(shí)數(shù),并且有任意兩邊之和大于第三邊。

然后模型還自創(chuàng)了一個(gè)方法,列出了(b-a)、(c-b)、(c-a),看起來好像不明所以。

但是如果把目標(biāo)式子展開,你就會發(fā)現(xiàn)這三項(xiàng)正是舒爾不等式的幾個(gè)對稱項(xiàng):

根據(jù)舒爾不等式,對所有非負(fù)實(shí)數(shù) x、y、z 和正數(shù) t,都有:

當(dāng) t=1 時(shí),這和奧數(shù)題中的形式完全一樣,命題得證。

這么看來,AI 這水平著實(shí)不簡單啊,要構(gòu)造出這種效果可絕非易事。

對奧數(shù)下手的難點(diǎn)

讓 AI 來做奧數(shù),確實(shí)比學(xué)生自己磕高數(shù)題難多了。

這第一個(gè)難點(diǎn)就是,模型不是從有限的選項(xiàng)中做選擇。要是像下圍棋那樣,格點(diǎn)就那么多,選擇空間有限,還好說一點(diǎn)。

但是做奧數(shù),模型要從一組復(fù)雜的無限策略中做選擇,期間還要生成一些數(shù)學(xué)中的術(shù)語,例如“存在”、“任意”等。

針對這個(gè)難點(diǎn),OpenAI 通過在搜索證明方法時(shí)從語言模型中采樣來解決。

而第二點(diǎn)就是模型缺乏自我對抗和博弈。做奧數(shù)題和雙人游戲不同,它不是和另一個(gè)玩家比賽,而是要證明一個(gè)數(shù)學(xué)命題。

這樣一來在雙人游戲上成功的算法就不能遷移過來。

為了解決這個(gè)問題,研究人員提供了一套不同難度“教輔資料”,用來輔助描述問題而不需要證明。

當(dāng)這些輔助的描述難度越來越大時(shí),模型就能解決越來越難的問題。

不過這兩個(gè)難點(diǎn),反倒可以成為它的優(yōu)勢。

一方面,因?yàn)檫@類數(shù)學(xué)命題的證明就是需要推理,需要無限的創(chuàng)造力和洞察力。

另一方面,這種輔助描述式的方法也有助于 AI 自動(dòng)推理的發(fā)展。

說不好,將來深度學(xué)習(xí)模型還能征服奧數(shù)這座高山。

關(guān)鍵詞: 數(shù)學(xué) 模型 ai 奧數(shù) 奧數(shù)題 命題 難點(diǎn) 整數(shù) 式子 定理

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 hngelin.com All Rights Reserved.
 

中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息

南宁市| 桂平市| 淮安市| 河源市| 太和县| 巨野县| 方正县| 平果县| 金塔县| 建宁县| 新疆| 孝义市| 潢川县| 淮阳县| 元谋县| 环江| 青阳县| 剑河县| 两当县| 宜兰市| 彰化市| 稻城县| 丰顺县| 县级市| 巴中市| 七台河市| 五大连池市| 扶余县| 任丘市| 开江县| 建平县| 柳河县| 益阳市| 高邮市| 花莲市| 青浦区| 萍乡市| 黎川县| 进贤县| 昌乐县| 鞍山市|