亲子乱aⅴ一区二区三区下载-人妻无码αv中文字幕久久琪琪布-亚洲熟女少妇一区二区-亚洲av日韩精品久久久久久a

亮相即驚艷,SuperCLUE測(cè)試中訊飛星火排名國(guó)內(nèi)第一!

前有ChatGPT,后有百度文心、阿里千問(wèn)、京東靈犀,一時(shí)間“AI大模型”一詞迅速成為了網(wǎng)絡(luò)流行語(yǔ)。并且在短短幾個(gè)月時(shí)間內(nèi),國(guó)內(nèi)有超過(guò)30家科技公司入局,徹底拉開(kāi)了國(guó)內(nèi)人工智能戰(zhàn)場(chǎng)的序幕。5月6日,訊飛星火認(rèn)知大模型成果發(fā)布會(huì)在安徽合肥舉行,現(xiàn)場(chǎng)實(shí)測(cè)大模型七大核心能力,并發(fā)布了汽車(chē)、教育、辦公、數(shù)字員工四大行業(yè)應(yīng)用成果。

同時(shí),訊飛星火認(rèn)知大模型在應(yīng)用場(chǎng)景落地方面也有很大突破,比如1+N模式,其中“1”是通用的人工智能底座,“N”是在教育、醫(yī)療、辦公、人機(jī)交互、車(chē)載等領(lǐng)域的行業(yè)縱深應(yīng)用,可見(jiàn)訊飛的星火認(rèn)知大模型準(zhǔn)備工作是非常充分的。

那備受矚目的訊飛星火認(rèn)知大模型在目前已知的AI大模型相比,實(shí)力究竟如何呢?人工智能大模型有沒(méi)有官方統(tǒng)一的評(píng)測(cè)標(biāo)準(zhǔn)?就在5月9日,中文通用大模型綜合性評(píng)測(cè)基準(zhǔn) SuperCLUE 正式發(fā)布。它主要解決的問(wèn)題是在當(dāng)前通用大模型大力發(fā)展的情況下,中文大模型的效果情況,包括但不限于這些模型不同任務(wù)的效果情況、和國(guó)際上代表性模型的比較情況以及和人類(lèi)對(duì)比的效果。一系列國(guó)內(nèi)外代表性模型在該基準(zhǔn)下的多個(gè)維度接受能力測(cè)試,進(jìn)而得出SuperCLUE評(píng)測(cè)榜單。

該基準(zhǔn)測(cè)試主要關(guān)注以下問(wèn)題:中文大模型在不同任務(wù)上的表現(xiàn)如何?與國(guó)際代表性模型相比,中文大模型的表現(xiàn)達(dá)到了何種程度?中文大模型與人類(lèi)表現(xiàn)相比如何?該模型可通過(guò)多個(gè)層面,考驗(yàn)市面上主流的中文GPT大模型的能力。其中,基礎(chǔ)能力包括了常見(jiàn)的有代表性的模型能力,如語(yǔ)義理解、對(duì)話、邏輯推理、角色模擬、代碼、生成與創(chuàng)作等10項(xiàng)能力。專(zhuān)業(yè)能力包括了中學(xué)、大學(xué)與專(zhuān)業(yè)考試,涵蓋了從數(shù)學(xué)、物理、地理到社會(huì)科學(xué)等50多項(xiàng)能力。中文特性能力,針對(duì)有中文特點(diǎn)的任務(wù),包括了中文成語(yǔ)、詩(shī)歌、文學(xué)、字形等10項(xiàng)多種能力。

除了多維度考察,SuperCLUE評(píng)測(cè)榜單還擁有自動(dòng)化評(píng)測(cè)、廣泛代表性和采取人類(lèi)基準(zhǔn)等特點(diǎn),較為客觀、全面展現(xiàn)當(dāng)下的通用大模型的能力。

該機(jī)構(gòu)利用 SuperCLUE 測(cè)試基準(zhǔn),對(duì)市面上主流的支持中文的通用大模型進(jìn)行了評(píng)測(cè)與排名。從排名中我們可以看出,GPT-4 一騎絕塵,已經(jīng)非常接近人類(lèi)的能力。國(guó)產(chǎn)大模型中訊飛科技研發(fā)的星火認(rèn)知大模型總排名第三,國(guó)內(nèi)排名第一。

多年來(lái),科大訊飛已在認(rèn)知智能領(lǐng)域有了豐富的儲(chǔ)備和積累,此次成果發(fā)布,科大訊飛開(kāi)放合作,與廣大合作伙伴共建人工智能“星火”生態(tài),為更多行業(yè)賦能,推動(dòng)發(fā)展。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。

關(guān)鍵詞: