科大訊飛聯(lián)手華為,人形機(jī)器人市場(chǎng)將迎來(lái)重大突破
2023年,硬科技領(lǐng)域特別是人形機(jī)器人領(lǐng)域受到廣泛關(guān)注和投資。在政策和基金的推動(dòng)下,人形機(jī)器人因其大模型和具身智能的特性,吸引了眾多人工智能領(lǐng)域的投資者。隨著市場(chǎng)的熱度上升,更多的團(tuán)隊(duì)開始投入這一領(lǐng)域。其中,科大訊飛作為國(guó)內(nèi)人工智能領(lǐng)域的領(lǐng)軍團(tuán)隊(duì),今年的表現(xiàn)尤為突出,不僅發(fā)布了訊飛星火認(rèn)知大模型,還在積極推動(dòng)其在制造、醫(yī)療、教育等領(lǐng)域的應(yīng)用。
作為本就投資了云跡、優(yōu)必選等機(jī)器人領(lǐng)域獨(dú)角獸企業(yè)的科大訊飛,自然也不會(huì)錯(cuò)過(guò)這次入局人形機(jī)器人領(lǐng)域的機(jī)會(huì)。就在10月24日的科大訊飛1024開發(fā)者節(jié)上,科大訊飛人形機(jī)器人正式對(duì)外亮相。
01入局人形機(jī)器人
2022年1月,在這一年的科大訊飛年會(huì)上,科大訊飛董事長(zhǎng)劉慶峰正式啟動(dòng)了“訊飛超腦2030計(jì)劃”,而這也正是科大訊飛進(jìn)軍機(jī)器人領(lǐng)域第一個(gè)長(zhǎng)線計(jì)劃。
在這份計(jì)劃中,科大訊飛董事長(zhǎng)劉慶峰將科大訊飛入局機(jī)器人領(lǐng)域的整體布局分為三步:
第一步,2022-2023年,針對(duì)醫(yī)療、教學(xué)、健康等領(lǐng)域的底層技術(shù),實(shí)現(xiàn)軟硬一體機(jī)器人和數(shù)字虛擬人的制造;
第二步,2023-2025年,實(shí)現(xiàn)自適應(yīng)行走的外骨骼機(jī)器人,讓外骨骼機(jī)器人進(jìn)入人類生活;
第三步,2025-2030年,實(shí)現(xiàn)懂知識(shí)、會(huì)學(xué)習(xí)、能進(jìn)化的陪伴機(jī)器人、自主學(xué)習(xí)的虛擬人,讓擁有機(jī)器人擁有交互、動(dòng)作,推動(dòng)機(jī)器人進(jìn)入家庭。
2023年作為“訊飛超腦2030計(jì)劃”的關(guān)鍵一年,科大訊飛董事長(zhǎng)劉慶峰在今年1024開發(fā)者節(jié)的開幕式上表示:
“科大訊飛在2022年1024開發(fā)者節(jié)上發(fā)布的AIBOT機(jī)器人超腦平臺(tái),如今已有工業(yè)、教育、服務(wù)、特種等領(lǐng)域372家企業(yè)的開發(fā)者在用我們這一平臺(tái)。”
與此同時(shí),科大訊飛董事長(zhǎng)劉慶峰還在現(xiàn)場(chǎng)官宣了科大訊飛人形機(jī)器人的發(fā)布。
他表示,“現(xiàn)在通過(guò)將認(rèn)知大模型與具身智能、運(yùn)動(dòng)智能結(jié)合起來(lái),將進(jìn)一步助力我國(guó)機(jī)器人進(jìn)入高階的智慧迭代?!?/p>
也是在這次大會(huì)上,我們現(xiàn)場(chǎng)看到了科大訊飛的人形機(jī)器人。
據(jù)科大訊飛官方介紹,基于“視覺-語(yǔ)言-動(dòng)作”多模態(tài)具身智能大模型,人形機(jī)器人將有如下表現(xiàn)提升:
復(fù)雜任務(wù)拆解準(zhǔn)確率提升了95%,開放場(chǎng)景物體尋找成功率提升了85%,強(qiáng)化學(xué)習(xí)泛化抓取成功率提升了30%,強(qiáng)化學(xué)習(xí)仿人行走能力提升了30%,運(yùn)動(dòng)能耗降低了20%。
02具身智能的潛力
2023年3月,在全球掀起ChatGPT、大模型熱潮后,OpenAI轉(zhuǎn)而投資了挪威一家人形機(jī)器人公司1X Technologies,這讓擁有本體的大模型的具身智能概念再次風(fēng)靡。
就具身智能的研究而言,我們看到斯坦福李飛飛教授團(tuán)隊(duì)在今年7月公開一項(xiàng)具身智能研究項(xiàng)目,項(xiàng)目中,接入大模型的機(jī)器人可以根據(jù)人類發(fā)出的語(yǔ)言指令,完成各種動(dòng)作。
谷歌旗下DeepMind團(tuán)隊(duì)隨后也發(fā)布了名為Robotics Transformer 2的視覺-語(yǔ)言-動(dòng)作模型。
巧合的是,早在2015年,科大訊飛就曾在國(guó)內(nèi)投資一家人形機(jī)器人公司,這家公司就是極有可能成為國(guó)內(nèi)人形機(jī)器人第一股的優(yōu)必選。
這讓科大訊飛在人形機(jī)器人上有了一個(gè)很好的標(biāo)定,而在這一切背后,其實(shí)都要基于人工智能的突破、大模型的出現(xiàn)。
科大訊飛是在今年5月6日發(fā)布的訊飛星火大模型,如今,經(jīng)過(guò)三次版本迭代后,科大訊飛董事長(zhǎng)劉慶峰表示,最新發(fā)布的訊飛星火V3.0已經(jīng)可以對(duì)標(biāo)ChatGPT,并做到了“中文超越,英文相當(dāng)”。
此次科大訊飛發(fā)布的訊飛星火V3.0在文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力在內(nèi)的七大能力上都得到了一定程度上的提升。
具體而言,在代碼能力上,訊飛星火V3.0在項(xiàng)目級(jí)的理解上得到了優(yōu)化,已經(jīng)能夠?qū)Υa進(jìn)行綜合的理解性的理解。
例如,它現(xiàn)在已經(jīng)可以理解你這樣的prompt:用python通過(guò)代碼來(lái)花一個(gè)大大的心形,然后里面大大小小的五顏六色的很多星星逐漸呈現(xiàn)出來(lái)。 在英文書寫能力上,現(xiàn)在的訊飛星火大模型已經(jīng)可以基于各種人設(shè)來(lái)輸出Native的寫作和對(duì)話。在多模態(tài)能力上,現(xiàn)在的訊飛星火大模型已經(jīng)能夠?qū)崿F(xiàn)指令理解和跟隨,以及細(xì)節(jié)表達(dá)上有了一定的提升,這樣的能力提升也是機(jī)器人能夠在復(fù)雜場(chǎng)景中很好地運(yùn)動(dòng)的關(guān)鍵。
根據(jù)國(guó)研經(jīng)濟(jì)研究院今年開展的一項(xiàng)關(guān)于大模型行業(yè)應(yīng)用能力測(cè)評(píng)的研究中,訊飛星火3.0在醫(yī)療、法律領(lǐng)域的中文知識(shí)和語(yǔ)言理解能力已經(jīng)分別超越了GPT4表現(xiàn)5.3%和4.1%,在教育領(lǐng)域基礎(chǔ)能力的表現(xiàn)與GPT4的表現(xiàn)差距小于1%。
這讓訊飛星火V3.0得以成為科大訊飛推出的各類機(jī)器人的“靈魂”所在。
03科大訊飛的硬科技
2023年是大模型異軍突起的一年,這一年,隨著各類大模型的不斷涌現(xiàn),算力變得尤為稀缺。這時(shí),科大訊飛拉來(lái)華為站臺(tái)。
在今年的1024開發(fā)者節(jié)上,科大訊飛正式發(fā)布了聯(lián)合華為打造的基于昇騰的大模型底座“飛星一號(hào)”平臺(tái),并官宣了更大參數(shù)規(guī)模的訊飛星火V4.0大模型訓(xùn)練也正式啟動(dòng)。
作為兩個(gè)國(guó)家隊(duì)的一次重磅合作,科大訊飛董事長(zhǎng)劉慶峰滿懷激情地表示,訊飛星火V4.0將在明年上半年發(fā)布,屆時(shí)將正式對(duì)標(biāo)GPT4。
實(shí)際上,就在今年,科大訊飛已經(jīng)聯(lián)合華為團(tuán)隊(duì)在半年時(shí)間內(nèi)通過(guò)孵化大模型融合算子、多維度分布式并行、算-網(wǎng)-存系統(tǒng)級(jí)的智能運(yùn)維,以及基于CANN聯(lián)合深度優(yōu)化,實(shí)現(xiàn)了訊飛星火大模型訓(xùn)練和推理效果的翻番。
而這些,都是科大訊飛進(jìn)一步進(jìn)入機(jī)器人領(lǐng)域、深入研究具身智能的基礎(chǔ)。
就機(jī)器人產(chǎn)業(yè)布局而言,科大訊飛不僅發(fā)布了人形機(jī)器人,還發(fā)布了(輪式)家庭陪伴機(jī)器人機(jī)器人,甚至闖入了已經(jīng)紅海市場(chǎng)的掃地機(jī)器人領(lǐng)域。
在大會(huì)場(chǎng)外的展館中,我們也看到了科大訊飛這些機(jī)器人產(chǎn)品。
2023年,科大訊飛在“訊飛超腦2030計(jì)劃”的推動(dòng)下,成功進(jìn)入機(jī)器人領(lǐng)域。借助大模型的支持,科大訊飛進(jìn)一步深入到機(jī)器人領(lǐng)域,并攜帶訊飛星火大模型進(jìn)軍人形機(jī)器人市場(chǎng),預(yù)計(jì)將為該行業(yè)帶來(lái)重大變革。
關(guān)鍵詞: