技術(shù)
導(dǎo)讀:武漢人工智能研究院聯(lián)合中國(guó)科學(xué)院自動(dòng)化研究所自主研發(fā)的“紫東太初”大模型已迭代到 2.0 版本,根據(jù)官方最新消息,“紫東太初 3.0”將于今年上半年發(fā)布。
3 月 5 日消息,武漢人工智能研究院聯(lián)合中國(guó)科學(xué)院自動(dòng)化研究所自主研發(fā)的“紫東太初”大模型已迭代到 2.0 版本,根據(jù)官方最新消息,“紫東太初 3.0”將于今年上半年發(fā)布。
據(jù)湖北日?qǐng)?bào)報(bào)道,武漢人工智能研究院院長(zhǎng)王金橋介紹:“上半年,我們將發(fā)布‘紫東太初’3.0,進(jìn)一步提升大模型對(duì)千行百業(yè)的賦能能力。借力相關(guān)研究,院方與東風(fēng)汽車、光庭信息在智能駕駛領(lǐng)域的合作已全面展開?!?/p>
據(jù)IT之家此前報(bào)道,紫東太初第一代 AI 大模型于 2021 年發(fā)布,由中國(guó)科學(xué)院自動(dòng)化研究所和華為聯(lián)合開發(fā),號(hào)稱是“全球首個(gè)千億參數(shù)多模態(tài)大模型”。
區(qū)別于當(dāng)前以文本為主的大部分語(yǔ)言大模型,“紫東太初”大模型在研發(fā)之初即以多模態(tài)技術(shù)為核心,利用圖-音-文等更多類型數(shù)據(jù)進(jìn)行跨模態(tài)的統(tǒng)一表征和學(xué)習(xí),實(shí)現(xiàn)了圖像、文本、語(yǔ)音三模態(tài)數(shù)據(jù)間的“統(tǒng)一表示”與“相互生成”。
紫東太初 2.0 于 2023 年 6 月發(fā)布,基于華為全棧國(guó)產(chǎn)化軟硬件平臺(tái)昇騰 AI 與昇思 MindSpore,相比第一代著力提升了決策與判斷能力,在文本、圖片、音頻的基礎(chǔ)上,“紫東太初”2.0 可融入 3D、視頻、傳感信號(hào)等更多模態(tài)數(shù)據(jù),并優(yōu)化語(yǔ)音、視頻和文本的融合認(rèn)知以及常識(shí)計(jì)算等功能。
報(bào)道稱,升級(jí)到 3.0 版本,大模型將在各項(xiàng)性能優(yōu)化的基礎(chǔ)上,具備自主選擇、使用工具的能力,滿足更深層次的邏輯交互需要。
針對(duì)智能駕駛,“紫東太初”將大幅縮短、優(yōu)化其訓(xùn)練過(guò)程。通過(guò)大語(yǔ)言模型和多模態(tài)能力,大模型可以替代海量的人工,完成汽車、信號(hào)燈、路標(biāo)等數(shù)據(jù)的自動(dòng)標(biāo)注,大幅提升智能汽車感知世界的效率。
同時(shí),“紫東太初”接入汽車后,能夠更深層次地學(xué)習(xí)、理解駕駛目標(biāo)和意圖,快速將環(huán)境信息翻譯成設(shè)備能讀懂的語(yǔ)言,并預(yù)測(cè)未來(lái)幾秒內(nèi)的情況,提前向汽車下達(dá)合適指令。