導(dǎo)讀:該系統(tǒng)是開放訪問的,以期為應(yīng)用開發(fā)者、企業(yè)、研究團體和社會各界提供服務(wù)。在推出5個月后,該系統(tǒng)的語言能力變得更加強大。
《西班牙人報》網(wǎng)站近日報道稱,MarIA是第一個專門利用西班牙語理解和寫作的大規(guī)模人工智能系統(tǒng)。得益于該系統(tǒng),西班牙語得以在擁有海量開放訪問模型的語言中排在第3位,僅次于英語和中文。
報道稱,該系統(tǒng)建立在西班牙國家圖書館的數(shù)字文獻基礎(chǔ)之上,并通過MareNostrum 4超級計算機進行人工智能培訓(xùn)。該圖書館一直致力于追蹤和歸檔所有使用西班牙語的網(wǎng)站。
該系統(tǒng)是開放訪問的,以期為應(yīng)用開發(fā)者、企業(yè)、研究團體和社會各界提供服務(wù)。在推出5個月后,該系統(tǒng)的語言能力變得更加強大。
語言模型是一個人工智能系統(tǒng),由深度神經(jīng)網(wǎng)絡(luò)組成,經(jīng)過訓(xùn)練能夠精確掌握語言、詞匯以及表達和寫作機制。
這些復(fù)雜的統(tǒng)計模型不僅能夠“理解”抽象的概念,而且能夠理解其背景。有了這些模型,應(yīng)用程序開發(fā)者可以創(chuàng)建具有多種用途的工具,例如對文件進行分類或創(chuàng)建校對或翻譯工具等。
第1個版本的MarIA是利用RoBERTa訓(xùn)練模型建立的,RoBERTa是一種創(chuàng)建“編碼器”類型語言模型的技術(shù)。而最新版本則是用GPT-2創(chuàng)建的,GPT-2是一種更先進的技術(shù),可以創(chuàng)建生成性解碼器模型并為系統(tǒng)增加更多功能。
這些新的功能使MarIA成為一種有效的工具。通過適應(yīng)具體任務(wù)的“特殊”訓(xùn)練,該系統(tǒng)可以為應(yīng)用開發(fā)者、公司和公共管理部門帶去更多幫助。
例如,迄今為止開發(fā)的英語模型都被用來在寫作應(yīng)用中生成文本建議,根據(jù)每個用戶想了解的內(nèi)容,總結(jié)合同或詳細介紹產(chǎn)品特點的復(fù)雜文件,以及在大型文本數(shù)據(jù)庫中搜索特定信息,并將其與其他相關(guān)信息聯(lián)系起來。
專家指出,通過MarIA這樣的項目,西班牙正在向利用西班牙語思考的人工智能邁出堅定的步伐,這將使西班牙的公司和技術(shù)行業(yè)獲得的經(jīng)濟機會成倍增加。因為該系統(tǒng)遠不止是一種交流的手段,更是看待數(shù)字化世界的新方式。