創(chuàng)澤機器人 |
CHUANGZE ROBOT |
站在新的一個十年,智能人機交互、多模態(tài)融合、結(jié)合領(lǐng)域需求的 NLP 解決方案建設(shè)、知識圖譜結(jié)合落地場景等將會有突破性變化。
1 智能人機交互
語言模型將在智能人機交互中扮演更重要的角色,形成更豐富的形式,混合 100 種語言的多語言語言模型,以及融合圖像-文本和語音-文本多模態(tài)語言模型將嶄露頭角,在不同語言、不同模態(tài)、不同領(lǐng)域的小樣本場景下帶來全面的能力提升。
多語言交互從不同語言理解上升到不同文化的理解,通過跨文化理解技術(shù)深入當?shù)匚幕瘜崿F(xiàn)地道的對話交互。
以在線文本為核心的交互方式將全面轉(zhuǎn)變?yōu)榻Y(jié)合視頻、圖像、語音、文本的多模態(tài)人機交互。
基于數(shù)據(jù)驅(qū)動的對話狀態(tài)跟蹤和對話策略將逐漸替代規(guī)則式策略,使得多輪對話技術(shù)進一步演進,帶來更自然的對話體驗。
知識圖譜將廣泛融入問答和對話的各類深度學習模型,通過先驗知識及推理能力的融入,使得模型更為白盒化,在對話的理解和生成過程中帶來更好的可控性和可解釋性。
對話系統(tǒng)在小樣本情況下的冷啟動能力提升帶來應(yīng)用構(gòu)建成本的大幅下降,對話系統(tǒng)從主要為大體量的客戶服務(wù),拓展為更普惠的、廣泛的支持海量規(guī)模、各行業(yè)的小企業(yè)及小商家,并進一步走向海外,使得更多不同國家、不同語言和不同文化的用戶進入智能服務(wù)時代。
2 多模態(tài)融合
隨著 5G 和邊緣計算的逐步成熟和普及,將帶來視頻、圖像、文本、語音等模態(tài)的全面融合,語言模型朝著多模態(tài)融合的方向發(fā)展,在在線場景下實現(xiàn)混合模態(tài)的理解,將能融合理解用戶經(jīng)過多輪對話發(fā)送的圖片、語音和文字內(nèi)容,并以多模態(tài)的形式進行回復;
對話系統(tǒng)產(chǎn)品中將全面實現(xiàn)多模態(tài)交互能力,直播和 IOT 大屏交互將全面應(yīng)用視頻+圖像+文本多模態(tài)技術(shù)帶來豐富的交互體驗,流暢的全雙工語音對話機器人將被普遍應(yīng)用,實現(xiàn)邊聽邊想、邊聽邊猜、主動搶話等類人交互能力。
在語音交互場景下通過聲學信號+文字信號,識別用戶交流中的情緒變化, 在 IOT 互動場景下實現(xiàn)基于攝像頭、麥克風的擬態(tài)生命;
3 結(jié)合領(lǐng)域需求的NLP解決方案建設(shè)
過去 NLP 算法多以平臺/API 的方式輸出通用模型,相應(yīng)地也在各種云上建立了通用 NLP 算法平臺(Amazon Comprehend,微軟 Azure Text Analytics,谷歌云 Natural Language,阿里 NLP,百度 NLP 等)。
但是在業(yè)務(wù)場景中,每種場景領(lǐng)域都有自己的特定的需求,產(chǎn)生了相應(yīng)的場景數(shù)據(jù)。通用模型結(jié)合場景數(shù)據(jù)進行領(lǐng)域自適應(yīng)訓練,從而輸出的領(lǐng)域定制模型會更好地滿足業(yè)務(wù)需求。
4 知識圖譜結(jié)合落地場景
面向新的一個十年,通過 NLP 和知識圖譜兩大核心技術(shù)來構(gòu)建行業(yè)知識圖譜,機器能夠通過知識圖譜挖掘隱性關(guān)系,洞察“肉眼”無法發(fā)現(xiàn)的關(guān)系和邏輯,用于最終的業(yè)務(wù)決策,實現(xiàn)更深層次的業(yè)務(wù)場景落地。從發(fā)展方向來說,可以分為下面幾個方面:
優(yōu)化知識抽取能力:結(jié)合已有的知識和 NLP 技術(shù)能力進一步提高非結(jié)構(gòu)化數(shù)據(jù)理解能力,應(yīng)用預訓練語言模型、信息抽取、實體鏈接等相關(guān)的技術(shù),對非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù)進行抽取和轉(zhuǎn)換,形成知識圖譜形式的知識,以及和知識圖譜里面的結(jié)構(gòu)化的知識進行鏈接。
與行業(yè)知識沉淀:在行業(yè)知識圖譜解決方案實際的落地過程中,面臨重重挑戰(zhàn),行業(yè)知識圖譜的構(gòu)建,本身就需要數(shù)據(jù)積累和基于業(yè)務(wù)場景的數(shù)據(jù)理解,而構(gòu)建和積累行業(yè)知識圖譜,將是認知智能時代的核心競爭力。在行業(yè)數(shù)據(jù)構(gòu)建時,對知識的準確性要求非常高,實體通常需要較多且具有行業(yè)意義。需要針對多源異構(gòu)數(shù)據(jù)融合,基于可動態(tài)變化的“概念—實體—屬性—關(guān)系”數(shù)據(jù)模型,對各種類型的數(shù)據(jù)進行抽象建模。
智能可信的知識推理:基于過去已知知識進行知識推理,理解行業(yè)事件知識驅(qū)動知識推理傳導,利用行業(yè)規(guī)則邏輯結(jié)合深度模型進行推理,使其能夠在業(yè)務(wù)的推理和輔助決策上帶來更加智能化的體驗。
以上是我們對于 NLP 技術(shù)過去一年發(fā)展的回顧和今年趨勢的思考。一家之言難免疏漏或者以偏概全。拋磚引玉,希望能夠得到更多同學們的思考和指正。比爾·蓋茨曾說過,“語言理解是 人工智能 皇冠上的明珠”。要達到這樣的高度,還需要技術(shù)和應(yīng)用上的突破發(fā)展期待在下一個十年的開始,我們一起讓 NLP 技術(shù)發(fā)展更加迅速,應(yīng)用場景更加豐富,推動認知智能的發(fā)展更進一步。
機器人招商 Disinfection Robot 機器人公司 機器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖 |