當(dāng)前位置：首頁 > 新聞資訊 > 行業(yè)動態(tài) > AI機器人全面上崗疫情“你問我答”，日交互量超百萬

AI機器人全面上崗疫情“你問我答”，日交互量超百萬

來源：-- 編輯：創(chuàng)澤時間：2020/3/9 主題：其他 [加盟]

自新冠肺炎疫情爆發(fā)以來，智能疫情防控機器人以其便捷、高效、準(zhǔn)確的特點迅速成為防控一線的有利助手。目前業(yè)界使用較多的智能疫情防控機器人主要有外呼和在線服務(wù)兩類產(chǎn)品。外呼類產(chǎn)品可以實現(xiàn)對重點用戶的電話問詢，其首批測評結(jié)果已經(jīng)發(fā)布，受到了業(yè)界的廣泛關(guān)注。在線服務(wù)機器人，可接受用戶主動提問，為用戶提供咨詢、問診、查詢等服務(wù)，可以迅速地為用戶傳達疫情信息。為便于相關(guān)單位根據(jù)需求選擇合適的產(chǎn)品，中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟（以下簡稱“聯(lián)盟”）在此前工作基礎(chǔ)上，依托中國信息通信研究院和人工智能關(guān)鍵技術(shù)和應(yīng)用評測工業(yè)和信息化部重點實驗室，開展了面向疫情防控在線服務(wù)機器人的評估測試，現(xiàn)將評估結(jié)果公布如下。

本輪智能疫情防控機器人（在線類）評測共有15家企業(yè)報名參加，16款產(chǎn)品參與評測。聯(lián)盟通過技術(shù)測試、材料審查和企業(yè)披露等方式對參評產(chǎn)品進行了評測。參與本輪評測的企業(yè)與產(chǎn)品見下表（按拼音順序排列，排名不分先后）。

阿里云計算有限公司：阿里云在線疫情知識問答
北京捷通華聲科技股份有限公司：靈云智能客服系統(tǒng)
北京京東世紀(jì)貿(mào)易有限公司：智能疫情助理
北京容聯(lián)易通信息技術(shù)有限公司：容聯(lián)X-bot
北京搜狗科技發(fā)展有限公司：新冠肺炎智能問答機器人
杭州朗和科技有限公司：網(wǎng)易七魚疫情服務(wù)機器人
南京云問網(wǎng)絡(luò)技術(shù)有限公司：云問防疫問答機器人
平安國際智慧城市科技股份有限公司：疫情速遞
廈門快商通科技股份有限公司：新冠肺炎咨詢助手
上海智臻智能網(wǎng)絡(luò)科技股份有限公司：小i疫情智能問詢機器人
深圳市一號互聯(lián)科技有限公司：小A智客服
深圳追一科技有限公司：疫情機器人
騰科科技（深圳）有限公司：疫情防控助手
騰訊科技（深圳）有限公司：騰訊客服
浙江同花順智能科技有限公司：同花順智能客服系統(tǒng)
竹間智能科技（上海）有限公司：竹間智能防疫情感機器

結(jié)果分析與建議

1、基礎(chǔ)功能豐富多樣，業(yè)務(wù)功能有待完善

本輪評測功能部分測試了疫情防控在線服務(wù)機器人的多渠道管理、富媒體消息互動、情緒安撫等六項基礎(chǔ)功能指標(biāo)，測試了疫情查詢、問題咨詢、自診問診等五項業(yè)務(wù)功能指標(biāo)。下圖給出了功能部分的評測結(jié)果，列出了參評產(chǎn)品對各項指標(biāo)的支持情況：

總體而言，參評產(chǎn)品在多渠道管理支持能力和富媒體消息互動支持能力方面表現(xiàn)良好，所有參評產(chǎn)品均支持兩種及其以上渠道管理，最高的支持達到六種，全面覆蓋了PC端和移動端用戶。參評產(chǎn)品在會話異常處理上表現(xiàn)比較接近，大部分產(chǎn)品部分支持該功能，在情緒安撫功能支持上兩極化差異較明顯，全面支持和不支持?jǐn)?shù)量相近，兩者合計數(shù)量占比超過八成。主要有以下三個方面的特點：

多渠道管理能力普遍支持較好，保障不同渠道用戶訪問服務(wù)的便捷高效；
交互方式多樣化，超過半數(shù)參評產(chǎn)品支持圖像交互，信息展示更立體；
會話異常處理結(jié)合情緒安撫，有效提升了用戶情感體驗。

針對不同疫情防控場景，測試選取了不同的測試數(shù)據(jù)，根據(jù)產(chǎn)品對語料的反饋相關(guān)度設(shè)置了0-4分五級評分標(biāo)準(zhǔn)。通過測試結(jié)果得出，多數(shù)產(chǎn)品對咨詢、問診和防控業(yè)務(wù)場景支持能力較好，高效回復(fù)率分別達到35.6%、40.9%、45.0%，有效回復(fù)率分別達到70.6%、63.4%、60.0%。但是在政策和新聞等信息類業(yè)務(wù)場景中，多數(shù)參評產(chǎn)品得分情況較差，不能較好的反饋實時信息，這方面的能力需要繼續(xù)加強。

2、對話質(zhì)量參差不齊，性能指標(biāo)有待優(yōu)化

智能疫情防控在線服務(wù)機器人的核心技術(shù)是自然語言處理和對話系統(tǒng)，產(chǎn)品能否準(zhǔn)確識別對話中的關(guān)鍵詞，并理解用戶意圖成為服務(wù)效果的關(guān)鍵，因此本次評測選取意圖理解和關(guān)鍵詞識別作為核心性能指標(biāo)。作為一款以自然語言處理為核心技術(shù)的產(chǎn)品，測試數(shù)據(jù)集的設(shè)計尤為重要，通過分析用戶對疫情信息關(guān)注的不同角度，本次測試數(shù)據(jù)集選擇咨詢、問診、防控和信息查詢四個不同場景。測試使用的數(shù)百條語料由聯(lián)盟人員通過對疫情相關(guān)信息和知識的調(diào)研，并分析各家產(chǎn)品的特點后設(shè)計，涵蓋了疫情相關(guān)術(shù)語以及用戶比較關(guān)心的問題。下圖給出了16款參評產(chǎn)品的性能指標(biāo)測試結(jié)果（產(chǎn)品序號根據(jù)評測先后順序排列，與表1次序無關(guān)）。

總體來看，各家參評產(chǎn)品在關(guān)鍵詞識別和意圖理解能力上參差不齊，準(zhǔn)確率最高值與最低值相差都超過了50個百分點。在關(guān)鍵詞識別能力上，有6款產(chǎn)品的準(zhǔn)確率超過60%，基本可以識別出“新型冠狀病毒”、“N95口罩”、“發(fā)燒干咳”、“密切接觸者”等疫情強相關(guān)詞匯，以進行關(guān)鍵詞匹配和擴展，確保答復(fù)的準(zhǔn)確性和豐富性。在意圖理解能力上，有7款產(chǎn)品的準(zhǔn)確率超過50%，可對用戶提出的問題有針對性的進行答復(fù)、相關(guān)問題推送和情緒安撫，從而提供精確、及時、有效的服務(wù)。
通過圖3中的性能指標(biāo)產(chǎn)品分布情況可知，多數(shù)參評產(chǎn)品意圖理解和關(guān)鍵詞識別準(zhǔn)確率分布在[0.2,0.4)和[0.6,0.8)，反映出參評產(chǎn)品在性能上的兩級分化，建議相關(guān)企業(yè)及時豐富疫情相關(guān)語料并進行產(chǎn)品優(yōu)化，提升問題解決率。

3、用戶需求攀升，交互量日益增加

在本輪評測中，除上述功能和性能指標(biāo)外，還統(tǒng)計了截至2月12日各參評產(chǎn)品的訪問量、交互量以及用戶平均在線時長情況。具體數(shù)據(jù)如下圖所示。

從訪問量上看，超七成產(chǎn)品的總訪問量達到了百萬級，其中總訪問量超過二百萬和三百萬的產(chǎn)品約占三成；從日均訪問量上看，約70%的產(chǎn)品日均訪問量在一萬到二十萬之間，僅有10%的產(chǎn)品突破了二十萬大關(guān)；從交互量上看，約75%的產(chǎn)品總交互量超過了百萬條，約78%的產(chǎn)品日均交互量超過一萬條；從用戶平均在線時長上來看，超五成產(chǎn)品達到了2分鐘以上，約37%的產(chǎn)品用戶平均在線時長不足1分鐘，另外平均在線時長超過3分鐘的產(chǎn)品數(shù)約占36%。

4、建議與反饋

聯(lián)盟通過分析疫情防控機器人（在線類）的評測結(jié)果，結(jié)合終端用戶的實際需求，提出以下建議：

注重信息和答案的真實性和準(zhǔn)確性：在疫情防控、政策宣貫、信息查詢等場景下，保證數(shù)據(jù)和問題結(jié)果的真實性極為重要。例如：本次評測中發(fā)現(xiàn)，各款產(chǎn)品對“白酒能否替代酒精消毒？”的解答不盡相同，甚至得到相反的答案；

確保疫情相關(guān)知識的豐富性與時效性：如氣溶膠傳播、SARS-CoV-2等疫情術(shù)語的解釋及核酸檢測、人工肺等醫(yī)療手段的闡述；

適度增加富媒體消息的交互：采用圖文結(jié)合的方式，能更加清晰簡潔的回復(fù)用戶提出的問題。例如在“如何正確佩戴N95口罩？“問題上，以圖片示意每一步佩戴操作，相對而言更為明確和具體；

適當(dāng)發(fā)起多輪對話關(guān)聯(lián)上下文語義信息：在人機對話過程中以多輪次問答的形式采集用戶信息，幫助用戶明確問題，從而動態(tài)且精準(zhǔn)地為用戶解答并推薦相關(guān)問題。

	創(chuàng)澤智能機器人中國智能服務(wù)機器人領(lǐng)軍企業(yè)，涵蓋商用、家庭、特種等多用途的智能機器人產(chǎn)品體系，十幾年行業(yè)應(yīng)用解決方案提供商