日韩精品导航,失落十三年,亚洲a∨精品一区二区三区下载,91国内在线

創(chuàng)澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 機器人知識 > 微信提出推薦中的深度反饋網(wǎng)絡(luò),在“看一看”數(shù)據(jù)集上達到SOTA

微信提出推薦中的深度反饋網(wǎng)絡(luò),在“看一看”數(shù)據(jù)集上達到SOTA

來源:AI科技大本營     編輯:創(chuàng)澤   時間:2020/5/22   主題:其他 [加盟]

在推薦系統(tǒng)中,用戶的顯式反饋、隱式反饋、正反饋和負反饋都能夠反映用戶對于被推薦物品的偏好。這些反饋信息在推薦系統(tǒng)中十分有用。然而,現(xiàn)在的大規(guī)模深度推薦模型往往以點擊為目標,只看重以用戶點擊行為為代表的隱式正反饋,而忽略了其它有效的用戶反饋信息。

作者在本文中關(guān)注用戶多種顯式/隱式和正/負反饋信息,學習用戶的無偏興趣偏好。具體地,作者提出了一個Deep Feedback Network (DFN)模型,綜合使用了用戶的隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)以及顯式負反饋(點擊不感興趣按鈕行為)等信息。

DFN模型使用了internal feedback interaction component抓住用戶行為序列中的細粒度的行為級別的交互,然后通過external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監(jiān)督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。在實驗中,作者基于微信看一看的數(shù)據(jù),進行了豐富的離線和在線實驗,模型與baseline相比均取得顯著提升。


1、模型背景與簡介

推薦系統(tǒng)在日常生活中被廣泛使用,為用戶獲取信息與娛樂提供便利。推薦系統(tǒng)算法往往基于用戶與系統(tǒng)的交互,這些交互行為可以大致分為以下兩類:顯式反饋與隱式反饋。顯式反饋從用戶對于物品的直接態(tài)度中獲取,例如評論中的一星到五星,或者微信看一看系統(tǒng)中的“不感興趣”按鈕。這類反饋能夠直接表達用戶的正向以及負向偏好,但是這類反饋的數(shù)量往往不多。隱式反饋從用戶的行為中間接獲得,例如用戶的點擊/不點擊行為。這些信息在推薦系統(tǒng)中往往是海量的,但是這些信息有著較多噪聲(用戶點擊的并不一定是他真正喜歡的)。另外,隱式反饋通常是以正反饋的形式出現(xiàn),推薦中的隱式負反饋存在巨大噪聲(未展現(xiàn)信息或者未點擊信息并不一定意味著用戶不喜歡這些內(nèi)容)。

在近期的深度推薦系統(tǒng)中,CTR導向的目標受到極大關(guān)注。因此,模型不可避免地只關(guān)注和目標緊密相關(guān)的用戶點擊行為,忽略了其它用戶行為中蘊含的豐富信息。僅考慮CTR導向目標的推薦模型往往會遇到以下兩個問題:(1)CTR導向目標只關(guān)注用戶喜歡什么,沒有關(guān)注用戶不喜歡什么。這樣,模型的推薦結(jié)果容易同質(zhì)化和趨熱化,損害用戶體驗。因此,負反饋信息是必要的。(2)用戶除了被動地接受系統(tǒng)推薦的物品,有時也需要能夠主動和即時的反饋機制。用戶希望能夠高效和準確地告知系統(tǒng)自己喜歡或者不喜歡什么。另外,用戶的顯式和隱式反饋之間也會存在割裂(用戶點擊的并不一定是他真正喜歡的)。因此,顯式反饋也是必要的。顯式信息和隱式信息能夠作為彼此的補充,相輔相成。已有工作通過使用用戶的未點擊/未曝光行為作為用戶的隱式負反饋,這樣會引入極大的噪聲。另外一些工作嘗試使用用戶的顯式負反饋信息。這些信息固然精確,但是也往往比較稀疏。

為了解決這些問題,綜合使用用戶多種顯式/隱式和正/負反饋信息學習更好的無偏用戶表示,作者提出了一個Deep Feedback Network (DFN)模型。圖1中給出了在微信看一看場景中的三種用戶反饋。DFN通過internal feedback interaction component抓住用戶行為序列中的細粒度行為級別的交互,然后通過external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監(jiān)督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。這些反饋特征會和其他用戶/物品特征混合,并行使用FM、Deep和Wide層進行特征交互,最后進行CTR預估。

作者基于微信看一看推薦系統(tǒng),設(shè)計了離線和線上實驗,在多個指標上具有顯著提升。這篇工作的主要貢獻如下:

1、作者第一次融合隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)、顯式負反饋(點擊不感興趣按鈕行為)和它們之間的交互信息進行用戶行為建模;

2、作者提出了一個全新的Deep Feedback Network (DFN)模型,能夠?qū)W習到用戶無偏的興趣偏好;

3、模型在離線和在線任務(wù)上都得到了顯著提升,具有工業(yè)級實用價值。論文中也提出了一個feed流中的顯式負反饋預測任務(wù)。

 

2、模型結(jié)構(gòu)

DFN模型主要分為三個階段:首先,deep feedback interaction module以用戶的多種反饋行為作為輸入,輸出用戶的反饋特征。然后,F(xiàn)eature Interaction Module進一步考慮用戶的其它特征和物品特征,使用FM、Deep和Wide層進行特征交互。最后,輸出層使用CTR作為訓練目標。圖2給出了DFN的整體結(jié)構(gòu)。

deep feedback interaction module是模型的主要創(chuàng)新點。它包括了兩個組成部分:Internal Feedback Interaction Component和External Feedback Interaction Component。圖3給出了deep feedback interaction module的結(jié)構(gòu)。

首先,在Internal Feedback Interaction Component中,用戶的隱式正反饋、隱式負反饋和顯式負反饋序列和target item一起,通過一個transformer層,得到了在各個序列內(nèi)部細粒度的item-level的交互信息,然后經(jīng)過average層得到三種反饋的特征表示,其中隱式正反饋特征中蘊含高質(zhì)量的用戶正向偏好,顯式負反饋特征中蘊含高質(zhì)量的用戶負向偏好。

第二步,在External Feedback Interaction Component中,隱式負反饋序列往往是三種行為中最多的行為,但也是噪聲最大的行為。作者把高質(zhì)量的和target item交互后的隱式正反饋特征和顯式負反饋特征看作一種高質(zhì)量指導,從用戶未點擊序列中挖掘用戶或許喜歡/不喜歡的物品,補充用戶的正向負向偏好。作者使用了一個attention層得到了兩種用戶弱正向/負向反饋特征。這兩種弱反饋特征和第一步的三種反饋特征拼接后成為最終的用戶反饋特征。

第三步,在Feature Interaction Module中,作者使用了FM、Wide和Deep層,對用戶其它特征、物品特征和用戶反饋特征等進行低階/高階特征交互。這一個模塊是為了充分利用各種特征輔助推薦,使得模型在真實工業(yè)級任務(wù)上達到最好的效果。使用Wide層主要是為了給潛在的特征工程留下接口。

最后,作者基于CTR loss進行訓練。除去傳統(tǒng)的正例和未點擊負例,作者還增加了一項預測用戶負反饋點擊的loss。由于在實際推薦系統(tǒng)中,用戶給出主動顯式負反饋的次數(shù)極少,顯式負反饋中的負向信息也極其強烈,所以作者單獨在loss中強調(diào)了這一項,并且給予了較大的訓練權(quán)值。

3、實驗結(jié)果

離線和線上實驗均在微信看一看上進行,離線數(shù)據(jù)集包含千萬級用戶在百萬級物品上的億級行為。模型離線CTR預估結(jié)果如圖4:

4、總結(jié)

在本文中,作者初步研究了推薦系統(tǒng)中的多種顯式/隱式和正/負反饋之間的協(xié)同合作機制。DFN模型能夠基于多種反饋信息即時學習到用戶的無偏的正負向興趣,在點擊預估和不感興趣預估等多個任務(wù)上均有提升效果。直觀而有效的模型也使得DFN能成功在工業(yè)級推薦系統(tǒng)中得到部署和驗證。我們預測用戶的顯式反饋,特別是顯式負反饋的信息將會未來推薦系統(tǒng)中起到更加重要的作用,在發(fā)掘推薦系統(tǒng)可解釋性同時提升用戶體驗。





“觸控一體化”的新型機械手指尖研究

機械手面臨的難點在于如何在柔性物體上施加可控的擠壓力,以及在非穩(wěn)定狀況下確保精確、穩(wěn)健的抓握與柔性指端操控

戴瓊海院士:搭建腦科學與人工智能的橋梁

腦科學的發(fā)展將推動人工智能科學從感知人工智能到認知人工智能的跨越

如何加快解決數(shù)據(jù)產(chǎn)權(quán)問題

數(shù)據(jù)所有權(quán)方面,1原始數(shù)據(jù)屬于個人,2企業(yè)享有衍生數(shù)據(jù)所有權(quán),3政府享有政府數(shù)據(jù)的歸屬權(quán)

圖像檢索入門、特征和案例

圖像檢索是計算機視覺中基礎(chǔ)的應(yīng)用,可分為文字搜圖和以圖搜圖。借助于卷積神經(jīng)網(wǎng)絡(luò)CNN強大的建模能力,圖像檢索的精度越發(fā)提高

《視覺SLAM十四講》作者高翔:非結(jié)構(gòu)化道路激光SLAM中的挑戰(zhàn)

SLAM階段:解決從原始傳感器數(shù)據(jù)開始,構(gòu)建某種基礎(chǔ)地圖的過程,標注階段:在SLAM結(jié)果基礎(chǔ)上進行人為標注,實現(xiàn)更精細的交通規(guī)則控制

SLAM與V-SLAM特征對比

基于激 光雷達的SLAM(激光SLAM)和基于視覺的SLAM(V-SLAM)。激光SLAM目前發(fā)展比較成熟、應(yīng)用廣泛,未來多傳感器融合的SLAM 技術(shù)將逐漸成為技術(shù)趨勢,取長補短,更好地實現(xiàn)定位導航。

國內(nèi)外舵機參數(shù)性能價格比較

舵機是步態(tài)服務(wù)機器人的核心零部件和成本構(gòu)成,是包含電機、傳感器、控制器、減速器等單元的機電一體化元器件

AI在COVID-19診斷成像中的應(yīng)用

人工智能技術(shù)支持的圖像采集可以顯著幫助掃描過程實現(xiàn)自動化,還可以重塑工作流程,最大限度地減少與患者的接觸,為成像技術(shù)人員提供最佳保護

不完美場景下的神經(jīng)網(wǎng)絡(luò)訓練方法

騰訊優(yōu)圖實驗室高級研究員Louis在分享了自適應(yīng)缺陷數(shù)據(jù),業(yè)務(wù)場景下的神經(jīng)網(wǎng)絡(luò)訓練方法

深度學習的可解釋性研究(一)— 讓模型具備說人話的能力

為決策樹模型是一個具有比較好的可解釋性的模型,以決策樹為代表的規(guī)則模型在可解釋性研究方面起到了非常關(guān)鍵的作用

深度學習的可解釋性研究(二)——不如打開箱子看一看

神經(jīng)網(wǎng)絡(luò)模型本身其實并不是一個黑箱,其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為

深度學習的可解釋性研究(三)——是誰在撩動琴弦

神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種,變量敏感性分析用來檢驗輸入屬性變量對模型的影響程度,樣本敏感性分析用來研究具體樣本對模型的重要程度
資料獲取
機器人知識
== 最新資訊 ==
ChatGPT:又一個“人形機器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國機器視覺產(chǎn)業(yè)方面的政策
中國機器視覺產(chǎn)業(yè)聚焦于中國東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機器人+應(yīng)用行動實
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機器人集團股份有限公司第十一期上
諧波減速器和RV減速器比較
機器人減速器:諧波減速器和RV減速器
人形機器人技術(shù)難點 高精尖技術(shù)的綜合
機器人大規(guī)模商用面臨的痛點有四個方面
青島市機器人產(chǎn)業(yè)概況:機器人企業(yè)多布局在
六大機器人產(chǎn)業(yè)集群的特點
機械臂-高度非線性強耦合的復雜系統(tǒng)
== 機器人推薦 ==
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人招商 Disinfection Robot 機器人公司 機器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728