新聞中心
【特約報(bào)道】2013年7月13-14日, 由阿里巴巴集團(tuán)主辦的ADC?阿里技術(shù)嘉年華將在杭州海外海國(guó)際會(huì)展中心舉行,2011年舉辦首屆,今年是第三屆,已發(fā)展為互聯(lián)網(wǎng)行業(yè)最開(kāi)放、最實(shí)戰(zhàn)派的技術(shù)交流盛會(huì)之一。被大家視為碼農(nóng)典范的技術(shù)大神MySQl的創(chuàng)始人Michael Widenius,將作為嘉賓現(xiàn)場(chǎng)分享。

網(wǎng)站建設(shè)哪家好,找成都創(chuàng)新互聯(lián)公司!專(zhuān)注于網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站建設(shè)、微信開(kāi)發(fā)、小程序定制開(kāi)發(fā)、集團(tuán)企業(yè)網(wǎng)站建設(shè)等服務(wù)項(xiàng)目。為回饋新老客戶(hù)創(chuàng)新互聯(lián)還提供了貢覺(jué)免費(fèi)建站歡迎大家使用!
本屆嘉年華設(shè)置了大數(shù)據(jù)技術(shù)與應(yīng)用、無(wú)線(xiàn)技術(shù)、業(yè)務(wù)架構(gòu)&后端技術(shù)、前端技術(shù)、搜索、廣告、體驗(yàn)設(shè)計(jì)、互聯(lián)網(wǎng)測(cè)試、系統(tǒng)開(kāi)發(fā)和運(yùn)維等九大分場(chǎng),共有80多個(gè)主題,其中包括了阿里巴巴、騰訊、百度及更多知名的互聯(lián)網(wǎng)公司的在實(shí)踐中積累起來(lái)的技術(shù)經(jīng)驗(yàn)。比如阿里巴巴的去IOE、新浪微博的系統(tǒng)穩(wěn)定性等主題都反映了業(yè)界的主流的工程技術(shù)方向。
這次是來(lái)自于一淘的技術(shù)專(zhuān)家陳曦(公達(dá))給我們帶來(lái)的課題:個(gè)性化搜索和應(yīng)用,主要是挖掘用戶(hù)的群體特性和購(gòu)物傾向。建立一整套以數(shù)據(jù)驅(qū)動(dòng),合理的個(gè)性化特征體系和優(yōu)化目標(biāo)的個(gè)性化模型。解決個(gè)性化搜索中面臨的一些重要問(wèn)題:搜索結(jié)果的多樣性,防止過(guò)度個(gè)性化。介紹個(gè)性化模型的算法、系統(tǒng)和可視化數(shù)據(jù)分析工具。
在演講過(guò)程中,公達(dá)給大家介紹了為什么要做個(gè)性化搜索。首先是解決長(zhǎng)尾需求,實(shí)現(xiàn)搜索結(jié)果多樣性,再者就是滿(mǎn)足用戶(hù)隱含購(gòu)物需求,縮短購(gòu)物路徑。所以,在我們購(gòu)買(mǎi)T恤通過(guò)——T恤 女——T恤 女 甜美——T恤 女 甜美[50~100]這樣的一個(gè)過(guò)程。
那么在什么時(shí)候我們才需要個(gè)性化呢?公達(dá)給我們一個(gè)用戶(hù)意圖分析模型來(lái)說(shuō)明這個(gè)問(wèn)題。
個(gè)性化搜索會(huì)針對(duì)用戶(hù)的行為推薦,比如對(duì)于高檔購(gòu)買(mǎi)力的人和低檔購(gòu)買(mǎi)力的人推薦展示結(jié)構(gòu)是不一樣的。
個(gè)性化搜索系統(tǒng)主要是通過(guò)搜索基礎(chǔ)數(shù)據(jù),比如商品,用戶(hù)以及Query來(lái)通過(guò)離線(xiàn)計(jì)算,這里又包括了全量數(shù)據(jù)處理,實(shí)時(shí)數(shù)據(jù)處理通過(guò)用戶(hù)數(shù)據(jù)引擎和Query處理引擎發(fā)送到前端,當(dāng)然也可以通過(guò)商品搜索引擎直接推送到前端。
公達(dá)還給出了一個(gè)購(gòu)買(mǎi)力模型,主要是包括:類(lèi)目?jī)r(jià)格分檔、根據(jù)用戶(hù)(購(gòu)買(mǎi),收藏,點(diǎn)擊)寶貝的架構(gòu)來(lái)計(jì)算用戶(hù)+類(lèi)目的購(gòu)買(mǎi)力;利用;還有一個(gè)是利用協(xié)同過(guò)濾的思想,補(bǔ)充沒(méi)行為的用戶(hù)+類(lèi)目的購(gòu)買(mǎi)力。下面給出一個(gè)小編看不懂的模型:
個(gè)性化搜索還有個(gè)關(guān)鍵詞偏好,一淘通過(guò)用戶(hù)點(diǎn)擊,購(gòu)買(mǎi),成交,收藏的商品標(biāo)題挖掘用戶(hù)所關(guān)注的語(yǔ)意單元的信息。這里公達(dá)給大家提供了官方思路:基于歷史商品標(biāo)題分詞粒度的TF-IDF統(tǒng)計(jì)模式。那么這樣問(wèn)題在哪里呢?第一,粒度太細(xì),用戶(hù)在單個(gè)詞上難有長(zhǎng)期偏好,第二,詞太多,存儲(chǔ)空間大;第三,頁(yè)面展示效果較凌亂。還有一個(gè)思路就是建立基于
下面淘寶還分析了用戶(hù)數(shù)據(jù),主要是購(gòu)買(mǎi)力和年齡的分布情況。
分享名稱(chēng):ADC現(xiàn)場(chǎng)報(bào)道:個(gè)性化搜索挖掘用戶(hù)群體特性和購(gòu)物傾向
文章轉(zhuǎn)載:http://fisionsoft.com.cn/article/djpcgch.html


咨詢(xún)
建站咨詢(xún)
