最近有不少朋友留言,讓對會(huì )員畫(huà)像做個(gè)全面的點(diǎn)的講解下。就此,我對《三生三世話(huà)CRM》系列課程的第四課“會(huì )員分析”中的會(huì )員畫(huà)像內容進(jìn)行個(gè)展開(kāi)講解。

首先,基于我自己對會(huì )員畫(huà)像的認知對其做個(gè)定義。會(huì )員畫(huà)像可以認為是基于會(huì )員分析的聚類(lèi)分組后的定性描述的標簽化呈現,是對會(huì )員多維度屬性展開(kāi)的更加立體全面的描述歸納。

會(huì )員畫(huà)像本質(zhì)也是會(huì )員分析的一種分析呈現方法。會(huì )員分析的目的就是為了清楚的描述展現會(huì )員的特征屬性,更好地理解把握會(huì )員是我們做分析的終極目標。“標簽”可以認為是自然語(yǔ)言的一部分,是一個(gè)簡(jiǎn)單精煉的歸納表現形式。在實(shí)際業(yè)務(wù)中,大家都在廣泛的應用這一類(lèi)基于標簽的畫(huà)像方法,即會(huì )員畫(huà)像?;跁?huì )員畫(huà)像的標簽方法歸納起來(lái),就是給用戶(hù)貼一系列的標簽,而“標簽”是能表示用戶(hù)某一特征屬性的標識。

會(huì )員畫(huà)像是建立在一系列屬性數據之上的目標用戶(hù)模型。會(huì )員畫(huà)像的基礎信息應該是對會(huì )員描述的全量信息,通??梢苑譃闄C器很容易解析的結構化信息和機器很難理解需要結合知識庫才能夠理解的非結構化信息,這些信息最后以飽含深意的標簽的形式表現出來(lái)。

會(huì )員畫(huà)像邏輯

先來(lái)說(shuō)說(shuō)結構化信息,可以理解成在數據庫中結構化存放的信息,歸結起來(lái)包括會(huì )員的基礎信息,行為信息,已經(jīng)分析總結后的特征信息。會(huì )員的這些信息要基于時(shí)間和空間維度來(lái)談才有意義,脫離了時(shí)間,空間的數據是無(wú)意義的。

比如“有錢(qián)人”這個(gè)標簽,100年前的有錢(qián)人和現在的有錢(qián)人絕不是一個(gè)概念,至少有錢(qián)程度差異很大了;即使同一時(shí)間的當下的1萬(wàn)/月的高薪,在一線(xiàn)城市和三四線(xiàn)城市,在不同的國家,肯定都意味不同的。因此用戶(hù)畫(huà)像應該是多維度的立體的描述體系。

非結構化信息,就是一些零碎的,人類(lèi)自然語(yǔ)言描述等,目前機器還不能有效的準確的理解人類(lèi)的自然語(yǔ)言,因為我們的自然語(yǔ)言很多時(shí)候是有歧義的,需要通過(guò)上下文才能理解的,而機器需要結合龐大知識庫的轉譯才能夠理解的非結化信息。

比如一些人類(lèi)生活總結出來(lái)的概念、行為、習慣等知識的結合就能解讀出額外的信息。比會(huì )員信息中缺失的性別,會(huì )員信息中沒(méi)有性別,但我們可以結合一些業(yè)務(wù)描述語(yǔ)境來(lái)判斷,通常姓名中帶有女字旁,與花名相關(guān)的會(huì )員,我們可以認為其為女性。又比如用戶(hù)訪(fǎng)問(wèn)過(guò)的網(wǎng)站,經(jīng)常訪(fǎng)問(wèn)一些美妝或女性服飾類(lèi)網(wǎng)站,是女性的可能性就高;訪(fǎng)問(wèn)體育軍事類(lèi)網(wǎng)站,是男性的可能性就高。還有用戶(hù)上網(wǎng)的時(shí)間段,經(jīng)常深夜上網(wǎng)的用戶(hù)男性的可能性就高。把這些特征加入到知識分類(lèi)器進(jìn)行訓練,也能提高一定的數據覆蓋率。當然這些知識也要限定在一定的時(shí)間空間下,不同的時(shí)間空間的知識解讀出來(lái)的信息完全是不一樣的。

要想讓機器能夠理解這些知識:

  • 先進(jìn)個(gè)是要有足夠大的規模,必須覆蓋足夠多的樣本,足夠多的概念;
  • 第二個(gè)是語(yǔ)義要足夠豐富,當說(shuō)到各種各樣的關(guān)系的時(shí)候,機器必須都能夠理解;
  • 第三個(gè)就是數據質(zhì)量要足夠精良,能夠按照一定的規則被聚類(lèi)被歸納;
  • 第四個(gè)就是結構必須足夠友好需要借鑒語(yǔ)義和背景知識來(lái)給我們力量。

會(huì )員畫(huà)像歸根結底就是對會(huì )員屬性分析結果的描述呈現,終究只是概括性的歸納描述。因此,我們不可能通過(guò)會(huì )員畫(huà)像對會(huì )員做到全方位全面的描述,這里的全面只能是相對的。細細糾結下,會(huì )員畫(huà)像本身也是有其自身缺陷的。

首先,會(huì )員畫(huà)像從某種程度講上還是不完整的。

導致這個(gè)問(wèn)題可能有兩個(gè)原因,先進(jìn)個(gè)原因就是任何畫(huà)像的來(lái)源數據都是有一定偏差的,一般描述的都是用戶(hù)畫(huà)像的某一方面,很難有一個(gè)非常完整的畫(huà)像。還有一個(gè)非常重要的原因就是隱私,大家都是有選擇性的提供個(gè)人信息,會(huì )回避不愿談及自己的,但是很多時(shí)候可能了解用戶(hù)不愿談及的這個(gè)方面的內容對于我們做產(chǎn)品,做服務(wù)又是非常重要的?;谶@兩個(gè)原因,我們對用戶(hù)的理解就是一個(gè)碎片式的,很難召回完整的目標客戶(hù)。

其次,會(huì )員畫(huà)像還有一個(gè)問(wèn)題就是不正確性。

也就是說(shuō),我們對用戶(hù)畫(huà)像的理解很多時(shí)候是錯誤的,這導致會(huì )出現錯誤的服務(wù)應用。導致不正確性的原因有很多,人類(lèi)社會(huì )是在向前發(fā)展,知識也在不斷的演變。因此,供機器學(xué)習的知識庫永遠也不會(huì )有完整全面的時(shí)候,總有機器還無(wú)法理解知識,就會(huì )做出不夠精準正確的描述。

綜上, 我們理解的會(huì )員畫(huà)像,通常只是基于存量的歷史數據,通過(guò)數據分析模型,對會(huì )員數據從屬性特征在時(shí)間、空間內盡可能地描述歸納。因數據分析統計分析有其局限性,基于此的會(huì )員畫(huà)像也不可能做到真正意義上的全面完整。因此,我們只能做到盡可能的全面無(wú)死角的會(huì )員畫(huà)像。

 

•END•