導(dǎo)讀:本文將分享LTV 模型在用戶增長上的應(yīng)用和搭建,主要介紹:
什么是 LTV?
LTV 可以解決什么問題?
什么時候需要什么樣的 LTV 預(yù)估?
如何實現(xiàn)設(shè)備粒度的LTV 預(yù)估?
LTV 如何應(yīng)用?如何撬動更大的價值?
01什么是LTV
在傳統(tǒng)的經(jīng)濟學(xué)、市場學(xué)當(dāng)中,LTV經(jīng)常會被應(yīng)用的場景是:在一個超市中去分析來這個超市的人的整體的LTV,即LTV=Average Value of Sale *Number of Transactions * Retention Time Period,然后再做一個宏觀的數(shù)據(jù)統(tǒng)計和預(yù)測。
在互聯(lián)網(wǎng)的應(yīng)用環(huán)境下,通常把LTV拆解為兩項:一個是LT(Life Time),一個是 ARPU(Average Revenue Per User)。通常在用戶生命周期的概念規(guī)范下,LT(Life Time)代表用戶在生命周期內(nèi)的活躍天數(shù);ARPU(Average Revenue Per User)是指用戶每次活躍時產(chǎn)生的價值;即LTV=LT(Life Time)*ARPU(Average Revenue Per User)。
02
LTV可以解決什么問題?
1. 用戶增長中的生命周期
用戶增長中的生命周期分為以下五個階段:
第一個階段是潛在用戶階段,即用戶還沒有成為你站內(nèi)的用戶;第二個階段,用戶成為你的站內(nèi)用戶,是一個新增用戶;第三個階段新增用戶可能會活躍,就會成為一個活躍用戶,一個活躍用戶有可能繼續(xù)活躍,也有可能流失:第四個階段,當(dāng)用戶流失掉的時候,就是一個已流失的用戶;第五個階段,流失用戶形成一個用戶增長池,可以再去拉回用戶來提升整體的DAU。
2. LTV應(yīng)用于增長的生命周期管理
LTV 模型可應(yīng)用于增長的生命周期管理的五個階段。
(1)對于潛在用戶,可以通過一些站外的數(shù)據(jù)或者一些媒體側(cè)的增長的數(shù)據(jù),去預(yù)估潛在的用戶或者潛在的設(shè)備的LTV價值的高低;此時使用的粒度比較粗,例如地域、男女等粗粒度的畫像特征。
(2)對于新增用戶,可以去構(gòu)建其畫像特征和行為特征等,來預(yù)估用戶在本次生命周期內(nèi)的 LT 和ARUP。
(3)對于活躍用戶,數(shù)據(jù)充足,體量大,可根據(jù)近 N 天的各種特征等去預(yù)測用戶在本次生命周期內(nèi)的LT和ARPU;活躍用戶的數(shù)據(jù)可以做到一個日粒度的更新,對應(yīng)的LTV價值預(yù)估可經(jīng)常刷新。
(4)當(dāng)活躍用戶流失之后,進入到流失用戶池,需要預(yù)估用戶的潛在回流LTV價值,篩選出潛在回流LTV價值高的用戶。
(5)對于回流用戶,其LTV價值的分析跟新增用戶比較類似,即根據(jù)該用戶在本次回流的前 N 天的各種特征等去預(yù)測該用戶在本次生命周期的 LT 和ARPU。
3. 增長策略在生命周期的應(yīng)用
LTV預(yù)測在增長策略中如何應(yīng)用?還是從生命周期的五個階段依次拆解。
第一個階段是潛在用戶階段,如果知道潛在用戶的LTV價值,在買量時,就可以進行相應(yīng)的調(diào)價:高價值的用戶出高價,低價值用戶出低價;從而可實現(xiàn)ROI優(yōu)化的目標(biāo)。
第二個階段是新增用戶階段,當(dāng)用戶來到站內(nèi)之后,可根據(jù)其前幾天的表現(xiàn)去調(diào)整其對應(yīng)的LTV價值預(yù)估,可以用于復(fù)盤該新增用戶的增長策略做得好不好,也就是說當(dāng)用戶來到站內(nèi)以后,經(jīng)過一些時間行為的積累,預(yù)估其在本次生命周期的LTV價值,去衡量這次買量的效果好不好。比如說你花了5塊錢買了一個用戶,通過該用戶前幾天的一些表現(xiàn),預(yù)估該用戶在本次生命周期能夠產(chǎn)生比如10塊錢的收益,那么這次買量就是成功的、劃算的。
第三個階段是活躍用戶階段,可以每天刷新活躍用戶在本次生命周期的LTV價值,但此時也需要去關(guān)注和衡量一個用戶的長期價值。在用戶增長策略和方法中,經(jīng)常會發(fā)push拉活。比如用戶因為發(fā)push來到站內(nèi),那短期內(nèi)對DAU有增長,但同時預(yù)估其長期的價值,可以知道這一次的促活能帶來的長期價值是什么;這就衍生了白盒化分析的一些應(yīng)用,后面會有涉及。
第四個階段是流失用戶階段,首先在用戶流失之前,如果一直刷新活躍用戶的LTV價值預(yù)測,識別出LTV價值的下降趨勢,可以進行流失預(yù)警;對于已流失的用戶,可以根據(jù)其潛在的LTV價值高低,然后拉回,和拉新的邏輯比較像,即在拉回策略上的一個優(yōu)化。
第五個階段是對于回流用戶的LTV預(yù)估,和新增用戶的LTV預(yù)估比較類似,就是根據(jù)拉回用戶的前幾天的站內(nèi)表現(xiàn),去回顧看一下這一次把這個用戶買回來,或者說是用一些策略吸引回來的,效率如何。
03
什么時候需要什么樣的LTV預(yù)估
到底需不需要一個LTV預(yù)估?在什么場景下要怎么樣進行LTV預(yù)估?如何決策,和公司的發(fā)展策略、業(yè)務(wù)具體的應(yīng)用場景都是息息相關(guān)的,有很強的邏輯性,我們從以下四個維度進行分析。
第一個維度是顆粒度,即需要對哪個顆粒度進行LTV價值預(yù)估。
顆粒度,首先包括大盤,是今天活躍的所有設(shè)備,還是整體存量用戶庫;然后包括某一個cohort,一個cohort是指特定編碼的用戶群或設(shè)備群,比如今天的新增設(shè)備可以是一個cohort,或者今天新增從某一個渠道買來的一批用戶也是一個cohort,可以對某一個cohort進行LTV價值預(yù)估;最后包括設(shè)備/用戶,是LTV價值預(yù)估的終極模態(tài)。如果能夠差異化地預(yù)估每一個設(shè)備的LTV,應(yīng)用場景就非常的廣泛,可以把LTV價值預(yù)估聚合到任何維度,但是如果顆粒度越細的話,建模難度、誤差等就會越高;顆粒度太粗又無法滿足業(yè)務(wù)需求,因此一定要結(jié)合具體的業(yè)務(wù)應(yīng)用場景,去決定一個合適的顆粒度。
第二個維度是時效性,是指每一次做出預(yù)估的時候需要等待一個什么樣的周期才能預(yù)估出來本次生命周期的LTV,比如預(yù)估一年內(nèi)的LTV,等的時間越久,其實就越接近真實值,但要是等得太久的話,那業(yè)務(wù)不如再等兩天看真實值就算了,所以這里存在取舍,對于時效性要求越快的話,預(yù)估肯定是越不穩(wěn)以及越不準(zhǔn),但是越慢的的話,業(yè)務(wù)又不能滿足需求;因此還是需要要結(jié)合業(yè)務(wù)的應(yīng)用場景去決定時效性。
第三個維度是準(zhǔn)確性。
為什么準(zhǔn)確性是一個決定維度?比如LTV預(yù)估一個全量的值,如果真實值是100,要估100才對,估98、95都不對,這樣的標(biāo)準(zhǔn)太嚴格,因此在準(zhǔn)確性上需要有一定的取舍。尤其是在做設(shè)備粒度的LTV預(yù)估時,有一些模型的效果是序會更準(zhǔn),比如A、B兩個設(shè)備,預(yù)估出來A設(shè)備比B設(shè)備的價值要高,但具體的準(zhǔn)確數(shù)值,可能估得不一定準(zhǔn);有一些模型的估值更準(zhǔn),比如聚合在某一個cohort上,這個估值的min會比較小,但序就不太準(zhǔn)了。更深入來分析,則可能需要在一個數(shù)據(jù)分布和建模選擇上進行取舍,當(dāng)然需要結(jié)合具體業(yè)務(wù)需求去分析,如果評估實驗組和參照組的差值,那序準(zhǔn)更重要,可以獲取設(shè)備之間誰大誰小的關(guān)系;如果是渠道買量等,就需要獲取某cohort、應(yīng)用或者設(shè)備的LTV價值,比如花了5塊錢買量,最終是不是產(chǎn)生了10塊錢還是15塊錢收益,那需要預(yù)估的LTV價值準(zhǔn);要根據(jù)應(yīng)用場景的不同做一定的取舍。
最后一個維度是用戶生命周期定義。
在傳統(tǒng)的市場學(xué)中,用戶生命周期是指用戶的壽命周期,就是完完整整的生命周期,buy until you die。但是在我們的業(yè)務(wù)應(yīng)用場景中,用戶生命周期會定義一個數(shù)字,有可能是一個月、一年,也有可能十年;具體是多長時間會通過以下幾個因素進行分析決定。
(1)公司的發(fā)展階段
如果公司發(fā)展到了比較成熟且穩(wěn)定的階段,則要關(guān)注用戶的長期價值;如果在飛快發(fā)展的階段,歷史值都不太具有參考性,建模的穩(wěn)定性以及對于未來的預(yù)估的能力也不足;因此要根據(jù)公司發(fā)展階段來決定生命周期的長短。
(2)宏觀經(jīng)濟地域環(huán)境
當(dāng)去預(yù)估一個設(shè)備或者一個渠道的價值時,如果看的比較長久一些,要考慮設(shè)備多久換一次機,和換機時間是否能夠匹配上,其實也是buy until you die的邏輯,這個時候捕捉的就是設(shè)備的生命長度;具體需要看多長時間的周期就要根據(jù)宏觀的經(jīng)濟環(huán)境去決策。
(3)歷史數(shù)據(jù)積累
和第一點類似,不贅述。
(4)應(yīng)用場景
在某些應(yīng)用場景下是否需要和某些指標(biāo)對齊,那么也會影響用戶生命周期定義。
下面介紹幾個常規(guī)的LTV預(yù)估模型。
第一個模型是歷史值擬合。
針對某一個cohort或大盤,根據(jù)整個cohort或大盤的真實留存數(shù)據(jù),去擬合一個曲線y=a*ln(x)+b,預(yù)估出a和b的值,從而可以預(yù)估后續(xù)日期的LTV價值。
該模型的好處是應(yīng)用比較簡單,簡單清晰。弊端是穩(wěn)定性差,比如有一些激勵政策或前七天有促活,擬合出來的曲線就會有偏差,不是一個符合真實情況的成立函數(shù);也有可能中間有一些活動帶來的一些尖刺spike,就會直接帶偏未來的預(yù)測,需要等的時間比較久,通常等30天、60天都有可能,預(yù)測才能真的穩(wěn)定下來。
第二個模型是Probabilistic Model。
該模型將LTV拆解為LT和ARPU,當(dāng)去看某個cohort或者大盤時,假設(shè)這些指標(biāo)都是某種分布,然后根據(jù)歷史數(shù)據(jù)預(yù)估該分布的參數(shù),從而來預(yù)估未來的LTV,通常用于看大盤比較多。
最后一個模型是通過DNN或Machine Learning建模去構(gòu)建特征,包括用戶近N天畫像特征、行為特征、消費特征、生產(chǎn)特征等,所有和業(yè)務(wù)、產(chǎn)品相關(guān)的維度,對用戶本次生命周期的LT和ARPU分別進行預(yù)估。
下面從常理上剖析一下該模型。通過此類模型預(yù)估的LT和ARPU,實際上都面臨一個問題:大部分的用戶可能活躍一天或者花 10 塊錢就走了,有一部分用戶就花特別多的錢,但可能在尾部又出現(xiàn)一個spike,即20%的用戶貢獻80%的收入,這樣的分布建模的難度比較高,比如用平常的MAE當(dāng)loss的話,就不太容易能夠把這些極端的情況都捕捉到,可能會受比較奇怪的分布的影響,沒有辦法學(xué)到稀疏的地方。Google預(yù)估LTV的一個方法是沒有拆LT和ARPU,采用zero inflated log normal 模型直接預(yù)估一個用戶的LTV,具體可參考這篇文章:《Wang, X., Liu, T., and Miao,J. (2019), A deep probabil- istic model for customer lifetime value prediction, Available from: https://arxiv.org/abs/1912.07753》快手電商與增長模型團隊也創(chuàng)立了獨特的產(chǎn)業(yè)級LTV建模方法,通過引入Order Dependency Monotonic Network (ODMN)來針對時間跨度與LTV的有序依賴性建模,大幅提升模型表現(xiàn),同時使用基于分治法思路的Multi Distribution Multi Experts (MDME) 模塊式學(xué)習(xí),解決了LTV數(shù)據(jù)分布稀疏對建模的困難。詳見
04
如何實現(xiàn)設(shè)備粒度的LTV預(yù)估
如何實現(xiàn)設(shè)備粒度的LTV預(yù)估,總結(jié)下來就是數(shù)據(jù)和模型這兩塊。
數(shù)據(jù)基建是一個金字塔型階梯式的數(shù)據(jù)積累。
最底層是DAU的特征積累,即對DAU各種特征做數(shù)倉建設(shè),對LTV的用途做模塊化管理,比如把生產(chǎn)側(cè)的某種指標(biāo)聚到一塊,實時地更新特征庫。
第二層是對不同cohort的模型圈選人群,其中cohort是指人群等,比如需要做設(shè)備粒度的LTV預(yù)估時,預(yù)估模型需要圈選人群,該人群可能是MAU、DAU等,根據(jù)圈選出來的人群決定畫像和時效性。
第三層是聚集所有的特征,去得到訓(xùn)練/預(yù)測集等,就決定了特征的復(fù)雜性、模型的復(fù)雜性、訓(xùn)練更新頻率等。
第四層是線上的多維實時數(shù)據(jù)源,偏維度項、偏實時的數(shù)據(jù),即在模型預(yù)測或訓(xùn)練時才加進來的一些比較簡單的數(shù)據(jù)。最頂層最終預(yù)測輸出,預(yù)估的LTV價值。
模型基建分為三塊。
第一塊是只用一個模型框架承接整個探測數(shù)據(jù)、特征處理、訓(xùn)練、預(yù)測,結(jié)果評估等完整流程,即該模型框架需要可以支持完整流程,并且有很強的拓展性,有一定的復(fù)用性。
第二塊是內(nèi)部有工具去部署任務(wù)、管理機器資源等,無論是用airflow,還是內(nèi)部自研的工具。
最后一塊是日常監(jiān)控,包括預(yù)測異常監(jiān)控、模型準(zhǔn)確率監(jiān)控、特征變化監(jiān)控,比如監(jiān)控是否準(zhǔn)時產(chǎn)出、特征變化等,監(jiān)控特征是不是從某個時候開始偏移了,整個分布都變了,則對應(yīng)模型不再適用,因此都要從各個維度,比如預(yù)測的結(jié)果、模型的準(zhǔn)確性,還有特征等都要做監(jiān)控。
05
LTV如何應(yīng)用?如何撬動更大的價值?
最后介紹一下LTV如何應(yīng)用以及如何撬動更大的價值。前面講過的白盒化和此相關(guān),通過模型可以榨取出白盒化的一些產(chǎn)品洞見。
對新增用戶進行建模時,可以做畫像切片,篩選出高價值的用戶,然后針對性地做一些買量策略;也可以預(yù)測時序上的變化,預(yù)估真實的LTV是怎么樣變化的,也可以預(yù)測具體的特征是怎么樣的變化及其正、負相關(guān)性等,因此可以對整體的產(chǎn)品策略有一定的指導(dǎo)。
對活躍用戶進行建模時,可以評估日常促活的一些策略的長期價值,也可以分析該模型重要的特征,從而做一些產(chǎn)品策略的指導(dǎo)。如果知道決定活躍用戶預(yù)測重要的特征有哪些,可以對產(chǎn)品整體有宏觀的理解,并且從這些特征出發(fā),可以做更多的事情。比如相關(guān)特征涉及兩個產(chǎn)品線的一些重要指標(biāo),這兩個產(chǎn)品相互沖突和競爭,此消彼長,就可以知道哪個指標(biāo)對用戶的長期價值更重要,也可以知道該如何看待兩個產(chǎn)品的重要指標(biāo),以及如何衡量其重要性。
還可以通過分析LTV預(yù)測的變化,得到生命周期變化的預(yù)警。比如長期觀測一個用戶的LTV 預(yù)估的變化,可以找出LTV漲跌趨勢,無論是漲還是跌,都可以映射到高活躍、中活躍和低活躍中,就可以獲得活躍用戶活躍度扭轉(zhuǎn)的預(yù)警。
對回流用戶進行建模時,和新增用戶類似,對于回流的用戶可以做策略優(yōu)化。比如通過做用戶畫像切片,可以知道已流失的用戶或拉回的用戶中哪些用戶的價值更高,然后針對性地優(yōu)化拉回策略。
今天的分享就到這里,謝謝大家。
來源:井冬萍 DataFunSummit
以上是關(guān)于用戶增長師的相關(guān)信息,以供大家查看了解。想要了解更多用戶增長師信息,第一時間了解用戶增長師相關(guān)資訊,敬請關(guān)注唯學(xué)網(wǎng)用戶增長師欄目,如有任何疑問也可在線留言,小編會為您在第一時間解答!