目錄
摘要 I
Abstract III
1緒論 1
1.1研究背景和研究意義 1
1.1.1研究背景 1
1.1.2研究意義 2
1.2國內外研究現狀 3
1.2.1精準營銷 3
1.2.2服裝營銷 5
1.2.3數據挖掘技術 7
1.2.4文獻評述 10
1.3研究內容與研究方法 10
1.3.1研究內容 10
1.3.2研究方法 11
1.4技術路線 12
2相關基礎理論 13
2.1精準營銷 13
2.1.1STP 理論 13
2.1.24P 理論 14
2.1.3用戶增長模型 15
2.2數據挖掘技術 16
2.2.1CRM 系統 16
2.2.2RFM 模型 17
2.2.3K-means 聚類方法 18
2.2.4個性化推薦系統 19
3AD公司精準營銷現狀及存在問題 21
3.1 AD公司概況 21
3.1.1公司概況 21
3.1.2宏觀環境分析 21
3.1.3行業競爭對手分析 23
3.2AD公司營銷策略概述 25
3.2.1產品策略 25
1
3.2.2價格策略 25
3.2.3渠道策略 26
3.2.4促銷策略 26
3.3 AD公司電商精準營銷存在問題及原因分析 26
3.3.1缺乏有效的客戶細分 26
3.3.2用戶增長乏力 27
3.3.3精準營銷內容不夠精準 28
3.3.4過度依賴三方平臺導致精準營銷缺少差異化 29
4AD公司電商精準營銷策略優化 31
4.1建立客戶細分體系 31
4.1.1方案概述 31
4.1.2運用RFM模型和K-means進行客戶細分 31
4.1.3小結 38
4.2優化用戶增長策略 38
4.2.1方案概述 38
4.2.2用戶增長優化方案 39
4.2.3小結 44
4.3提升營銷內容精準度 44
4.3.1方案概述 44
4.3.2建設基于深度學習的推薦系統 45
4.3.3基于推薦系統的優化營銷方案 48
4.3.4小結 50
4.4自建數據平臺減少對三方平臺的依賴 50
4.4.1方案概述 50
4.4.2建立大數據平臺 50
4.4.3建立用戶畫像系統 52
4.4.4小結 54
5精準營銷策略實施保障與實施效果 57
5.1 實施保障 57
5.1.1理念保障 57
5.1.2組織保障 57
5.1.3財務保障 58
5.2 實施效果 59
5.2.1用戶增長指標 59
2
5.2.2推薦系統指標 61
5.2.3商品銷售指標 63
6結論與展望 65
致謝 67
參考文獻 69
附錄 73
附錄I .精準營銷調查問卷 73
附錄II. RFM模型權重打分表 75
附錄III.求解矩陣特征值和特征變量 76
附錄W.使用SQL進行RFM變量值的計算 77
附錄V.模型訓練 78
1緒論
1.1研究背景和研究意義
1.1.1研究背景
近年來,隨著我國互聯網產業和信息技術水平的高速發展,人們的生活水平得 到了極大提高,人們的購物方式也在發生著巨大的變化,越來越多的購物行為正在 從線下向線上轉移。這對我國各行各業的發展而言,既是機遇也是挑戰。這其中, 作為對居民生活有著重大影響的服裝行業更是如此。我國是人口大國,也是服裝消 費大國,長期以來服裝的銷售模式主要是以線下實體店為主,而隨著互聯網和電子 商務的發展,線上銷售模式正在成為主流。根據 2020 年商務部大數據平臺的數據顯 示,服裝品類在我國電商行業中所占比重正在逐年擴大。在商務部重點監測的 14 家 網絡銷售平臺上,共有的 1946.9萬家店鋪,其中服裝品類店鋪為 644.5萬家,占比 高達 33.1%,穩居各品類規模排名第一。服裝品類的整體銷售額也在過去的 10 年間 飛速增長,根據中國紡織聯合會發布的數據,服裝家紡品類電子商務的銷售額在過 去的 10 年間增長了 9倍,從 2011年的 0.22萬億元增長到了 2020 年的 1.8萬億元[1] (如圖 1.1所示)。互聯網電商平臺已經成為了當之無愧的服裝銷售主力平臺。
圖 1.1 2011-2020 年紡織服裝類電商銷售數據統計(數據來源:商務部網站)
同時,從以上數據我們也可以看出,在零售額整體增長的同時,增長率卻在逐 年下降。在過去的 10 年間,服裝類電網的網絡零售增長率已經從的 2012年的 50%回 落到 2020 年的 8.20%。特別是 2020 年新冠肺炎疫情突然爆發的背景下,服裝行業遭 受了巨大沖擊。從 2020 年 1 月份到當年 10 月份,服裝行業規模以上企業的服裝產 量同比下降了16.8億件,降幅達到了 8.38%;累計實現營業收入同比下降了1583.9 億元,降幅高達 12.85%[]。雖然在社會各界的共同努力下,我們很快的遏制住了疫 情的發展,但是疫情對整體服裝零售行業的不良影響已經造成,且由于疫情的不斷 反復,使得市場復蘇的腳步依然緩慢,未來服裝行業仍將承受巨大的下行壓力。在 這種大環境下,如何克服下行壓力,保持平穩增長,已經成為當前整個服裝行業急 需解決的重大問題[3]。
AD 公司是一家在國內有近 20 年發展歷程的運動服裝企業,該公司曾經憑借著 出色的產品設計、過硬的產品質量和優秀的市場營銷手段,長期占據著國內運動服 飾銷售份額的領先位置,特別是在過去的近10年間,AD公司成功的抓住了中國互 聯網發展的契機,通過與京東、淘寶、天貓等多家互聯網電商平臺的合作,一度取 得了非常出色的銷售業績。但是從 2018年開始,隨著互聯網電商平臺業務規則的不 斷調整,以及競爭對手的步步緊逼,再加上自身在發展過程中存在的一些不利因素, AD公司出現了營銷成本高企、用戶流失嚴重、銷售規模下滑等問題,這些問題都阻 礙的企業的成長,導致企業的發展進入了瓶頸期。從 2019年開始,公司通過多方調 查研究,決定實施“數據挖掘+精準營銷”的銷售策略,該策略以提升銷量、增加用 戶規模為目標,以新型互聯網營銷理論為基礎,以大數據、人工智能等技術為手段, 通過建設數字化和自動化的精準營銷系統,把以往以單一的功能型電商平臺打造成 了基于大數據和人工智能的智能化電商平臺。經過近兩年的建設,AD公司基本完成 了既定的系統建設目標,智能化的精準營銷體系初步搭建完成,并在 2021 年開始的 一系列營銷活動中收到了非常好的營銷效果。
本文選題正是在此背景下產生的。本文認為,服裝行業在過去數年的高速發展 中,互聯網電商平臺起到了的不可忽視的作用,而且在今后的發展中,互聯網電商 平臺依然是重要的發展方向。但是在互聯網電商平臺的競爭不斷加劇、花式營銷手 段層出不窮的新形勢下,服裝企業要想更好的發展互聯網電商業務,就不能簡單的 沿用過去的“線上鋪貨+網絡下單”的銷售模式,而是要在新型的營銷理論的指導下, 緊密結合服裝企業自身特點,認真分析當前互聯網營銷場景,采用互聯網和大數據 等技術手段,建立新的智能化的精準營銷體系,并以此為契機努力尋找新的發展方 向。
1.1.2研究意義
1 .理論意義
本文在對精準營銷、服裝營銷和數據挖掘等相關理論文獻的研究和梳理的基礎 上,結合 AD 公司的案例,介紹了 RFM 模型、 K-means 算法、個性化推薦系統等數 據挖掘技術和人工智能等相關技術在服裝企業電商精準營銷領域的應用,同時也介 紹了企業如何利用數據挖掘和人工智能的成果產出來指導企業開展精準營銷活動。 本文希望對以上理論和方法的研究和介紹,可以讓更多的企業熟悉其中的原理以及 應用場景,并為以后開展類似的研究提供素材。
2.實踐意義
AD 公司作為一家在國內服裝行業有近 20 年發展歷程的企業,和其它同行業企 業一樣,即享受了互聯網快速增長帶來的紅利,也經歷了企業在發展過程中所遇到 的種種問題。但 AD 公司卻能通過實施“數據挖掘+精準營銷”的精準營銷策略,成 功的止住了企業業務的下滑,并實現了各項營銷指標的好轉,幫助企業重新回到正 常發展的軌道上來。本文希望通過對 AD 公司的研究,能夠揭示其中的一些成功經 驗,總結其中的一些成功方法,對幫助有類似問題的企業走出困境起到借鑒作用。
1.2國內外研究現狀
1.2.1精準營銷
1.國外研究現狀
國外對精準營銷理論的研究開始比較早,相關文獻也比較多,本文結合了傳統 理論和最新的研究成果,從“客戶獲取”、“客戶細分”、“客戶觸達(傳播媒 介)”三個方面進行了文獻梳理。這三個方面分別代表了目前精準營銷領域比較重 要的“新客獲取”、“現有客戶價值挖掘”和“個性化推薦”三個部分。
(1)客戶獲取的研究
傳統的營銷理論中,客戶獲取(Customer Acquisition)是以4C理論為基礎的, 比如萊斯特•偉門(Lester Wunderman)的“十九條營銷準則",杰夫•薩賓(Jeff Zabin)和格萊士 •布雷巴克(Gresh Brebach)的《Precision Marketing: The New Rules for Attracting, Retaining, and Leveraging Profitable Customers》等都沒有跳 出4C理論的框架。
目前國外最新的關于客戶獲取的研究,已經全面轉向了互聯網、社交媒體和大 數據方向。De Vries L, Gensler S (2017)的研究發現,類似 Facebook、Twitter等 社交媒體和網絡論壇上的用戶行為,以及用戶之間的消息傳播的數量和質量,已經 成為了影響品牌傳播的主要力量,以社交媒體為代表的數字化渠道已經變成了企業 獲取客戶的重要方式⑷。Ponzoa J M和Erdmann A (2021)研究了電子商務網站在 吸引客戶方面的各種影響因素,并實證了網絡分析方法在獲取客戶方面發揮著重要 作用頃。Phillip Britt (2021)以案例研究的方式,跟蹤了一家企業是如何具體使用 大數據和AI技術來進行客戶獲取和客戶維護工作的。作者通過這項研究發現,由數 字化渠道獲取的客戶,無論在客戶價值和品牌忠誠度上都要優于通過傳統線下渠道
3
獲取的客戶[6]。
(2)客戶細分的研究
溫德爾•史密斯(Wendell Smith)最早提出了細分市場的觀點。市場細分誕生 源自于企業在應對不同用戶的不同需求時,按照若干因素對市場用戶群體進行的細 分和切割。經典的“分眾市場(Demassified Market)"理論就是在這個理論基礎上 發展而來的。
國外在這個方面的研究,也呈現出了向大數據和人工智能方向發展的趨勢。
Dogan 0,和 Bulut Z 等(2017)研究了使用 RFM (Recency, Frequency, Monetary) 模型對客戶數據進行細分的應用案例。該研究顯示,相比與傳統的基于人口統計學 的客戶細分,使用 RFM 模型生成的客戶細分的結果可以更有效的支持企業開展精準 營銷活動[7]。Johansson A和Wikstrom J (2021)對機器學習技術在客戶細分方面的 應用進行了研究,該研究對比了邏輯回歸模型和支持向量機這兩個分類模型的在客 戶分群上的性能表現,其結果表明,邏輯回歸模型在將用戶分為三組時的準確率達 到了 71%,比專家手動分類的準確率更高網。Wang Y (2021)研究了使用數據挖掘 技術來生成消費者屬性標簽,該研究通過提取靜態標簽和動態標簽,并與網絡平臺 上的用戶數據相結合,生成了動態的“用戶畫像”模型,并在此基礎上提出了掌握 用戶心理、匹配用戶需求、準確調整價格等進行個性化推薦的策略[9]。
( 3)傳播媒介的研究
菲利普.科特勒(2005)在《Principles of Marketing》一書中,將“互聯網" 與“精準”兩項內容放到了一起進行了研究,指出前沿科技將會成為支撐營銷的利 器,并鼓勵企業多使用互聯網、多媒體等手段開展營銷活動:“清楚營銷內涵,提 倡溝通個性化,以精準為起點和終點,將時間、用戶、內容和響應首尾串聯[10] ” 。 Paul. W. Farris 和 Neil. T. Bendle 等(2006)也強調了數字化渠道的重要性,以 及營銷傳播量化的問題,他們研究了企業如何使用技術手段對傳播的結果進行追蹤 和量化分析,以便于企業對營銷活動的效果進行全面分析[11]。經濟學家什洛莫•貝 納茨(2017)研究了“多屏幕”時代的消費者心理和行為,指出精準使用的媒介資 源將會為企業創造新的商業機會[12]。
2.國內研究現狀
(1)精準營銷國內推進情況
國內關于精準營銷的研究雖然起步比國外晚,但卻一直在穩步推進。尹啟華等 (2017)探討了精準營銷的起源、概念、特征及理論基礎,分析了企業實施精準營 銷的策略、途徑以及存在的問題[13]。這篇文章以理論梳理、概念總結、宏觀行業分 析等形式,對國內早期精準營銷的研究進行了概括和總結。
近年來,精準營銷的研究緊跟我國經濟環境的發展,呈現出了研究內容多樣化、 [] 研究方法現代化、研究成果實用化等特征。在研究內容方面,以電商為背景的研究 已經成為主流。李靜(2017)比較全面的總結了基于大數據的網絡精準營銷策略, 對大數據精準營銷的概念進行了界定,歸納總結了傳統網絡營銷存在的常見問題, 并分析了大數據精準營銷對于傳統網絡營銷的促進意義,最后提出了基于大數據精 準營銷的常用策略[14]。阿布都熱合曼•阿布都艾尼和妮魯帕爾•艾山江(2017)從 電商企業的數據持有和數據安全的角度,研究了電商企業的在精準營銷領域的制約 和困擾[15]。在研究方法方面,大數據、人工智能的運用越來越多。蘇翠華和熊婷 (2020)研究了使用中文文本分析、SIFT圖片處理、PGBN深度學習模型等新技術 進行用戶畫像模型訓練與構建的方法[16]。趙會群,李子木等(2019)研究了一種基 于貝葉斯網絡的預測推薦算法,通過構建用戶行為的先驗概率計算可能產生消費的 后驗概率。研究通過對信用卡APP的真實瀏覽日志的數據測試,驗證了該算法相比 傳統營銷模型有著較高的準確性[17]。
(2)圍繞用戶的研究
用戶管理是精準營銷的重點,特別是在以B2C模式為主的電商營銷領域,營銷 的最終對象就是終端用戶,因此圍繞用戶的研究從來就沒有停止過。近年來,用戶 畫像是精準營銷中最常提到的一個概念,相比于4C理論和市場細分理論中提及的用 戶細分,基于用戶自身數據和行為特征數據生成的用戶畫像系統展開的營銷活動會 更加的精準。曹鳳芹和張華欣(2020)從用戶畫像的構建、精準營銷系統的設計、 產品廣告的精準推送等幾個方面,研究了基于用戶畫像系統的精準營銷策略[18]。黃 位華和范欣(2021)從系統實施層面介紹了基于用戶興趣模型和標簽規則系統建立 的精準營銷推送模型,該系統使用Thrift框架接口實現了一個高性能和低時延的系統 推送,并且通過仿真模型證明了系統的精確度和穩定性[19]。
(3)圍繞傳播媒介的研究
隨著移動互聯網的發展,新興媒體已經成為了精準營銷的主流渠道,傳統廣告 媒體的下跌趨勢正在加速。黃歡(2017)研究了基于微信公眾號的幾種常見營銷形 式。他認為,傳統的大眾媒介傳播是一種“共性的”和“模糊的”的傳播,僅對受 眾加以大致區分,做不到“精準”。而基于微信公眾號的廣告傳播,可以通過微信 后臺對粉絲屬性的準確分析,做到基于用戶個性化需求的、量身定做的信息傳播閔。 胡映佳和盧揚帆(2020)研究了基于社交媒體的精準營銷策略,他們的文章闡述了 基于社交媒體在訪問量、曝光率、關聯信息、搜索引擎等方面對銷售渠道的賦能, 可以更加完善的實現客戶關系管理、洞察消費需求、提供購買決策,強調了社交媒 體平臺對搭建精準營銷框架的重要作用旳。
1.2.2服裝營銷 []
1.國外研究現狀
( 1 )消費者影響因素的研究
瑪麗琳•霍恩(Marilyn J. Horn)是較早開始服裝營銷研究的代表人物,她于 1975年出版了《服飾:人的第二皮膚》(The Second Skin) 一書。她在書中指出 了六個影響個體消費者選擇服飾的因素,即社會文化因素、美學原則因素、人體特 質因素、行為因素、心理因素和市場環境因素[22]。這六個因素成為后期進行服裝營 銷客戶細分研究的基礎。MS Soniya,S Sudhamathi (2021 )的研究采用數據分析的 方法,對 15 個潛在的影響服飾購買的因素進行了評估和分析,發現價格和群體分類 是影響最大的兩個因素,并建議企業基于用戶細分進行營銷策略的制定[23]。
(2)品牌傳播渠道的研究
格威妮絲•穆爾(Gwyneth Moore) (2015)的研究發現數化渠道為服裝的營銷 與推廣提供了新的機遇。研究從服裝品牌對消費者的信息傳遞方式著眼,闡述了企 業如何通過數字化渠道使目標客戶和潛在消費者可以更加有效的了解品牌、設計理 念、產品以及服務。和傳統方法相比,數字化渠道是為品牌與客戶的互動打開了一 種全新的方式。研究還介紹了有關社交媒體營銷和對行業趨勢的預測方法,例如影 響因素分析和搜索引擎優化等[24]。文迪•本多尼(2017)進行了社交媒體平臺和服 裝營銷行業的整合研究,并指出為了更好的讓用戶了解品牌,服裝企業應當采用新 的基于數字化的媒體營銷工具,并制定數字化的營銷策略和增長目標[25]。
2.國內研究現狀 我國在服裝營銷領域的理論研究起步較晚,但發展迅速,特別是依托于我國在
電子商務領域的規模優勢,國內的研究更加的本地化,案例研究也更加貼合實際, 對業界普及和推廣有著較強的借鑒意義。
(1)服裝營銷理論研究在國內的推進情況 我國建國初期以計劃經濟為主體的經濟運行模式,使得服裝紡織行業的發展始 終受到國家計劃調控的影響,與自由市場的發展模式相比,理論研究的基礎相對薄 弱。從 80 年代后開始,隨著改革開放大幕的拉開,一些學者和企業家開始了服裝市 場營銷理論方面的研究。從發展的過程來看,大概可以分成以下四個階段:第一是 萌芽階段, 20世紀80年代開始,我們的經濟發展結束了數年的動蕩,開始了改革開 放的步伐。這期間的研究主要集中在對西方理論的學習和研究上;第二階段是探索 階段,進入 20 世紀 90 年代,隨著改革開發的深入,有更多的學者投入到服裝營銷 研究中來,涌現出了一大批優秀的研究成果;第三階段是多元化發展階段,進入 21 世紀初期,我國的改革開發效果已經開始顯現,在服裝領域,我國的服裝生產不僅 滿足了國內的需求,還開展了大規模的出口代加工業務。這期間的研究已經逐步開 始多元化、精細化和本土化;第四階段是數字化營銷階段,進入了 21 世紀的第二個
6
十年,電商和互聯網產業水平取得了長足的進步,互聯網營銷的優勢已經得到了公 認,各行各業紛紛開始“觸電” 。在這一背景下,很多學者都圍繞著“電子商務” 、 “互聯網”、“大數據”和“精準營銷”等關鍵詞展開了各式各樣的研究。
( 2)數字化服裝營銷
隨著數字化時代的到來,傳統的服裝營銷策略已經難以適應新的營銷環境,服 裝營銷數字化轉型勢在必行。
郭賢仁(2021)圍繞服裝品牌數字化營銷進行了研究。他的文章指出了大多數 企業在服裝營銷數字化轉型中存在的問題,然后闡述了基于數字化營銷環境下的服 裝品牌的有效營銷策略,并以“李寧”為例,介紹了其使用新媒體手段實現精準營 銷的案例[26]。梁道雷,鄭軍紅等(2018)研究了“互聯網+”服裝定制營銷的發展現 狀以及存在的問題,分析了大數據對服裝行業定制營銷的意義,并設計出了一種實 用性較強的服裝定制智慧營銷平臺。該平臺的技術架構包含了客戶畫像、精準營銷、 流行趨勢分析、智能推薦和服裝搭配、線上線下數據融合等大數據營銷技術,最后 還提出了融合線上線下的服裝定制營銷策略[27]。王蕓蕓和陳姍姍等(2017)從服裝 產業和數字化技術的融合開始,對數字化技術在服裝產業中的應用現狀進行了分析, 提出了數字化的服務營銷要以優化消費者的購物體驗為主要工作目標。他們還介紹 了幾種常見的數字化營銷技術在服裝行業中的應用,并對不同類別的數字化技術的 發展趨勢進行了總結和敘述[28]。
1.2.3 數據挖掘技術
數據挖掘一直是一個比較熱門的研究方向,并且在各個行業、各個領域都有廣 泛的應用。
1.數據挖掘的起源
數據挖掘(Data mining) 一詞最早見于邁克爾•洛弗爾(Michael Lovell)于 1983年發表的《Data Mining》一文,其本意是一個貶義詞,用來批評那種沒有先驗 假設的數據分析行為。與之同時出現的含有批判性的詞匯還有 data fishing、 data dredging 和 data snooping 等[29]。
在學術界,多數學者認為有關數據挖掘的研究始于 1995 年的“第一屆數據挖掘 和知識發現國際會議” ( First International Conference on Data Mining and
Knowledge Discovery),其中的分論壇 KDD (Knowledge Discovery in Database) 就是專門討論與數據挖掘相關的議題。時至今日,KDD國際會議已經成為數據挖掘 方面最高質量的會議。
2.發展歷程
數據挖掘的發展大致經歷了四個階段:
( 1 )數據收集與整理階段
數據挖掘相關的工作可以追溯到 20 世紀 60 年代,這個階段主要的工作是數據 的搜集整理。由于這個階段計算機的存儲能力有限,存儲成本很高,因此這個階段 主要解決的主要問題是數據的搜集整理與存儲,而且主要是針對靜態數據,數據的 展示也比較單一。其所解決的問題主要是基于歷史數據進行的統計分析,例如“現 在的銷售額和過去三年相比增長了多少?”等類似的問題。雖然從今天來看,這些 都是很簡單的商業問題,但在當的時代背景下這卻是一個很了不起的事情。
( 2)數據訪問階段
20 世紀 80 年代是數據訪問階段,其背景是關系性數據庫( RDBMS, relational database management system) 的誕生和結構化查詢語言(SQL, structure query language)的出現,這使得即時的數據查詢與結果展示成為現實。人們可以使用這一 新技術來解決一系列較為復雜的數據運算問題,如“匯總重慶某地區過去 12 個月的 銷售額,并按從大到小的順序排列”。這些分析活動,其實已經是初級的數據挖掘 的活動,正是從這個階段開始,數據挖掘活動逐步開始了發展,并受到了越來越多 的關注。
( 3 )商務智能階段
20 世紀 90 年代是商務智能階段( business intelligence) ,其標志是數據倉庫系 統(data warehouse)和在線分析系統(OLAP, online analytical process)的出現。 0LAP 與數據倉庫技術的出現,使得多層次、多維度的數據回溯與動態分析成為可 能,基于數據倉庫系統生成的數據分析報告,為經營決策提供了數據支持,使商業 決策由“經驗驅動(experience driven)"變成了 “數據驅動(data driven)"。
(4)大數據與人工智能階段
進入 21 世紀,隨著計算機軟硬件技術的發展,計算機的計算能力和存儲能力有 了大幅提升,使得海量數據儲存和計算成為可能。 2004 年,谷歌發表了三篇著名的 大數據論文《The Google File System》、《MapReduce: Simplified Data Processing on Large Clusters》、《Bigtable: A Distributed Storage System for Structured Data》, 這三篇論文奠定了大數據技術發展和研究的基礎。受 Google 的論文啟發, Doug Cutting和Mike Cafarella同共開發出了 GFS分布式文件系統,解決了海量數據存儲 的問題,它也是后來的Hadoop Distributed File System(HDFS)的前身。2005年2月, Mike Cafarella開發出了分布式計算引擎MapReduce,成功的解決了海量數據的計算 問題。到 2006 年 Hadoop 項目正式啟動,這成為了計算機技術發展的一個爆點,全 世界的學者和開發人員都在為這個項目貢獻力量。之后又相繼出現了計算速度更快、 實時性更高的 Spark、 Flink 等技術。大數據技術的發展同時也帶動了數據分析、機 器學習和人工智能等技術的興起。 2016 年, AlphaGo 橫空出世,擊敗了人類最優秀的圍棋選手李世石,再次引爆了大數據和人工智能發展。大數據和人工智能技術開
始為各行各業的提供服務,有些甚至從根本上顛覆了行業的發展。
其整體發展過程和各階段主要特征如圖 1.2 所示。
人工智能
商務智能 階段
數據特點
技術支持 數據收集 整理階段
I960年代 數據訪問 階段
1980年代 階段
1990年代 2020至今
凰共靜態數據 信息 動態數據查詢 多維度、多層 次的數據查詢 人工智能、機 器學習,預測 分析
大型機、打空 卡片、磁盤、 磁帶機 關系型數據 庫、 冷構化查詢語 城倉庫,
OLAP 分旅儲存和 計算、智能算 法
典蚯用 靜態數據呈現 動態數據分析 商務智能,決 策支持 預測”相關性 分析,聚類等
圖 1.2 數據挖掘技術的發展歷程
3.數據挖掘技術在服裝電商領域的應用 數據挖掘技術在各行各業有著廣泛應用,例如金融、醫療、保險、電子商務和 電信等。以下是數據挖掘技術在服裝電商領域的一些典型應用場景:
(1)客戶市場細分 根據客戶的基本資料、商品銷售數據以及客戶行為數據等,利用有效的算法或 者規則定義,將客戶進行有效地劃分,使得具有相同特征和購物偏好的客戶分為一 組,然后對每一組客戶進行有針對性的營銷活動。
( 2)關聯規則分析
根據對用戶購物車數據的分析,運用apriori、FP-growth等相關算法,發現隱藏 的商品關聯規則,然后對有類似商品購物記錄的用戶推薦相關產品,以提升產品銷 量。經典的啤酒加尿布濕的故事就是關聯規則的典型案例。
(3)客戶流失預警 根據客戶屬性、購物記錄、行為數據等,運用特征學習和預測分析等數據挖掘
技術,找到與流失客戶有相似特征有用戶,并針對這部分用戶開展有針對性的彌補 或者喚醒活動,例如發送促銷提醒、發放優惠卷等,從而起到避免客戶流失的作用。
(4)客戶價值分析
根據相關數據,運用適當的價值模型,如RFM模型,找出重點客戶,然后對重 點客戶開展最優質的服務和最有價值的商品推薦,以達到提高用戶價值,提升客戶 忠誠度的目的。
1.2.4文獻評述
精準營銷理念源自于激烈的市場競爭,它從誕生之初就跨越了多個學科的內容, 包括管理學、消費心理學、統計學等。在進入移動互聯網時代后,精準營銷的內容 又有了新的發展,已經從上述范圍又擴展到了大數據、數據分析、人工智能等領域。 國內外學者的研究也印證了這種發展趨勢。從近兩年發表的文獻上可以看出,學者 的研究基本上全部涉及到了統計分析、數據挖掘、機器學習和人工智能等方面的內 容。可見,精準營銷相關的內容和知識一直在不斷的發展完善中。從本文通過對文 獻的梳理和研究,認為目前精準營銷在以下幾個方面還存在探索和發展空間:
1.目前很多的研究是從精準營銷的某一方面展開的,比如有的研究偏重用戶細 分、有的研究偏重傳播媒體、有的研究偏重個性化推薦,但是對精準營銷全流程的 研究還比較少,比如用戶細分和個性化推薦系統分別處于精準營銷的哪個環節,它 們之前的互相作用如何,以及怎樣配合才能達成最好的效果等。有關這方面的研究 在本文的文獻梳理過程中還沒有看到。
2.多數研究還是偏理論,其中雖然有框架和方法的介紹,但可操作性不強,比 如多數研究都提到要對營銷的效果進行定性和定量分析,但是有哪些定性和定量分 析方法可以使用,在分析過程中應該收集哪些數據、如何收集數據等等,類似這種 的可操作性和指導性較強的研究還比較少。
3.由于互聯網和人工智能的技術手段非常多,導致了在解決同一個營銷問題時 可能會出現很多個不同方法的研究,例如有關用戶畫像的研究,有的學者推薦使用 人工分類的方法建立標簽,有的學者有推薦使用機器學習的方法建立標簽,但沒有 一個研究把這些方法進行總結,并對何種情況下運用何種方法來進行一個歸納性的 全面研究。
4.結合服裝行業的特點展開的研究還比較少,例如影響服裝行業營銷結果的因 素非常多,有季節因素、地域因素、人口結構、流行趨勢等,這些因素都會對營銷 的效果有所影響。如果服裝企業能夠正確識別這些因素,而且能夠運用并將其轉化 成為具體的營銷活動,那么將會對企業的營銷效果產生積極的影響,但目前有關這 方面的研究還比較少。
1.3 研究內容與研究方法
1.3.1研究內容
本論文研究的內容是“數據挖掘+精準營銷",并選取了 AD 公司為研究對象, 研究了該公司是如何運用數據挖掘和人工智能等相關技術來幫助企業解決營銷問題, 實現利潤增長的案例。
10
本文的主要內容結構編排如下:
1.緒論:主要介紹研究的背景、相關理論文獻、研究目的和研究意義。首先介 紹了我國服裝行業在電商領域的發展歷程和當前現狀,然后對營銷理論、服裝營銷 和數據挖掘等相關內容進行了文獻梳理和評述,最后介紹了本文使用的研究方法和 技術路線。
2.相關理論基礎:主要以理論研究為主,分別介紹了經典的市場營銷理論和主 流的數據挖掘技術。營銷理論部分,主要介紹了 STP 理論、 4P 營銷組合策略、 AARRR用戶增長模型。數據挖掘部分主要介紹了 CRM系統、RFM客戶價值細分模 型、 K-means 聚類算法和個性化推薦系統等內容。
3.AD 公司精準營銷現狀及存在問題:首先,對 AD 公司的基本情況進行了介 紹,然后對其所處的行業進行了宏觀環境分析和競爭對手分析;其次,對 AD 公司 的市場營銷策略從產品、價格、渠道、促銷四個方面進行了概述;最后,對 AD 公 司在電商精準營銷方面存在的問題進行了總結,并對問題的原因進行了分析。
4.AD 公司電商精準營銷策略優化:本部分針對第三章所提出的有關 AD 公司 在電商精準營銷領域存在的問題提出了優化方案,并重點介紹了 AD 公司如何運用 RMF 模型、 K-means 聚類算法、用戶增長模型、個性化推薦系統等數據挖掘和數據 分析相關技術和手段,幫助企業提高精準營銷效果的案例。
5.實施保障和實施效果:介紹了 AD 公司為確保電商精準營銷優化策略能夠順 利實施而采取的一系列保障措施,包括理念保障、組織保障和財務保障。在實施效 果部分,通過對 AD 公司實施“數據挖掘+精準營銷”的前后的數據對比,對實施效 果進行了評估。
6.結論和展望:對本文的內容進行了總結,并對本文在寫作過程中存在的一些 不足進行了思考,希望能夠得到各位老師的指導和幫助。
1.3.2研究方法
在本文的研究過程中主要用到了以下研究方法:
1.文獻研究法:通過查閱精準營銷、服裝營銷和數據挖掘的相關書籍和文獻, 對現有的理論和方法進行深入學習,在理解相關理論和方法的基礎上,進一步學習 和總結其優缺點,為后續部分的寫作做準備。
2.案例分析法:通過對 AD 公司案例的研究,對該公司如何建立個性化推薦系 統,如何運用RFM模型和K-means算法進行客戶細分,以及如何制定和實施精準營 銷的全過程進行了研究和分析。
3.定量分析法:通過采集 AD 公司的客戶數據和營銷數據,開展數據統計分析 和建模分析,并以分析結果為依據開展客戶細分和營銷效果的分析和評估工作。
2相關基礎理論
2.1精準營銷
2.1.1 STP 理論
STP理論源自于經典的市場細分理念。1956年,美國營銷學家溫德爾•史密斯 (Wendell • Smith)提出了 “市場細分”的概念,他指出企業應該根據消費者的不 同需求,對消費者市場按照某種標準進行有效的劃分,并針對不同的消費者子市場 開展有針對性的市場營銷活動,從而滿足不同子市場內的顧客的需求和欲望。之后, 菲利普•科特勒又在此基礎上對該理念進行了進一步的完善和發展,并最終形成了
“ STP 理論”。 STP 是 Segmenting 、 Targeting 、 Positioning 三個英文單詞首字母縮寫, 分別代表了“市場細分”、“目標市場”和“市場定位”。
STP 理論認為,有效的市場營銷活動應該包含三個步驟(如圖 2.1 所示),分 別是:市場細分(Segmentation),即對消費者市場按照某個標準進行有效的劃分; 目標市場(Targeting),即在有效市場細分的基礎上,根據自身產品和服務的特點 選定合適的目標客戶群體;市場定位(Positioning),即企業通過產品和服務,在目 標消費者的心目中樹立起自己產品的品牌價值,使用戶對產品和服務產生忠誠度。
圖 2.1 STP 理論中的三個步驟
如上圖所示, STP 理論中所描述的市場細分、目標市場和市場定位這三個部分 是環環相扣、層層遞進的關系:有效的市場細分為后續的目標市場的選擇提供了基 礎;當選定了目標市場后,就需要根據當前目標市場的情況,結合自身產品的特點 開展有效的市場營銷活動;通過產品和服務以獲得用戶的認可,并建立客戶忠誠度, 樹立產品品牌價值。
近年來,隨著大數據技術的發展,為經典的 STP 理論提供了更加豐富的適用場
13 景。利用大數據技術天然的存儲和分析數據的優勢,可以更加方便、快捷、有效的 開展 STP 理論相關三個步驟的實施。對于服裝營銷而言,合理使用大數據技術,可 以使企業更加方便的對消費者數據進行存儲和分析,從而更加高效的開展市場細分 活動;通過對消費者的消費數據展開分析,可以更加精確的掌握消費者在特定期間 內的購物情況,包括購物的頻次、消費金額、購買產品的分類等,并以此為依據開 展市場細分;利用數據挖掘技術,對消費者的購買記錄、瀏覽情況進行分析,可以 推測消費者的興趣愛好,可以實現有針對性的商品推薦;對不同的消費者進行有針 對性的客戶服務,可以提高客戶存留,培養客戶忠誠度。
2.1.24P 理論
I960年,杰瑞•麥卡錫(Jerry McCarthy)在其著作《營銷學》一書中首次提出 了 4P理論。4P理論是本質是一種營銷手段組合策略,是將產品(Product)、價格 (Price)、渠道(Place)、促銷(Promotion)等營銷手段以不同的方式進行組合, 從而產生不同的營銷效果。
根據4P理論,企業開展市場營銷活動包含四個核心要素(如圖2.2所示):產 品(Product),這是開展市場營銷活動的首要因素,任何企業開發的產品或服務都 要以滿足消費者的需求、迎合消費者的欲望而產生;價格(Price),企業要根據自 身的產品特點、品牌價值和市場定位等因素,針對不同的市場細分和目標消費者群 體,制定出有針對性的價格策略;渠道(Place),即企業生產的產品或服務,通過 不同的銷售方式或者銷售場所,最終送達到消費者手中的過程。例如,目前的服裝 銷售渠道,在保留一定數量的線下實體店的同時,也在通過網絡銷售渠道開展銷售 活動,并且網絡銷售所占比重正在日益增加;促銷(Promotion),即企業通過打折、 送購物券等形式多樣的促銷活動,來刺激和吸引消費者的購買欲望和購買行為。
企業在運用 4P 理論開展市場營銷的活動中,不應該只從某個單獨的要素出發, 而是應該對以上四個要素進行全面的整合,制定出全局性的相對最優策略。合理運 用大數據和數據挖掘技術,可以幫助企業更好的實現以上四個要素的整合。對于服 裝企業而言,首先,通過數據挖掘技術,可以使企業更好的了解消費者的需求,并 以此為依據開展企業產品或服務的升級與研發;其次,通過數據挖掘,企業可以對 消費者的價格偏好和價格承受能力展開分析,并據此對消費者群體進行細分,再對 不同的群體制定不同的定價策略;再次,通過對不同渠道的銷售數據展開分析,企 業可以分析出每個渠道的特點,可以幫助企業制定最優的渠道策略;最后,利用大 數據技術,可以更加有效的開展個性化的促銷活動,特別是對精準廣告推送和優惠 券發放提供技術支撐。
2.1.3 用戶增長模型
AARRR模型也稱作“海盜模型”,由硅谷創業專家Dave McClure于2007年提 出,該模型被稱為“實現用戶增長的秘密武器”。該模型包含 5 個重要部分:用戶 獲取( Acquisition) 、 用 戶 激活( Activation ) 、 盈利( Revenue) 、 用 戶 留存 (Retention)和用戶推薦(Referral) [30]。
用戶獲取(Acquisition)即獲取新用戶,讓那些還不知道公司產品的客戶能夠了 解到公司的產品或者服務,進而獲得這部分用戶的關注。獲取新用戶的渠道有付費 渠道和免費渠道。付費渠道主要是各種各樣的廣告營銷;免費渠道主要是商家通過 自 有渠道進行的營銷活動, 如郵件營銷、內容營銷和口碑營銷等。 用戶激活 (Activation)是指在獲取新用戶之后,通過一系統的產品宣傳、促銷活動、價格調 整等營銷組合手段,使用戶能夠更進一步的了解產品特性、發現產品價值、激發潛 在購買欲望的過程。用戶激活的關鍵是讓用戶能夠感受到產品價值、及時解決用戶 的問題、消除用戶的顧慮,以避免用戶的流失。盈利(Revenue)即用戶變現,簡單 來說就是企業通過把商品賣給消費者實現現金收入的過程。盈利的關鍵因素之一就 是使用戶與企業發生交易,通過交易企業才能將商品轉化為現金流,才能真正實現 用戶從流量到現金的轉化。用戶留存(Retention)是指用戶在與企業產生首次交易 后,企業通過自身的機制或者活動,使用戶能夠長期保持和企業的交易活動。這里 的機制包括企業對產品或者服務的設計,比如蘋果公司把手機賣給消費者后,還可 以通過應用商店、云存儲服務等產品和服務繼續與用戶保持互動,實現收入。一般 來說,用戶留存的時間越長,用戶群體規模就越大,企業的利潤和現金流就越高。
15 用戶推薦(Referral)是企業使用某種方式鼓勵現有用戶向其他人進行產品和服務的 傳播,以吸引更多的用戶,形成新的流量。用戶推薦是成本最低的流量獲取方式, 主要包括有免費傳播和有償傳播兩種類型,具體包括口碑傳播、朋友邀請、有償推 薦、網絡社區傳播等。
AARRR模型的每一步都是首尾相接的,由于從一個階段流入下一個階段的人數 是逐漸減少的,因此AARRR模型通常也用漏斗模型來表示,如圖2.3所示。
圖 2.3 AARRR 漏斗模式(圖片來源:百度百科)
2.2數據挖掘技術
2.2.1 CRM 系統
客戶是企業開展現代營銷活動的重要資源,如何保持現有客戶并且吸引更多的 新客戶,對企業的生存和發展至關重要。因此,終端客戶的爭奪就成為了企業之間 相互競爭的重點。企業的經營理念也由開始的以“產品”為中心轉向以“客戶”為 中心。在這種背景下,高效、有序的客戶管理就成為企業工作的重點,于是“客戶 關系管理(Customer Relationship Management, CRM)"系統便應運而生。客戶關 系管理本質上是一種企業運營模式,這在種模式下的企業運營活動緊緊圍繞著“客 戶”展開[31]。現代化的客戶關系管理充分結合了信息技術的優勢,在對客戶數據進 行深入研究和分析的基礎上,針對不同特點的客戶群制定出相應的營銷策略,以達 到提高客戶滿意度,改善客戶關系,實現客戶價值最大化的目的。
在眾多客戶關系管理活動的實踐過程中,數據挖掘技術已經得到了廣泛的應用, 特別是對大量用戶數據進行探索,發現其中的隱藏規律,為企業制定營銷策略提供 數據支撐等方面,數據挖掘技術都發揮著重要作用。信息獲取是CRM系統的首要功 能, CRM 系統的重點是客戶價值發現,而客戶價值發現的前提就是要有高質量的客
16
戶數據作為基礎,因此客戶信息的收集是第一步,也是至關重要的一步;其次是信 息的挖掘,只有從數據中挖掘出有意義的信息才能體現CRM系統的價值。對數據的 挖掘需要使用到的技術有很多,除了要用到基礎的統計分析、預測分析外,還需要 結合決策支持系統、專家系統、神經網絡等手段對潛在規則進行挖掘和發現,并通 過建立數學模型對規律進行歸納和運用;最后是價值的變現,通過客戶數據的挖掘, 區分出不同價值層次的客戶群,再針對不同的群體制定不同的營銷策略,通過提供 有效的產品和優質的服務來為企業創造更多的利潤。
2.2.2RFM 模型
對企業來說,滿足所有客戶的需求是不現實的,企業應當把有限的資源運用到 高價值的客戶身上,這樣才能物盡其用,事半功倍。要區分出高價值客戶就要對客 戶群體進行細分,這是客戶關系管理中最重要、最基礎的工作[32]。客戶細分可以從 多個角度展開,其中從客戶價值生命周期的角度進行細分,是最常用的一種方法, 這種方法可以使企業找到最有價值的客戶,并有針對性的制定促銷策略、提供更個 性化的服務,使企業以合理的投入獲得最大的回報。另外,識別出有價值客戶的具 體特征后,就可以幫助企業在市場活動中發現并積極爭取這類客戶。
RFM模型是目前公認的進行客戶價值細分的最有效的方法之一。經典的RFM模 型最早由Arthur Hughes于1994年提出。RFM分別是“新近(Recency)”、“頻率 (Frequency ) ”、“貨幣價值(Monetary ) ”三個單詞的英文首字母縮寫。R (Recency)是指最近一次購物到現在的時間長度,該值越小就代表顧客的新鮮程度 越高,而且再次購買的可能越大;F (Frequency)是指在特定分析時間窗口內的總 計購買次數,該值越大說明顧客的購買頻率越高,顧客的忠誠度就有可能越高,顧 客的價值也就有可能越大;M (Monetary)是指在特定分析時間窗口內客戶的總消 費金額,總金額越高說明顧客的忠誠度越高,顧客的價值就越大。 RFM 模型在顧客 價值細分和購買預測等領域有著廣泛的應用,原因在于RFM模型有著資料容易搜集、 計算邏輯簡單、適用場景比較廣泛等優點,特別是RFM模型的這三個屬性對模型推 理結果有著非常好的解釋能力。但它也有一定的局限性,主要表現在確定模型三個 屬性的權重方面,多采用專家判斷的方法,這種會有一定的主觀判斷因素,可能會 對最終分析結果的客觀性有一定的影響[33]。
RFM模型在客戶價值細分方面的運用如圖2.4所示。
2.2.3K-means 聚類方法
K-means算法最早由MacQueen于1967年提出,它是聚類(clustering)算法的 一種,也是一種最簡單高效的無監督(Un-Supervised)學習算法。K-means算法的 基本思想是首先指定分簇的個數k,然后隨機選取k個點作為聚類的初始中心,再計 算其余每個點與各個中心點之間的距離,并將距離最近的點分配到聚類中心點形成 一個簇。然后再不斷的重復這個選擇中心點、計算距離、重新分配簇的過程,直到 滿足某個終止條件為止。終止條件包括沒有對象可以被重新分配、聚類的中心點沒 有再發生變化等。
K-means 算法的具體步驟為:
1.隨機選擇k個點作為初始聚類中心
2.計算其它每個點到各個聚類中心的距離,將距離最近的點分配到這個聚類中 心點,形成一個簇
3.對每個新形成的簇,重新計算它的中心點(平均距離中心)
4.重復以上2、 3兩步,直到滿足中止條件(中心點不再發生變化) 整個過程如圖 2.5 所示:
對于點之間距離的計算方法,常用的計算方法有歐氏距離(Euclidean Distance),馬氏距離(Mahala Nobis distance)等算法,其中用的最多的是歐氏距 離,原因是算法簡單,計算速度快。歐氏距離的計算公式如式(2-1)和式(2-2) 所示:
( 1)二維空間公式:
P =丿任1 一牝)2 + (為一乃)2,〔X| = + y2 式(2T)
其中,卩為點(心,為)與點(x2,y2)之間的歐氏距離;lx|為點(x2,y2)到原點的 歐氏距離。
( 2) N 維空間公式:
d(x, y) = 7(x1 — ^1)2 + (x2 — 72)2 + + (xn — yn)2
n
(Xi - yd2 式(2-2)
i=1
由于 K-means 算法具有過程容易理解、算法復雜度低、簡單高效、聚類效果好 等特點,因此有著很多的應用場景,精準營銷中的用戶市場細分就是經典的 K- means算法應用場景之一。本文后續介紹的AD公司的用戶分群也用到了 K-means算 法。
2.2.4 個性化推薦系統
推薦系統(Recommender System)屬于信息過濾系統的一個子類,通過數據挖
19
掘和機器學習等技術手段,對用戶數據進行收集、加工和整理,同時對用戶的興趣 和愛好進行挖掘,進而為用戶提供更加個性化的推薦服務。
推薦系統可以根據其采用的不同算法分可以分為以下幾類(如圖 2.6所示):
圖 2.6 推薦系統分類
協同過濾是推薦系統中運用最為廣泛的技術。協同過濾不是一種具體的算法, 而是一種思想體系,有多種算法和模型可以實現這種思想體系。協同過濾的基本思 想是利用集體智慧進行信息過濾,它基于三個基本假設:①“物以類聚,人以群 分”;②相似的用戶會產生相似的行為;③過去發生的行為在未來會同樣發生。基 于以上假設,協同過濾根據大量的用戶(物品)歷史行為數據,計算用戶(物品) 之間的相似度和相關性,然后再基于這些關聯性為用戶進行算法推薦。
協同過濾可以分為基于記憶(Memory-based)的協同過濾和基于模型(Modelbased )的協同過濾。基于記憶的協同過濾又稱為基于領域的協同過濾 (Neighborhood-based CF),是將整個數據集存儲在內存中,在推薦時,通過直接 在內存中查找相似的用戶或項目的記錄以給出推薦列表。基于領域的協同過濾又可 以細分為基于用戶的協同過濾(User-based CF)和基于項目的協同過濾(Item-based CF)。前者的推薦路徑是通過用戶到用戶再到物品,即U2U2I,后者的推薦路徑是 通過用戶到物品再到新的物品,即U2I2I。基于模型的協同過濾需要預先訓練出一個 抽象模型,在推薦時,根據推薦模型計算出推薦列表。這一類算法主要有:聚類模 型(Clustering Model)、隱語義模型(Latent Semantic Models)等,常用的矩陣分解 (Singular Value Decomposition)就是隱語義模型的一種[35]。
使用協同過濾技術給出的推薦結果具有比較好的個性化和新穎性,即給出的推 薦結果通常會包含一些用戶從來都不知道的物品,也就是長尾物品。但這種技術過 度的依賴于用戶的歷史行為數據,數據越多,越容易進行計算。但對于一些新用戶 本身還沒有產生任何行為數據就無法進行推薦,這就是“冷啟動(cold start) ”問 題。同時隨著平臺用戶和物品的增多,推薦的性能也會有所下降。
高校學術論文網提供專業的碩士畢業論文寫作、畢業論文輔導寫作、博士論文寫作發表、碩士論文寫作發表、SCI論文寫作發表、職稱論文寫作發表、英文論文潤色的服務網站,多年來,憑借優秀的服務和聲譽贏得了社會的廣泛認可和好評,為畢業生解決寫論文的煩惱