推薦期刊
在線客服

咨詢客服 咨詢客服

客服電話:400-7890626

咨詢郵箱:[email protected]

農業論文

基于KNN算法的農產品電商精準營銷的研究

時間:2019年07月06日 所屬分類:農業論文 點擊次數:

摘要:近年來,隨著大數據、云計算、人工智能等技術的逐漸成熟與落地,互聯網電商蓬勃發展,企業在電商方向上的營銷理念和方法已與傳統營銷的理念和方法截然不同,其依托于現代技術發生了革命性的變化,基于大數據與人工智能的客戶精準營銷已成為主流,而基

  摘要:近年來,隨著大數據、云計算、人工智能等技術的逐漸成熟與落地,互聯網電商蓬勃發展,企業在電商方向上的營銷理念和方法已與傳統營銷的理念和方法截然不同,其依托于現代技術發生了革命性的變化,基于大數據與人工智能的客戶精準營銷已成為主流,而基于互聯網電商的農產品精準營銷由于其自身的特性目前還處于研究探索階段,本文主要研究基于某農產品電商平臺提供的農產品銷售數據,針對購買者的個人信息如所處地域、職業等,以及行為偏好采用改進的K近鄰算法對用戶進行分類,從而達到農產品電商精準營銷的目的。

  關鍵詞:K近鄰算法;機器學習;大數據;農產品電商;精準營銷

農村經濟與科技

  消費者在電商平臺的日常消費中積累了海量數據,包括了消費者的地域、性別、年齡、行為習慣、個人偏好等,這些數據可以幫助我們為消費者進行消費預測行為分析,從而動態的感知到消費者將進行的消費活動,從而推動消費升級。這與傳統營銷的方法相比,在降低社會成本的同時,極大的提高了效率和準確率,對農產品電商的精準營銷具有重大意義。本文基于人工智能機器學習的KNN算法實現了對目標用戶進行購買品類、購買意向多維度分類,從而助力于農產品電商的精準營銷,促進農產品電商產業的發展。

  一、農產品電商精準營銷及其研究現狀

  現階段農產品電商精準營銷是通過對消費者在電商平臺進行購物留下的數據的全面分析,挖掘出海量數據中所包含的消費者的性別、地域、收入水平、消費習慣、個人偏好等信息,從而準確預測出消費者未來的消費行為,并制定出一對一的動態的營銷策略以滿足消費者需求。隨著互聯網技術的發展,目前業界在解決精準營銷問題時是通過使用Hadoop、Spark等分布式數據處理框架對電商平臺上的海量用戶數據進行挖掘、清洗,并使用機器學習算法對經過處理后的有價值的數據進行處理,找出數據中蘊含的知識和規律,得到模型,并將其應用到對未來獲取到的數據的分析及預測中。

  二、KNN算法在電商農產品精準營銷上的應用

  本文提出一種基于KNN算法的電商農產品精準營銷預測解決方法,即對用戶行為進行漢明編碼,然后計算用戶之間的距離,從而對用戶未來的農產品消費行為進行預測,實現了將KNN算法應用在農產品電商精準營銷這一特定的業務場景下,且較之于傳統的數據分析預測方法,具有更高的決策準確率和決策效率,更加智能化。

  (一)數據預處理

  本文通過問卷調查形式獲取了1000組用戶性別、年齡、個人偏好、是否購買過以及消費意向、消費者之間關系、地域等數據,對用戶是否具有購買魚的意向這一消費行為進行預測。本文結合具體營銷場景篩選具有代表性的特征作為研究使用數據集,其中字符’Y’表示肯定,字符’N’表示否定,如此表示是為了降低在數據特征描述時的復雜度。

  (二)數據特征描述

  在KNN算法中,我們可以用漢明距離來度量各個樣本數據之間的距離。在本文的數據樣本中,我們將字符’Y’表示的特征項編碼為1,將字符’N’表示的特征項編碼為0。值得注意的是,結合實際的農產品電商精準營銷,考慮到由于60歲以上的群體在食用魚時具有被魚刺傷到的危險性,故將60歲以上數據樣本中性別這一特征編碼為0,另外,由于中國傳統文化的原因,女性在家庭食材消費上的重要性,我們將數據樣本中性別女這一特征項編碼為1,相對的性別男這一特征項編碼為0。

  因此,我們得到圖一中數據樣本的編碼分別為1111、0110、0111、1101、1010、1011。將用戶的各項特征進行編碼后,便可以計算編碼之間的漢明距離,漢明距離的大小,便能表征各個用戶之間的差異性和相似性。

  (三)KNN特征分類算法的應用

  本文在得到用戶各項特征編碼之后,然后計算各用戶特征項編碼之間的漢明距離。接下來,我們通過實驗的方式,選取出一個合適的漢明距離閾值K來對用戶的購買意向進行預測。在閾值K之內的同一組用戶,我們認為其具有相同的購買意向。

  算法基本流程如下:Step1:計算用戶特征項編碼的距離。計算測試集中給定樣本編碼與訓練集中每個樣本編碼的漢明距離;Step2:漢明距離的排序。將計算出的漢明距離進行降序排序;Step3:選擇給定樣本的K個近鄰:根據排序結果,選擇距離最近的K個樣本作為待預測的樣本的類別,認為他們具有相同的購買意向。K即為上述閾值;Step4:分類的判別。查找出K個近鄰的類別,在此情景下,類別即為是否具有購買意向。然后按照投票的方式決定待分類樣本的類別。

  三、模型設計與測試結果

  (一)農產品電商精準營銷系統框圖本文我們實現了一個基于KNN算法的農產品電商精準營銷系統,研究了農產品電商中特征項的提取及特征項在向量空間上的距離計算。

  (二)實驗測試我們隨機抽取80%的數據作為訓練樣本,剩余20%作為驗證樣本,對基于KNN算法實現電商農產品的精準營銷進行研究。在本文設計的模型中,閾值K的選取對預測精確度起有著明顯的影響。理論上來說,閾值K對預測分類的精確度起決定性的影響,當K越小時,分類邊界曲線越光滑,分類精度越高;K越大分類邊界曲線越平坦,分類精度越低。距離K的選取在本文中變現為閾值K的選取。從實驗結果看來,當選擇閾值K的值為10的時候,本模型具有較高的預測精度。

  (三)實驗結果分析在本文的預測模型中,閾值K的選擇對預測結果起著至關重要的作用。從多次實驗結果來看,當訓練集為800驗證集為200的情況下,閾值K=10時具有較高的預測精度。另外,在農產品電商精準營銷領域的預測模型中,特征項的選取對預測結果的精度有密切的關系。例如,魚這種農產品,消費者的自身屬性以及購買動機是多維度的,非常復雜的。

  在特征項的提取時要注意的是,特征項并不是越多越好,我們要結合社會實際情況對一些特征項進行取舍。每個特征項的編碼也是需要深入研究的地方,要考慮進各個特征項之間的相互影響,此時便需要多位編碼來表征一項特征項了。

  四、結束語

  實驗結果表明,本文設計的電商農產品精準營銷系統模型對消費者的購買意向預測具有較高的精度,可以為企業在其精準營銷中做為決策依據。然而,由于數據樣本的不足,本文的預測模型在特征項提取上還有較大的研究提升空間。

  本文為電商農產品的精準營銷提供了一個可靠的解決方案,同時,也對今后的研究工作重心有所展望:(1)在能夠提供足夠多的數據樣本的前提下,在對特征項的提取上結合農產品電商這一特定領域的實際情況進行進一步的研究。特征項之間的相互影響是存在的,所以本文中將某一特征項編碼為一位在表征特征項之間的相互作用時便顯得不足。特征項的編碼應該是多位的,能充分體現出特征項之間的相互影響的。(2)在計算各特征項編碼的漢明距離之前,如果數據量比較大,我們需要對特征項的編碼進行壓縮,以提升算法的性能。這是在大數據的場景下需要研究的重點問題。

  電商方向評職知識:哪些期刊征稿發表農村電商脫貧論文

  隨著農村經濟的快速發展,農業從業人員也成為了評職的重點人群,而最近就有很多農業人員咨詢哪些期刊能發表農村電商脫貧的論文,小編解答:經濟類,政治政策類,農業發展類文章都是能接收這方面論文的,您可以具體咨詢我們的編輯老師,他們會評估您文章內容是偏向哪個方向,研判適合投稿的期刊,這樣也不會耽誤您評職。

  

战甲危机返水