国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:淺談數(shù)據(jù)分析與數(shù)據(jù)建模相關(guān)問題

      淺談數(shù)據(jù)分析與數(shù)據(jù)建模相關(guān)問題

      2016-05-06 09:06:07來源:金融互聯(lián)網(wǎng) 原標題:鮑忠鐵:淺談數(shù)據(jù)分析和數(shù)據(jù)建模 關(guān)鍵詞:數(shù)據(jù)分析數(shù)據(jù)建模大數(shù)據(jù)閱讀量:34242

      導讀:大數(shù)據(jù)應用有幾個方面,一個是效率提升,幫助企業(yè)提升數(shù)據(jù)處理效率,降低數(shù)據(jù)存儲成本。另外一個是對業(yè)務作出指導,例如營銷。
        【中國智能制造網(wǎng) 學術(shù)論文】大數(shù)據(jù)應用有幾個方面,一個是效率提升,幫助企業(yè)提升數(shù)據(jù)處理效率,降低數(shù)據(jù)存儲成本。另外一個是對業(yè)務作出指導,例如營銷,反欺詐,風險管理以及業(yè)務提升。過去企業(yè)都是通過線下渠道接觸客戶,客戶數(shù)據(jù)不全,只能利用財務數(shù)據(jù)進行業(yè)務運營分析,缺少圍繞客戶的個人數(shù)據(jù),數(shù)據(jù)分析應用的領(lǐng)域集中在企業(yè)內(nèi)部經(jīng)營和財務分析。

      淺談數(shù)據(jù)分析與數(shù)據(jù)建模相關(guān)問題
        
        數(shù)字時代到來之后,企業(yè)經(jīng)營的各個階段都可以被記錄下來,產(chǎn)品銷售的各個環(huán)節(jié)也被記錄下來,客戶的消費行為和網(wǎng)上行為都被采集下來。企業(yè)擁有了多維度的數(shù)據(jù),包括產(chǎn)品銷售數(shù)據(jù)、客戶消費數(shù)據(jù)、客戶行為數(shù)據(jù)、企業(yè)運營數(shù)據(jù)等。擁有數(shù)據(jù)之后,數(shù)據(jù)分析成為可能,企業(yè)成立了數(shù)據(jù)分析團隊整理數(shù)據(jù)和建立模型,找到商品和客戶之間的關(guān)聯(lián)關(guān)系,商品之間關(guān)聯(lián)關(guān)系,另外也找到了收入和客戶之間的關(guān)聯(lián)關(guān)系。典型的數(shù)據(jù)分析案例如沃爾瑪啤酒和尿布、蛋撻和手電筒,Target的判斷16歲少女懷孕都是這種關(guān)聯(lián)關(guān)系的體現(xiàn)。
        
        關(guān)聯(lián)分析是統(tǒng)計學應用早的領(lǐng)域,早在1846年倫敦第二次霍亂期間,約翰醫(yī)生利用霍亂地圖找到了霍亂的傳播途徑,平息了倫敦霍亂,打敗了霍亂源于空氣污染說的精英,拯救了幾萬人的生命。倫敦霍亂平息過程中,約翰醫(yī)生利用了頻數(shù)分布分析,建立了霍亂地圖,從死亡案例分布的密集程度上歸納出病人分布同水井的關(guān)系,從而推斷出污染的水源是霍亂的主要傳播途徑,建議移除水井手柄,降低了霍亂發(fā)生的概率。
        
        另外一個典型案例是第二次世界大戰(zhàn)期間,統(tǒng)計分析學家改造轟炸機。英美聯(lián)盟從1943年開始對德國的工業(yè)城市進行轟炸,但在1943年年底,轟炸機的損失率達到了英美聯(lián)盟不能承受的程度。轟炸軍司令部請來了統(tǒng)計學家,希望利用數(shù)據(jù)分析來改造轟炸機的結(jié)構(gòu),降低陣亡率,提高士兵生還率。統(tǒng)計學家利用大尺寸的飛機模型,詳細記錄了返航轟炸機的損傷情況。統(tǒng)計學家在飛機模型上將轟炸機受到攻擊的部位用黑筆標注出來,兩個月后,這些標注布滿了機身,有的地方標注明顯多于其他地方,例如機身和側(cè)翼。有的地方的標注明顯少于其他地方,例如駕駛室和發(fā)動機。統(tǒng)計學家讓軍火商來看這個模型,軍火商認為應該加固受到更多攻擊的地方,但是統(tǒng)計學家建議對標注少的地方進行加固,標注少的原因不是這些地方不容易被擊中,而是被擊中的這些地方的飛機,很多都沒有返航。這些標注少的地方被擊中是飛機墜毀的一個主要原因。軍火商按照統(tǒng)計學家的建議進行了飛機加固,大大提高了轟炸機返航的比率。以二戰(zhàn)的B-17轟炸機為例,其陣亡率由26%降到了7%,幫助美軍節(jié)約了幾億美金,大大提高了士兵的生還率。
        
        一、數(shù)據(jù)分析中的角色和職責
        
        數(shù)據(jù)分析團隊應該在科技部門內(nèi)部還在業(yè)務部門內(nèi)部一直存在爭議。在業(yè)務部門內(nèi)部,對數(shù)據(jù)場景比較了解,容易找到數(shù)據(jù)變現(xiàn)的場景,數(shù)據(jù)分析對業(yè)務提升幫助較大,容易出成績。但是弊端是僅僅對自己部門的業(yè)務數(shù)據(jù)了解,分析只是局限獨立的業(yè)務單元之內(nèi),在數(shù)據(jù)獲取的效率上,數(shù)據(jù)維度和數(shù)據(jù)視角方面缺乏全局觀,數(shù)據(jù)的商業(yè)視野不大,對公司整體業(yè)務的推動發(fā)展有限。業(yè)務部門的數(shù)據(jù)分析團隊缺少數(shù)據(jù)技術(shù)能力,無法利用新的大數(shù)據(jù)計算和分析技術(shù),來實現(xiàn)數(shù)據(jù)分析和建模。數(shù)據(jù)分析和計算依賴于科技部門,效率較低,無法打通各個環(huán)節(jié)和實現(xiàn)效率和收益優(yōu)。
        
        數(shù)據(jù)分析和挖掘部門位于科技部門,優(yōu)點是直接可以了解所有數(shù)據(jù),利用新的大數(shù)據(jù)計算分析技術(shù)來進行數(shù)據(jù)分析和建模,數(shù)據(jù)視野好。面對全局數(shù)據(jù)建立數(shù)據(jù)采集和分析系統(tǒng),系統(tǒng)復用程度高,降低重復投資,效率高。但是團隊人員商業(yè)敏感度低,過度關(guān)注技術(shù)和架構(gòu),重視技術(shù)的和處理效率,數(shù)據(jù)商業(yè)敏感度低,不重視數(shù)據(jù)商業(yè)化場景,對業(yè)務理解程度不夠,支持力度不如前者??萍疾块T愿意搭建一個大數(shù)據(jù)平臺,讓業(yè)務部門自己去尋數(shù)據(jù)場景,業(yè)務部門在數(shù)據(jù)商業(yè)化過程中也會遇到環(huán)節(jié)不暢通,效率低下的問題。
        
        數(shù)據(jù)分析團隊應該屬于獨立的部門,為所有的業(yè)務部門提供服務,具有獨立的技術(shù)團隊,可以搭建獨立的大數(shù)據(jù)計算和分析平臺,利用新的數(shù)據(jù)處理技術(shù)來建立模型進行分析。另外數(shù)據(jù)分析團隊的人應來源于業(yè)務部門,具有高度的數(shù)據(jù)商業(yè)敏感度,可以將業(yè)務部門的需求分解為數(shù)據(jù)需求,將業(yè)務場景同數(shù)據(jù)場景以及數(shù)據(jù)分析相結(jié)合起來。
        
        數(shù)據(jù)分析是一項實踐性很強的工作,涉及到很多交叉學科,需要不同的崗位和角色,來實現(xiàn)不同的性質(zhì)的工作?;镜膷徫缓徒巧缦拢?br />  
        1、數(shù)據(jù)庫(倉庫)管理員DBA
        
        DBA了解企業(yè)內(nèi)部的數(shù)據(jù)和可用的數(shù)據(jù)資源,包括數(shù)據(jù)的存儲細節(jié)和數(shù)據(jù)字典,另外其對數(shù)據(jù)的采集、清洗和轉(zhuǎn)化起到關(guān)鍵作用。
        
        DBA為數(shù)據(jù)科學家和數(shù)據(jù)分析師提供加工好的原始數(shù)據(jù),這些數(shù)據(jù)是數(shù)據(jù)分析和建模的基礎(chǔ),DBA做了數(shù)據(jù)分析工作中重要的基礎(chǔ)工作,完成了大量的臟活和累活。
        
        2、業(yè)務專家
        
        業(yè)務專家的優(yōu)勢是數(shù)據(jù)的商業(yè)敏感度,了解業(yè)務需求,可以將業(yè)務需求轉(zhuǎn)化為數(shù)據(jù)需求,進一步找到數(shù)據(jù)應用場景。另外業(yè)務專家也可以通過對數(shù)據(jù)的分析,找到新的商業(yè)機會,同業(yè)務部門一起制定商業(yè)計劃,利用數(shù)據(jù)分析推動業(yè)務增長。
        
        業(yè)務專家的經(jīng)驗對于數(shù)據(jù)分析和建模是非常關(guān)鍵的,他們可能是風險管理人員、欺詐監(jiān)測專家、投資專家等。數(shù)據(jù)建模來源于業(yè)務經(jīng)驗和業(yè)務知識,正是業(yè)務專家的專業(yè)分析找到了業(yè)務規(guī)律,從而找到了建模方向,并對建模工作給出建議和解釋。
        
        3、數(shù)據(jù)科學家
        
        過去統(tǒng)計分析依賴于統(tǒng)計分析工具,大數(shù)據(jù)時代之后,數(shù)據(jù)量級的提升和數(shù)據(jù)類型的復雜程度,讓很多傳統(tǒng)的統(tǒng)計分析工具無法完成分析計算。這個時候,數(shù)據(jù)科學家出現(xiàn)了,他們可以利用自己的專業(yè)技能幫助業(yè)務專家和數(shù)據(jù)分析人員進行建模和計算。
        
        過去數(shù)據(jù)統(tǒng)計分析建模常用SPSS,SAS,MATLAB等工具,現(xiàn)在基于大數(shù)據(jù)平臺的分析建模可以使用Spark+Scala/Python/R/Java。數(shù)據(jù)科學家了解模型和算法,可以直接承擔建模和調(diào)優(yōu)工作,懂得選擇合適的算法來進行計算,提率。
        
        4、數(shù)據(jù)分析師
        
        數(shù)據(jù)分析師站在數(shù)據(jù)和商業(yè)的角度來解讀數(shù)據(jù),利用圖標和曲線等方式向管理層和業(yè)務人員展現(xiàn)分析結(jié)果,揭示數(shù)據(jù)分析產(chǎn)生的商業(yè)機會和挑戰(zhàn)。
        
        數(shù)據(jù)分析師將雜亂的數(shù)據(jù)進行整理后,將數(shù)據(jù)以不同的形式展現(xiàn)給產(chǎn)品經(jīng)理、運營人員、營銷人員、財務人員、業(yè)務人員等。提出基于數(shù)據(jù)的結(jié)果和分析建議,完成數(shù)據(jù)從原始到商業(yè)化應用到關(guān)鍵一步,數(shù)據(jù)分析師的數(shù)據(jù)敏感度、商業(yè)敏感度、分析角度、表達方式對于商業(yè)決策很重要。
        
        5、運營專家
        
        數(shù)據(jù)分析結(jié)果和商業(yè)決策出來之后,運營專家負責實現(xiàn)商業(yè)決策。通過有計劃的運營活動,將數(shù)據(jù)分析的結(jié)果應用到實際的商業(yè)活動之中,運營專家是實現(xiàn)數(shù)據(jù)變現(xiàn)后一公里的關(guān)鍵人物。
        
        運營專家屬于業(yè)務人員,實際上參與業(yè)務運營活動,利用數(shù)據(jù)分析結(jié)果,實現(xiàn)業(yè)務場景和數(shù)據(jù)場景的結(jié)合,實現(xiàn)數(shù)據(jù)商業(yè)化應用。
        
        二、數(shù)據(jù)分析之前的各項準備工作
        
        數(shù)據(jù)分析團隊各成員確定之后,將進行下一項工作,就是找到有價值的數(shù)據(jù)進行分析了。數(shù)據(jù)是分析的基礎(chǔ),因此數(shù)據(jù)的質(zhì)量、數(shù)據(jù)的相關(guān)度、數(shù)據(jù)的維度等會影響數(shù)據(jù)分析的結(jié)果影,其中GIGO(垃圾進垃圾出)對于數(shù)據(jù)分析結(jié)果影響大。
        
        1、數(shù)據(jù)源選擇
        
        數(shù)據(jù)分析團隊面對大量的數(shù)據(jù)源,各個數(shù)據(jù)源之間交叉聯(lián)系,各個數(shù)據(jù)域之間具有邏輯關(guān)系,各個產(chǎn)品統(tǒng)計口徑不同,不同的時間段數(shù)值不同等。這一系列問題多會影響數(shù)據(jù)分析結(jié)果,因此確定數(shù)據(jù)源選擇和數(shù)據(jù)整理至關(guān)重要。
        
        DBA可以基于數(shù)據(jù)分析需要,找到相關(guān)數(shù)據(jù),建立一張數(shù)據(jù)寬表,將數(shù)據(jù)倉庫的數(shù)據(jù)引入到這張寬表當中,基于一定的邏輯關(guān)系進行匯總計算。這張寬表作為數(shù)據(jù)分析的基礎(chǔ),然后再依據(jù)數(shù)據(jù)分析需要衍生出一些不同的表單,為數(shù)據(jù)分析提供干凈全面的數(shù)據(jù)源。寬表一方面是用于集中相關(guān)分析數(shù)據(jù),一方面是提率,不需要每次分析時都查詢其他的數(shù)據(jù)表,影響數(shù)據(jù)倉庫效率。
        
        2、數(shù)據(jù)抽樣選擇
        
        簡單的數(shù)據(jù)分析可以調(diào)用全體數(shù)據(jù)進行分析,數(shù)據(jù)抽樣主要用于建模分析,抽樣需考慮樣本具有代表性,覆蓋各種客戶類型,抽樣的時間也很重要,越近的時間窗口越有利于分析和預測。在進行分層抽樣時,需要保證分成出來的樣本比例同原始數(shù)據(jù)基本一致。
        
        3、數(shù)據(jù)類型選擇
        
        數(shù)據(jù)類型分為連續(xù)型和離散型,建模分析時需要確定數(shù)據(jù)類型。進行業(yè)務收入趨勢分析、銷售額預測分析、RFM分析時,一般采用連續(xù)型變量。信用評級、分類預測時一般采用離散變量。
      我要評論
      • 物流智能轉(zhuǎn)型新引擎:DeepSeek+物流

        DeepSeek 物流不僅是技術(shù)的革新,更是城市發(fā)展的重要推動力。它通過智能化手段提升物流效率、優(yōu)化資源利用、減少環(huán)境影響,并為智慧城市建設(shè)提供支撐。未來,隨著AI技術(shù)的不斷進步,物流行業(yè)將迎來更深刻的變革。
        物流大數(shù)據(jù)服務平臺
        2025-04-30 10:11:15
      • 2025年4月1日開始施行的重要新規(guī)一覽

        四月,一系列新規(guī)定即將實施,包括《公共安全視頻圖像信息系統(tǒng)管理條例》、《車聯(lián)網(wǎng)網(wǎng)絡(luò)安全異常行為檢測機制》等。
        大數(shù)據(jù)服務平臺
        2025-04-02 09:31:36
      • 鐵塔大數(shù)據(jù)災害分析平臺:提升自然災害智能化預警水平

        目前,我國災害預防面臨著監(jiān)測預警網(wǎng)絡(luò)不健全、實效性不高、精準性不強,“三斷”(斷路、斷網(wǎng)、斷電)無法及時發(fā)現(xiàn)等問題,亟需建立防災減災預警網(wǎng)絡(luò),實現(xiàn)“災后救助”向“災前預防”轉(zhuǎn)變的目標。
        大數(shù)據(jù)災害分析平臺
        2025-03-19 10:47:45
      • 淄博市召開大數(shù)據(jù)系統(tǒng)工作會議暨“三拼三比”動員部署會

        會議指出,2024年是新一輪機構(gòu)改革后全市大數(shù)據(jù)系統(tǒng)全面履職的第一年,全市大數(shù)據(jù)系統(tǒng)在市委市政府的堅強領(lǐng)導和省大數(shù)據(jù)局的有力指導下,數(shù)據(jù)要素價值加速釋放、數(shù)字經(jīng)濟發(fā)展步伐加快、數(shù)字政府建設(shè)深入推進、數(shù)字支撐底座更為夯實,數(shù)字淄博建設(shè)取得明顯成效。
        大數(shù)據(jù)服務平臺
        2025-03-18 10:07:30
      • 公司重要動態(tài)速覽|??低?、新華三、宇樹科技......

        近期,智慧城市領(lǐng)域的企業(yè)有哪些動態(tài)呢?小編整理了一下,一起來回顧。??低暟l(fā)布視覺大模型周界攝像機;宇樹科技入駐阿里速賣通AliExpress出海......
        大數(shù)據(jù)服務平臺
        2025-03-16 14:10:47
      • 貴州省大數(shù)據(jù)局召開數(shù)字企業(yè)座談會

        會上,朱宗堯介紹了全省數(shù)據(jù)工作“一體兩翼三大轉(zhuǎn)型”總體思路及數(shù)字產(chǎn)業(yè)重點發(fā)展方向,數(shù)字產(chǎn)業(yè)處就起草促進數(shù)字產(chǎn)業(yè)發(fā)展相關(guān)政策措施有關(guān)情況作了說明。
        大數(shù)據(jù)服務平臺
        2025-03-10 11:14:27
      版權(quán)與免責聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負版權(quán)等法律責任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機器人3D打印設(shè)備生物識別傳感器電機電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請發(fā)送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務平臺
      智能制造網(wǎng)APP

      功能豐富 實時交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務

      微信公眾號

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號:gkzhan

      打開抖音 搜索頁掃一掃

      視頻號

      智能制造網(wǎng)

      公眾號:智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了