隨著近年來(lái)大數(shù)據(jù)的興起,數(shù)據(jù)分析環(huán)境和工具上也出現(xiàn)了一些新的變化,使得數(shù)據(jù)處理和數(shù)據(jù)分析的界定也不再那么明顯,數(shù)據(jù)人才也被更多的要求數(shù)據(jù)處理和分析均需擅長(zhǎng),新的分析平臺(tái)也在不斷演進(jìn)。那么數(shù)據(jù)處理服務(wù)發(fā)展趨勢(shì)是怎樣的呢?
相對(duì)于早期的傳統(tǒng)統(tǒng)計(jì)處理思維,大數(shù)據(jù)時(shí)代著實(shí)給我們帶來(lái)了新的興奮點(diǎn)。 在傳統(tǒng)統(tǒng)計(jì)分析中,尤其對(duì)小數(shù)據(jù)的推斷性分析而言, 傳統(tǒng)的思想我們很多時(shí)候會(huì)去考慮P值的大小。 而在大數(shù)據(jù)時(shí)代,這個(gè)樣本數(shù)據(jù)量是劇增的,當(dāng)樣本很大時(shí),傳統(tǒng)的P值檢驗(yàn)顯得不再那么重要,轉(zhuǎn)而更多的處理和分析手段, 變成了對(duì)目標(biāo)函數(shù)的優(yōu)化問(wèn)題。
在傳統(tǒng)分析中,通常我們會(huì)先收集數(shù)據(jù),然后人工或半自動(dòng)化的去進(jìn)行數(shù)據(jù)清理,然后采用不同的手段進(jìn)行分析,然后再后驗(yàn)證結(jié)論的有效性,以及測(cè)試模擬的效果。而當(dāng)優(yōu)化技術(shù)和計(jì)算機(jī)性能的提升,并應(yīng)用現(xiàn)代IT技術(shù),輔以統(tǒng)計(jì)學(xué)思想加上數(shù)學(xué)的發(fā)展,使這一切變得更加自動(dòng)化, 從而能實(shí)現(xiàn)實(shí)時(shí)或近實(shí)時(shí)的分析,進(jìn)而幫助我們進(jìn)入機(jī)器學(xué)習(xí)時(shí)代。
數(shù)據(jù)處理服務(wù)發(fā)展趨勢(shì)一、開(kāi)放源碼
Apache hadoop、Spark等開(kāi)源應(yīng)用程序已經(jīng)在大數(shù)據(jù)領(lǐng)域占據(jù)了主導(dǎo)地位。一項(xiàng)調(diào)查發(fā)現(xiàn),預(yù)計(jì)到今年年底,近60%企業(yè)的Hadoop集群將投入生產(chǎn)。佛瑞斯特的研究顯示,Hadoop的使用率正以每年32.9%的速度增長(zhǎng)。 專(zhuān)家表示,2017年許多企業(yè)將繼續(xù)擴(kuò)大他們的Hadoop和NoSQL技術(shù)應(yīng)用,并尋找方法來(lái)提高處理大數(shù)據(jù)的速度。
數(shù)據(jù)處理服務(wù)發(fā)展趨勢(shì)二、內(nèi)存技術(shù)
很多公司正試圖加速大數(shù)據(jù)處理過(guò)程,它們采用的一項(xiàng)技術(shù)就是內(nèi)存技術(shù)。在傳統(tǒng)數(shù)據(jù)庫(kù)中,數(shù)據(jù)存儲(chǔ)在配備有硬盤(pán)驅(qū)動(dòng)器或固態(tài)驅(qū)動(dòng)器(SSD)的存儲(chǔ)系統(tǒng)中。而現(xiàn)代內(nèi)存技術(shù)將數(shù)據(jù)存儲(chǔ)在RAM中,這樣大大提高了數(shù)據(jù)存儲(chǔ)的速度。佛瑞斯特研究的報(bào)告中預(yù)測(cè),內(nèi)存數(shù)據(jù)架構(gòu)每年將增長(zhǎng)29.2%。 目前,有很多企業(yè)提供內(nèi)存數(shù)據(jù)庫(kù)技術(shù),最著名的有SAP、IBM和Pivotal。
數(shù)據(jù)處理服務(wù)發(fā)展趨勢(shì)三、機(jī)器學(xué)習(xí)
隨著大數(shù)據(jù)分析能力的不斷提高,很多企業(yè)開(kāi)始投資機(jī)器學(xué)習(xí)(ML)。機(jī)器學(xué)習(xí)是人工智能的一項(xiàng)分支,允許計(jì)算機(jī)在沒(méi)有明確編碼的情況下學(xué)習(xí)新事物。換句話(huà)說(shuō),就是分析大數(shù)據(jù)以得出結(jié)論。 高德納咨詢(xún)公司(Gartner)稱(chēng),機(jī)器學(xué)習(xí)是2017年十大戰(zhàn)略技術(shù)趨勢(shì)之一。它指出,當(dāng)今最先進(jìn)的機(jī)器學(xué)習(xí)和人工智能系統(tǒng)正在超越傳統(tǒng)的基于規(guī)則的算法,創(chuàng)建出能夠理解、學(xué)習(xí)、預(yù)測(cè)、適應(yīng),甚至可以自主操作的系統(tǒng)。
數(shù)據(jù)處理服務(wù)發(fā)展趨勢(shì)四、智能app
企業(yè)使用機(jī)器學(xué)習(xí)和AI技術(shù)的另一種方式是創(chuàng)建智能應(yīng)用程序。這些應(yīng)用程序采用大數(shù)據(jù)分析技術(shù)來(lái)分析用戶(hù)過(guò)往的行為,為用戶(hù)提供個(gè)性化的服務(wù)。推薦引擎就是一個(gè)大家非常熟悉的例子。 在2017年十大戰(zhàn)略技術(shù)趨勢(shì)列表中,高德納公司把智能應(yīng)用列在了第二位。高德納公司副總裁大衛(wèi)·希爾里(David Cearley)說(shuō):“未來(lái)10年,幾乎每個(gè)app,每個(gè)應(yīng)用程序和服務(wù)都將一定程度上應(yīng)用AI。
2017-2022年中國(guó)數(shù)據(jù)處理行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及投資前景預(yù)測(cè)報(bào)告表示,不論傳統(tǒng)行業(yè),或當(dāng)下的大數(shù)據(jù)時(shí)代,經(jīng)驗(yàn)表明數(shù)據(jù)處理往往在數(shù)據(jù)分析產(chǎn)業(yè)鏈中占到80% -90% 以上的工時(shí)消耗。有的公司更是出于成本考慮,將整體數(shù)據(jù)處理業(yè)務(wù)單獨(dú)外包,使得原始數(shù)據(jù)缺乏積累和數(shù)據(jù)管理混亂。這是市場(chǎng)調(diào)研行業(yè)發(fā)展的一個(gè)隱患。以上便是數(shù)據(jù)處理行業(yè)服務(wù)發(fā)展趨勢(shì)的所有內(nèi)容了。
更多數(shù)據(jù)處理行業(yè)研究分析,詳見(jiàn)中國(guó)報(bào)告大廳《數(shù)據(jù)處理行業(yè)報(bào)告匯總》。這里匯聚海量專(zhuān)業(yè)資料,深度剖析各行業(yè)發(fā)展態(tài)勢(shì)與趨勢(shì),為您的決策提供堅(jiān)實(shí)依據(jù)。
更多詳細(xì)的行業(yè)數(shù)據(jù)盡在【數(shù)據(jù)庫(kù)】,涵蓋了宏觀數(shù)據(jù)、產(chǎn)量數(shù)據(jù)、進(jìn)出口數(shù)據(jù)、價(jià)格數(shù)據(jù)及上市公司財(cái)務(wù)數(shù)據(jù)等各類(lèi)型數(shù)據(jù)內(nèi)容。
本文來(lái)源:報(bào)告大廳
本文地址:http://m.74cssc.cn/k/shujuchuli/30466.html