最近常去逛的店歇業了,之後就好少到那邊晃啦,
可是朋友一直問我專家親授:極深度大數據統計理論 那裡買比較便宜!
上網幫他查了專家親授:極深度大數據統計理論 相關的評價,推薦,開箱文,價格,報價,比較,規格,推薦那!
經過多方比較後,發現專家親授:極深度大數據統計理論 居然曾造成搶購熱潮,
價格也很實在,重點是買的安心,到貨的速度還滿快的,
不用出門送到家。還有超級大重點,比超商便宜!!
一拿到之後為之驚艷,專家親授:極深度大數據統計理論 CP值超高!。
↓↓↓限量特惠的優惠按鈕↓↓↓
商品訊息功能
商品訊息描述
人氣
《專家親授:極深度大數據統計理論》
阿里巴巴集團內部使用,效果顯著
大數據的統計計算是進行資料探索和分析採擷的基礎。在實際應用中會遇到兩個問題:一個是需要使用多少資源;另一個是計算時間,它關係到資料探索分析的效率和效果。人們都希望花更少的錢,並且希望計算時間更短,但對於某個確定的計算過程,它們是成反比的。
本書作者從統計計算的演算法入手,重構其計算過程,從而同時降低資源使用量和計算時間。作者提出一套完整的關於大數據統計的計算理論,包括常用的各種統計量和統計方法,開發的資料分析工具已經在阿里巴巴集團內部的多個部門使用,並取得顯著效果。
專家推薦
本書提出了一套適合於分散式運算的統計計算方法,透過對一些基礎統計量的計算,可獲得有關資料集更全面的統計資訊,進而可以進行進階的統計分析,例如,區間估計、線性回歸、主成分分析等。可以說,本書從統計計算的角度,整理出一套對大數據分析有實用價值的統計理論,並形成參考程式。-潘愛民 阿里雲首席架構師
相信大多數從事數值計算的技術人員都讀過一系列叫作Numerical Recipe in C/Fortran/Java 的書。眼前這本書或許可以叫作Numerical Statistics Recipes in Java,和那個系列一樣,對重新快速學習和使用數值統計演算法來實現資料分析應用的讀者來說,這本書是一本不錯的入門手冊。-何萬青 博士 英特爾技術計算集團技術計算架構師
專家親授:極深度大數據統計理論-目錄導覽說明
前言
第1 章 基本概念
1.1 資料類型
1.2 整體和樣本
1.3 參數和統計量
1.4 分散式運算
第2 章 單變數基本統計量
2.1 數量統計量
2.2 頻率統計量新款
2.3 次序統計量
第3 章 單變數資料的分佈
3.1 長條圖
3.2 經驗分佈
3.3 近似分位數和近似百分位數
3.4 PP、QQ 機率圖
3.5 單變數的基本統計資訊
第4 章多功能 多變數的資料特徵
4.1 協方差
4.2 相關係數
4.3 協方差和相關係數的計算實現
4.4 資料表的基本統計結果
第5 章 資料探索
5.1 擴充長條圖
5.2 交叉表
第6 章 極限定理
6.1 大數定理
6.2 中心極限定理
第7 章 常用的分佈函數介紹
7.1 基本定義
7.2 標準正態分佈(Z 分佈或U 分佈)
7.3 卡方分佈(Χ2 分佈)
7.4 學生T 分佈
7.5 F 分佈
第8 章 常用分佈函數計算
8.1 函式定義
8.2 函數性質及相互間的關係
8.3 分佈函數關係圖
8.4 分佈函數的計算
8.5 產生常用分佈的亂數
第9 章 參數估計
9.1 點有限 估計與區間估計
9.2 單一整體的參數估計
9.3 兩個整體的參數估計
第10 章 假設檢驗
10.1 基本概念
10.2 參數檢驗
10.3 單一整體參數的檢驗
10.4 兩個整體參數的檢驗
第11 章 非參數檢驗
11.1 PEARSON 擬合優度Χ2 檢驗
11.2 兩個變數的列聯表檢驗
11.3 K-S 檢驗
11.4 符號檢驗
11.5 秩統計量和秩檢驗方法
第12 章 方差分析
12.1 單因素方差分析
12.2 雙因素方差分析
第13 章 多元線性回歸
13.1 數學模型
13.2 顯著性檢驗
13.3 計算步驟
13.4 程式實現
13.5 多重共線性
13.6 逐步回歸
第14 章 主成分分析
14.1 計算步驟
14.2 程式實現
14.3 應用舉例
第15 章 判別分析
15.1 距離判別
15.2 FISHER 判別
15.3 BAYES 判別
15.4 判別演算法的綜合模型
15.5 應用舉例
第16 章 模型評估曲線
16.1 相關概念
16.2 定義
16.3 計算實現
參考文獻
前言
大數據的統計計算是進行資料探索和分析採擷的基礎。在實際應用中,隨著資料規模的快速增長,資料會分散式儲存在多台電腦上,即使最簡單的求和操作都需要多台電腦協作完成,並且需要分鐘等級的計算時間,這樣我們將面對以下兩個問題:
需要使用多少資源,即所要付出的成本。計算需要多少時間,它關係到資料探索分析的效率和效果。人們都希望花更少的錢,並且希望計算時間更短,但對於某個確定的計算過程,它們是成反比的。這就是我在大數據統計實作中經常遇到的情況,當研究了一個又一個計算效能問題之後,我驚奇地發現,這些不同的演算法間是有共通性的,這就吸引我去深入研究,最後形成了一套完整的理論,包含常用的各種統計量和統計方法。以本書內容開發為基礎的資料分析工具已經在阿里巴巴集團內部的多個部門使用,並取得了顯著效果。
首先舉一個實例,使大家有一個直觀的印象:對於10TB 的資料,大約有1.25MB 個資料,以求和計算為例,使用很多人熟悉的分散式SQL 進行計算:
SELECT SUM(COL1) AS COL1_SUM, COUNT(COL2) AS COL2_CNT, ...FROM DATA_TABLE;共執行了4 分44.062 秒,在該SQL 敘述中,每列只算了一個統計量。然後使用本書的計算方法,計算更多的統計量,包含:總個數、總和、平均值、方差、標準差、標準誤、變異係數、立方和、四次方和、二階原點矩、三階原點矩、四階原點矩、二階中心矩、三階中心矩、四階中心矩、偏度、峰度;最大值、最小值、極差、最大的100 個值、最小的100 個值;資料分佈長條圖、經驗分佈函數、近似百分位元值。如果不同數值的個數小於10000 個,會將其頻數資訊計算出來,並有精確百分位值、中值、眾數;協方差矩陣、相關係數矩陣。獲得所有的這些統計量使用的計算節點數目與用SQL 敘述獲得的大致相同,花費的計算時間為:4 分53.673 秒。計算這麼多內容才多花約10 秒,說明本書介紹的演算法夠高效吧!但這還只是一個開頭。
接下來,做一個更有挑戰的實驗,除了上面這些統計量,我們再加入一些進階的統計計算,區間估計、參數檢驗、非參數檢驗、線性回歸、共線性分析、方差分析、主成分分析,完成這些需要多久呢?答案是4 分53.766秒。多麼神奇的事情!對這些大數據進行進階統計計算只多用了不到0.1秒。這種計算效率的加強夠顯著了,我們無須再為資源和時間發愁了。
本書透過文字描述、數學運算式和程式碼,將整個統計計算過程清晰地展現在讀者眼前。全書揭示了各種統計概念和方法,以及它們內在的連結,並根據其特點,對各自的計算公式進行恒等轉換,找到更適合大數據的計算方式。書中提供的範例程式碼可以幫助讀者進一步了解演算法細節,便於將書中的方法運用於實際計算。
本書適合對大數據分析有興趣的讀者閱讀,前面的章節比較容易了解,包含了常用統計量的計算;後面的各章節需要讀者具備一些基礎知識,建議讀者根據自己的興趣和工作需要,選擇對應的內容進行參考。
在本書撰寫過程中,感謝初敏、陳一甯、張東暉的支援和幫助,感謝蔡甯、高志涵在演算法方面的討論和交流,感謝鄧鐘強、蔡甯、高志涵、蔣耘、羅毅、譚望達、代斌、周俊、王少萌、姜曉燕、王樂珩、曹傳宇等同事,一同將此理論應用於實際。
因作者水準有限,書中難免有不妥或疏漏之處,敬請廣大專家和讀者批評、指正!
我的電子郵件地址為:yangxu@alibaba-inc.com。
阿里巴巴 楊旭
語言:中文繁體
規格:平裝
分級:普級
開數:23*17
頁數:448
出版地:台灣
商品訊息特點
↓↓↓限量特惠的優惠按鈕↓↓↓
專家親授:極深度大數據統計理論 討論,推薦,開箱,CP值,熱賣,團購,便宜,優惠,介紹,排行,精選,特價,周年慶,體驗,限時
以下為您可能感興趣的商品
注意:下方具有隨時更新的隱藏版好康分享,請暫時關閉adblock之類的廣告過濾器才看的到哦!!(中央社記者黃國芳嘉義縣14日電)國際影星成龍捐贈給國立故宮博物院南部院區的12生肖獸首,今天上午10時進行拆除,暫時放在故宮南院倉庫,未來以設置在主題公園為優先選項。
國立故宮博物院南部院區於去年12月28日開館試營運,前總統馬英九當天蒞臨見證這歷史性的一刻,藝人成龍也到場介紹所捐贈的12生肖獸首。
裝置有故宮南院入口的12生肖獸首,當時就有傳出批評聲音,認為是用中國統戰工具來侮辱台灣人,開館試營運事隔2天(去年12月30日),一對男女持紅色油漆倒在12獸首龍與馬的頭上,並在柱子上寫上「文化統戰」字樣。
12生肖獸首存廢一直飽受爭議,故宮有針對拆除12獸首做民意調查,故宮南院處長王士聖曾表示,針對遊客調查,拆除意願是「一半一半」,正反意見都有。
故宮日前在立法院教育及文化委員會業務報告,國民黨籍立委柯志恩質詢時提到,10月8日故宮院長林正儀親自召開座談會,邀請12名包含立委、美學專家等,討論12獸首預計於11月中旬拆除。
故宮副院長李靜慧表示,放置12獸首的燈柱會留著,只會把12生肖獸首拆解下來,暫時放在故宮南院的倉庫,獸首未來可放在園區其他適合地方,以設置12生肖主題公園為優先選項。1051114(中央社記者王靖怡台北9日電)素有「台灣諾貝爾獎」之稱的吳三連獎今天公布第39屆得獎名單,文學獎得主為作家平路及詩人江自得、藝術獎得主為雕塑家賴純純及小提琴家蘇顯達。
第39屆吳三連獎下午在台北舉行得獎名單記者茶會,共67人徵選,總件數達597件作品,吳三連獎基金會董事長吳樹民宣布文學獎得主為平路(小說)比價、江自得(新詩);藝術獎得主為賴純純(雕塑)、蘇顯達(音樂)。
吳三連獎基金會秘書長向陽逐一介紹得獎者。平路本名路平,為台灣當代卓越小說家,代表作「婆娑之島」對台灣400年歷史提出新解讀,建構台灣新歷史小說樣貌,作品關切文化議題和公共事務。平路現為中央廣播電台董事長。
兼具醫師和詩人身分的江自得,詩作以台灣意象為出發點,展現對台灣這塊土地的關愛和情懷,詩作從內容到形式為台灣詩壇開創新格局。
賴純純藝術生涯不斷尋求不同的藝術突破,在以男性藝術家為大宗的世代,能精準開展女性藝術家特有色彩靈感,靈活從繪畫平面到立體雕塑,再到空間藝術,賴純純具有跨越形式的創造力及開發題材的想像力。
蘇顯達現為台北愛樂管弦樂團首席,並任教於台北藝術大學音樂學系,對音樂界貢獻不僅是演奏,也從事教育培養台灣優秀演奏人才,世界巡迴常演奏台灣音樂家作品,表現台灣音樂精神。
贈獎典禮15日在台北國賓大飯店登場,由得獎人指定頒獎人吳晟、李敏勇、廖修平及朱宗慶致詞與贈獎。1051109
下面附上一則新聞讓大家了解時事旺報【記者李怡芸╱台北專訪】
現代意義的「塗鴉」,對華人社會而言無疑是西方的「舶來品」,早期意味著非主流、地下、與主流文化抗爭的姿態,如今塗鴉出現在潮T、帽子、箱包、產品設計上,兩岸三地的塗鴉創作者也逐漸從街頭走進「殿堂」。在這股風潮中,不乏大陸、香港的塗鴉工作者不遠千里而來,認為台灣是最好的揮灑空間。
來自廣州的鄧存欣,去年曾以交換生的身分來台,在台南崑山科技大學待了半年,當時已開始接觸塗鴉的她,卻因人生地不熟,「前1個多月完全沒法畫,很難受。」而後透過街舞社友人的介紹認識了在地的塗鴉創作者,「一整天帶著我去看塗鴉的點,可買漆的地方,接下來的4個多月,我重心完全就是在塗鴉了。」
2013年開始塗鴉,至今鄧存欣已在廣州有了自己的工作室,時而有商業活動或合作邀約。她表示:「剛開始的時候還是只能趁晚上偷遛出去畫,家裡也老是反對。」而今闖出了名號,家人也轉而支持,「只讓我一定要戴口罩,防護做好。」這樣的轉變雖是她自己的個案,卻也頗能代表大陸普遍對塗鴉的改觀。
與國外藝術家切磋
不過,若要比較兩岸的塗鴉藝術環境,鄧存欣認為還是台灣更友善,而差別在於「國際化」。「在台灣,大型的塗鴉活動愈來愈多,我待在台灣的那段時間,可以接觸到許多國外的塗鴉創作者,運用的工具和手法不同,很是開了眼界;」在大陸,雖然北京、上海、廣州這些城市的同好不少,「但相較之下多是小型的,圈子內的聚會,」鄧存欣說。
台活動多可盡情揮灑
近年,大陸也可見官方支持的塗鴉活動,但鄧存欣表示,申請所需的時間周期長,內容也需要審核;相對來說台灣民間舉辦的活動更為生猛有趣。近日應「POW!WOW!TAIWAN」活動邀請來台與國內外30多個塗鴉藝術家展現各自創作,鄧存欣表示自己將嘗試噴漆之外的技法,也因為每每來台總感覺台灣「可靜下來創作」,這次所繪的虎會一改過去的凶猛,展現較安靜的姿態。
同樣感覺台灣靜得下來,「適合生活」的香港塗鴉創作者Sinic Choy,在香港已有10多年的塗鴉經驗,近4年旅居台灣,開店、接案的生活頗自得其樂。他認為塗鴉在香港雖發展得比台灣早,但因社會更「務實」,除非如「九龍皇帝」曾灶財具國際知名度,才有可能得到重視。「塗鴉藝術在各地有各地的難處!」但至少對Sinic Choy而言,目前待在台灣是最愜意的。
專家親授:極深度大數據統計理論 推薦, 專家親授:極深度大數據統計理論 討論, 專家親授:極深度大數據統計理論 部落客, 專家親授:極深度大數據統計理論 比較評比, 專家親授:極深度大數據統計理論 使用評比, 專家親授:極深度大數據統計理論 開箱文, 專家親授:極深度大數據統計理論?推薦, 專家親授:極深度大數據統計理論 評測文, 專家親授:極深度大數據統計理論 CP值, 專家親授:極深度大數據統計理論 評鑑大隊, 專家親授:極深度大數據統計理論 部落客推薦, 專家親授:極深度大數據統計理論 好用嗎?, 專家親授:極深度大數據統計理論 去哪買?- 本周折扣 本周精選林書豪可掀式光學滑鼠墊-(白色球衣)
- 新品上架 強檔精選韓中常用語詞典
- 部落客推薦 強檔精選【Matter Lab】NOIR 護照套-灰
- 滿額免運 驚喜推薦【J 精選】多功能可摺疊單肩旅行袋-單肩背袋(可選色)
- 優惠專區 好康報報彩色實用英漢字典:32K+藍皮精裝版
留言列表