大規模データのための機械学習事例集 --
Sandy Ryza /著, Uri Laserson /著, Sean Owen /著, Josh Wills /著, 石川有 /監訳, 玉川竜司 /訳   -- オライリー・ジャパン -- 2016.1 -- 24cm -- 309p

資料詳細

タイトル Sparkによる実践データ解析
副書名 大規模データのための機械学習事例集
著者名等 Sandy Ryza /著, Uri Laserson /著, Sean Owen /著, Josh Wills /著, 石川有 /監訳, 玉川竜司 /訳  
出版 オライリー・ジャパン 2016.1
大きさ等 24cm 309p
分類 007.6
件名 データ処理(コンピュータ) , パターン認識
注記 Advanced analytics with Spark.の翻訳
注記 索引あり
著者紹介 【Ryza】Cloudera社のデータサイエンティストであり、Apache Sparkプロジェクトの活発なコントリビュータ。Hadoop Project Management Committeeのメンバーでもある。
内容紹介 データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍。高度なデータ解析を習得したいデータサイエンティスト必携の1冊。
要旨 本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。
目次 ビッグデータの分析;ScalaとSparkによるデータ分析の紹介;音楽のレコメンドとAudioscrobblerデータセット;決定木を使った森林被覆の予測;K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出;潜在意味解析を使ったWikipediaの理解;GraphXを使った共起ネットワークの分析;ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析;モンテカルロシミュレーションによる金融リスクの推定;ゲノムデータの分析とBDGプロジェクト;PySparkとThunderを使った神経画像データの分析;Sparkの詳細;MLlib Pipelines API;SparkRについて;SparkのJVM、OSレベルのチューニングによる高速化
ISBN(13)、ISBN 978-4-87311-750-8   4-87311-750-X
書誌番号 1113342380

所蔵

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 Map 情報科学 29 007.6 一般書 利用可 - 2056443200 iLisvirtual