その原理とPythonによる実践 --
Alice Zheng /著, Amanda Casari /著, ホクソエム /訳   -- オライリー・ジャパン -- 2019.2 -- 24cm -- 199p

資料詳細

タイトル 機械学習のための特徴量エンジニアリング
副書名 その原理とPythonによる実践
著者名等 Alice Zheng /著, Amanda Casari /著, ホクソエム /訳  
出版 オライリー・ジャパン 2019.2
大きさ等 24cm 199p
分類 007.13
件名 機械学習 , プログラミング(コンピュータ)
注記 原タイトル:Feature Engineering for Machine Learning
注記 索引あり
著者紹介 【Alice Zheng】機械学習、スパニングアルゴリズム、プラットフォーム開発の技術リーダー。現在、Amazon Advertisingにおいてサイエンス研究マネージャーをしている。それ以前は、GraphLab/Dato/Turiでのツールキット開発とユーザー教育に携わり、Microsoft Researchでは機械学習の研究者だった。UC Berkeley大学で電気工学およびコンピュータサイエンスの博士号、また数学の学士号を取得している。(本データはこの書籍が刊行された当時に掲載されていたものです)
要旨 本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、PCAによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またPythonコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Kaggle GrandmasterのKohei Ozaki(@smly)氏による「日本語版に寄せて」を収録しています。
目次 1章 機械学習パイプライン;2章 数値データの取り扱い;3章 テキストデータの取り扱い;4章 特徴量スケーリングによる効果:Bag‐of‐WordsのTF‐IDFによる重み付け;5章 カテゴリ変数の取り扱い;6章 次元削減:膨大なデータをPCAで圧縮;7章 非線形特徴量の生成:κ‐meansを使ったスタッキング;8章 特徴量作成の自動化:画像特徴量の抽出と深層学習;9章 バック・トゥ・ザ・「フィーチャー」:学術論文レコメンドアルゴリズムの構築;付録A 線形モデリングと線形代数の基礎
ISBN(13)、ISBN 978-4-87311-868-0   4-87311-868-9
書誌番号 1113667122
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1113667122

所蔵

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 情報科学 007.1 一般書 貸出中 - 2064371323 iLisvirtual