Ryan Mitchell /著, 黒川利明 /訳, 嶋田健志 /技術監修   -- オライリー・ジャパン -- 2016.3 -- 24cm -- 253p

資料詳細

タイトル PythonによるWebスクレイピング
著者名等 Ryan Mitchell /著, 黒川利明 /訳, 嶋田健志 /技術監修  
出版 オライリー・ジャパン 2016.3
大きさ等 24cm 253p
分類 547.48
件名 インターネット
注記 Web scraping with Python.の翻訳
注記 文献あり 索引あり
内容紹介 インターネット上の膨大な情報の中から必要な情報を入手するためにPythonを使ってWebスクレイピングを行うための解説書。
要旨 「Webスクレイピング」とは、インターネットからデータを機械的に集め、必要な情報を抽出するプロセスのこと。検索エンジンだけでは限られた情報しか集められませんが、この技術を使えば、インターネット上の膨大な情報の中から本当に必要な情報を入手できます。小売業、金融業をはじめ多くの業界で情報収集に活用され、アカデミックでも広い分野で使われ注目されています。本書は、前半でWebスクレイパーとクローラの基礎をていねいに解説し、後半でOCRを使った情報抽出や、JavaScript実行、Seleniumによるインタフェース使用やテスト自動化、自然言語処理などの高度なトピックに加えて法律面の解説など、Webスクレイピングを実際に行うために必要なプログラミングテクニックとテクノロジー全般を紹介します。Python3.x対応。
目次 第1部 スクレイパーを作る(最初のWebスクレイパー;高度なHTMLパーシング;クローリングを開始する;APIを使う;データを格納する;文章を読む);第2部 高度なスクレイピング(汚れたデータをクリーニング;自然言語の読み書き;フォームとログインでクロール;JavaScriptのスクレイピング;画像処理とテキスト認識;スクレイピングの落とし穴を避ける;Webサイトをスクレイパーでテストする;リモートでスクレイピング;Python入門;インターネット入門;Webスクレイピングの適法性と倫理)
ISBN(13)、ISBN 978-4-87311-761-4   4-87311-761-5
書誌番号 1113358817

所蔵

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 書庫 547.4/4176 一般書 利用可 - 2056183020 iLisvirtual