• NEW

第3版 --
Ryan Mitchell /著, 嶋田健志 /訳, 新井翔太 /訳   -- オライリー・ジャパン -- 2025.6 -- 24cm -- 333p

資料詳細

タイトル PythonによるWebスクレイピング
版情報 第3版
著者名等 Ryan Mitchell /著, 嶋田健志 /訳, 新井翔太 /訳  
出版 オライリー・ジャパン 2025.6
大きさ等 24cm 333p
分類 007.645
件名 ウェブスクレーピング
注記 原タイトル:Web Scraping with Python 原著第3版の翻訳
注記 索引あり
注記 サンプルデータダウンロード
著者紹介 【Ryan Mitchell】Webスクレイピング、アプリケーションセキュリティ、データサイエンスのエキスパート。オーリン工科大学卒業、ハーバード大学Extension Schoolのソフトウェア工学修士およびデータサイエンス修了。現在はGerson Lehrman Groupの主席ソフトウェアエンジニア。(本データはこの書籍が刊行された当時に掲載されていたものです)
要旨 Webスクレイピングとは、インターネットからデータを機械的に集め、必要な情報を抽出する技術のことです。2019年の第2版発刊から約5年が経過し、生成AIの台頭で情報を得る方法も大きく変わりましたが、本当に欲しい情報を正しくピンポイントで得るためには、依然としてWebスクレイピングについての知識とスキルが必要です。本書では、インターネット上の膨大な情報の中から、生成AIや検索エンジンだけでは集められない本当に必要な正しい情報を入手する方法を、基礎からていねいに解説し、データの抽出、格納、収集後のクリーニング、さらにはJavaScriptの実行、OCRを含めた自然言語処理、並列処理などの高度なトピックもカバー。プログラミングテクニックとテクノロジー全般だけでなく、法律面の解説も加え、問題に遭遇した際の対処法まで紹介します。
目次 1部 スクレイパーの作成(インターネットの仕組み;Webスクレイピングの適法性と倫理;Webスクレイピングアプリケーション;スクレイパーの開発;高度なHTMLのパース ほか);2部 高度なスクレイピング(データの読み込み;汚いデータの取り扱い;自然言語の読み込みと書き込み;フォームとログインを介したクローリング;JavaScriptのスクレイピング ほか)
ISBN(13)、ISBN 978-4-8144-0122-2   4-8144-0122-1
書誌番号 1125015000
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1125015000

所蔵

所蔵は 5 件です。現在の予約件数は 4 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 情報科学 15 007.6 一般書 貸出中 - 2078094659 iLisvirtual
港南 公開 007.6 一般書 貸出中 - 2078114935 iLisvirtual
磯子 公開 007.6 一般書 予約受取待 - 2078114943 iLisvirtual
山内 公開 情報科学 007.6 一般書 貸出中 - 2078081298 iLisvirtual
戸塚 公開 情報科学 007.6 一般書 貸出中 - 2078114951 iLisvirtual