キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 --
チーム・カルポ /著   -- 秀和システム新社 -- 2026.1 -- 24cm -- 615p

資料詳細

タイトル Vision AI実装プログラミング
副書名 キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT ViTPos Segmenter MaskFormerを活用した最新AIプログラミング
著者名等 チーム・カルポ /著  
出版 秀和システム新社 2026.1
大きさ等 24cm 615p
分類 007.637
件名 画像認識 , 深層学習
注記 文献あり 索引あり
注記 サンプルデータダウンロード
要旨 本書は、キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニングを、Transformerを軸に横断して学べる実装書です。単なるAPI呼び出しではなく、いちから(フルスクラッチで)コードを組み立てることを基本に、データ前処理、Dataset/Collate、学習ループ、損失と評価指標、学習率スケジューラまで、内部の仕組みが見える最小実装から丁寧に積み上げていきます。併せて実務での活用を重視し、一部は事前学習済みモデルを用いたファインチューニング(timmのViTやHugging Face Hubの重み、凍結・段階的解凍など)も扱います。これにより、「仕組みの理解」と「現場での応用力」を目指します。
目次 1章 開発環境について;2章 キーポイント検出(Keras);3章 キーポイント検出(PyTorch);4章 ViTPoseスタイルモデルによるキーポイント検出;5章 ViTPoseスタイルモデルによる姿勢推定;6章 セマンティックセグメンテーション(Semantic Segmentation);7章 インスタンスセグメンテーション(Instance Segmentation);8章 パノプティックセグメンテーション(ファインチューニング版);9章 画像キャプショニング
ISBN(13)、ISBN 978-4-7980-7561-7   4-7980-7561-2
書誌番号 1125057427
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1125057427

所蔵

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 情報科学 007.6 一般書 貸出中 - 2079360131 iLisvirtual