実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門
- 電子あり
内容紹介
目次
第I部 テキストアナリティクスの基礎
第1章 テキストアナリティクスことはじめ
1.1 テキストアナリティクスとは?
1.2 分析のためのアプローチ
1.3 分析のための基盤技術
1.4 まとめ:自然言語処理を学ぶために
第2章プログラミングの補足知識
2.1 文字コード
2.2 ファイルの入出力
2.3 正規表現
2.4 内包表記
2.5 まとめ:Pythonを使いこなすために
第3章 環境構築
3.1 Linux
3.2 macOS
3.3 Windows
3.4 Pythonの仮想環境
3.5 まとめ:より快適な環境を構築するために
第4章 基礎技術
4.1 基礎的な解析
4.2 文書の分類・クラスタリング
4.3 可視化
4.4 まとめ:より深い分析を実現するために
第II部 テキストアナリティクスの実践
第5章 データ収集
5.1 公開データ
5.2 社内データ
5.3 データ購入
5.4 ウェブクローリング
第6章 観光テキストの解析
6.1 データの入手:観光テキスト解析に利用できるソーシャルメディアの例
6.2 口コミを利用した観光地の分析
6.3 口コミを利用したテーマパークの分析
6.4 分析上の注意点
6.5 研究の紹介
第7章 金融・経済テキストの解析
7.1 事前準備:金融・経済における極性分析
7.2 データの入手:金融・経済テキストデータの入手
7.3 基礎的な解析:基礎的なテキスト分析
7.4 分析:有価証券報告書を用いた日経平均予想
7.5 分析上の注意点
7.6研究の紹介
第8章 ソーシャルメディアテキストの解析
8.1 Twitterデータによる世情分析
8.2 2ちゃんねるデータによる世情分析
8.3 大規模データ処理に対する工夫
8.4 研究の紹介
第III部 応用技術・発展的な内容
第9章 実践的なテクニック
9.1 単語処理に関するテクニック
9.2 その他のツールの比較と利用方法
9.3 まとめ
第10章 深層学習技術
10.1 単語分散表現
10.2 文分散表現
10.3 BERTをはじめとするTransformerモデルの利用
10.4 まとめ
第11章 環境構築の要らないテキストアナリティクス
11.1 Google Colaboratoryを利用したテキストアナリティクス
11.2 自然言語処理APIを利用したテキストアナリティクス
11.3 まとめ
付録 本書で利用するPythonライブラリ
関連シリーズ
-
Pythonではじめる時系列分析入門
-
プログラミング〈新〉作法
-
Polarsとpandasで学ぶ データ処理アイデアレシピ55
-
RustによるWebアプリケーション開発
-
ゼロから学ぶGit/GitHub
-
Pythonでスラスラわかる ベイズ推論「超」入門
-
最新 使える!MATLAB
-
ゼロから学ぶRust
-
OpenCVによる画像処理入門
-
ROS2とPythonで作って学ぶAIロボット入門
-
Pythonではじめるベイズ機械学習入門
-
これからのロボットプログラミング入門
-
Rではじめる地理空間データの統計解析入門
-
1週間で学べる!Julia数値計算プログラミング
-
モンテカルロ統計計算
-
スパース回帰分析とパターン認識
-
ゼロから学ぶPythonプログラミング
-
PythonではじめるKaggleスタートブック
-
Python数値計算プログラミング
-
Kaggleに挑む深層学習プログラミングの極意
-
データ分析のためのデータ可視化入門
-
最適化手法入門
-
RとStanではじめる ベイズ統計モデリングによるデータ分析入門
-
Juliaプログラミング大全
-
Rで学ぶ統計的データ解析
-
Pythonで学ぶアルゴリズムとデータ構造
-
ゼロからつくるPython機械学習プログラミング入門
-
入門者のPython
-
Web学習アプリ対応 C言語入門
-
ゼロからはじめるデータサイエンス入門
-
ProcessingによるCGとメディアアート
-
問題解決力を鍛える!アルゴリズムとデータ構造
-
ソフトウェアの挑戦
-
ホログラフィ入門
-
今日から使える! MATLAB 数値計算から古典制御まで
-
IDLプログラミング入門―基本概念から3次元グラフィックス
-
LabVIEW画像計測入門
-
使える! MATLAB/Simulinkプログラミング
-
OpenCVによるコンピュータビジョン・機械学習入門
-
GPUプログラミング入門 -CUDA5による実装
-
pixivエンジニアが教えるプログラミング入門