データサイエンスのためのデータベース
- 電子あり
内容紹介
目次
第1章 はじめに
1.1 データサイエンスのためのデータベース
1.2 データベースの歴史
1.2.1 関係データベース
1.2.2 NoSQL
第2章 関係データベースの基本
2.1 データの関係モデル
2.1.1 「関係」の概念とそれに基づくデータの表現
2.1.2 データのリレーションによる表現
2.1.3 リレーションのテーブルによる表示
2.1.4 テーブルに関する注意
2.1.5 関係スキーマ
2.1.6 インスタンス
2.1.7 タプルからの成分の切り出し
2.1.8 第1正規形
2.1.9 超キーと候補キー,主キー
2.2 整合性制約
2.2.1 ドメイン制約
2.2.2 主キー制約
2.2.3 外部キーと参照整合性制約
2.3 関係代数
2.3.1 テーブルからのデータ検索
2.3.2 関係代数の集合演算
2.3.3 「関係代数」独自の演算
2.3.4 実テーブルと導出テーブル,ビューテーブル
第3章 SQLと正規化
3.1 SQL
3.1.1 データ検索
3.1.2 データベースの定義・更新・管理
3.2 正規化
3.2.1 更新時異常
3.2.2 関数従属性
3.2.3 完全関数従属性と第2正規形
3.2.4 推移従属性と第3正規形
3.2.5 無損失分解
第4章 データの可視化と分析
4.1 データの可視化による分析
4.2 データベースの可視化
4.2.1 グラフによるデータベースの可視化
4.2.2 表計算ソフトとSQLを用いたデータベースの可視化
4.2.3 データベース可視化ソフトの利用
4.3 OLAP
4.3.1 OLAPの考え方
4.3.2 エクセルのピボットテーブルを用いたOLAP的分析
第5章 NoSQL
5.1 RDBMSの問題とNoSQLの分類
5.2 さまざまなNoSQLデータベース
5.2.1 Key-Value Storeデータベース
5.2.2 列指向データベース
5.2.3 ドキュメント指向データベース
5.2.4 RDFデータベース
5.2.5 グラフデータベース
5.2.6 その他のNoSQLデータベース
5.3 まとめ
第6章 実践的データ分析事例
6.1 RDBMSを用いたWikipediaダンプデータの分析
6.1.1 Wikipediaダンプデータ
6.1.2 言語間リンクを用いた翻訳辞書の構築
6.1.3 リダイレクトを用いた異表記辞書の構築
6.2 その他のソフトウェアと組み合わせたWikipediaダンプデータの分析
6.2.1 Wikipediaの情報を用いた単語の曖昧性解消
6.2.2 実験用データの構築
6.2.3 実験結果とその分析
関連シリーズ
-
ことばの意味を計算するしくみ
-
データサイエンスはじめの一歩
-
転移学習
-
応用基礎としてのデータサイエンス
-
詳解 3次元点群処理
-
入門講義 量子コンピュータ
-
現場で活用するための機械学習エンジニアリング
-
Juliaで作って学ぶベイズ統計学
-
はじめての機械学習
-
教養としてのデータサイエンス
-
ディープラーニング 学習する機械
-
これならわかる機械学習入門
-
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析
-
絵でわかるネットワーク
-
絵でわかるサイバーセキュリティ
-
Pythonで学ぶ強化学習
-
統計モデルと推測
-
スタンフォード ベクトル・行列からはじめる最適化数学
-
データサイエンスの基礎
-
イラストで学ぶディープラーニング
-
テキスト・画像・音声データ分析
-
ベイズ深層学習
-
イラストで学ぶ ヒューマンインタフェース
-
コンパクトデータ構造
-
しっかり学ぶ数理最適化
-
Raspberry Piではじめる機械学習
-
マスターアルゴリズム 世界を再構築する「究極の機械学習」
-
今度こそわかる量子コンピューター
-
絵でわかるスーパーコンピュータ
-
ベイズ推論による機械学習入門
-
これならわかる深層学習入門
-
情報メディア論
-
イラストで学ぶ 音声認識
-
イラストで学ぶ 機械学習 最小二乗法による識別モデル学習