データサイエンスのためのデータベース

データサイエンスノタメノデータベース
  • 電子あり
データサイエンスのためのデータベース
自分メモ
気になった本やコミックの情報を自分に送れます

内容紹介

+ もっとみる

目次

第1章 はじめに
1.1 データサイエンスのためのデータベース
1.2 データベースの歴史
1.2.1 関係データベース
1.2.2 NoSQL

第2章 関係データベースの基本
2.1 データの関係モデル
2.1.1 「関係」の概念とそれに基づくデータの表現
2.1.2 データのリレーションによる表現
2.1.3 リレーションのテーブルによる表示
2.1.4 テーブルに関する注意
2.1.5 関係スキーマ
2.1.6 インスタンス
2.1.7 タプルからの成分の切り出し
2.1.8 第1正規形
2.1.9 超キーと候補キー,主キー
2.2 整合性制約
2.2.1 ドメイン制約
2.2.2 主キー制約
2.2.3 外部キーと参照整合性制約
2.3 関係代数
2.3.1 テーブルからのデータ検索
2.3.2 関係代数の集合演算
2.3.3 「関係代数」独自の演算
2.3.4 実テーブルと導出テーブル,ビューテーブル

第3章 SQLと正規化
3.1 SQL
3.1.1 データ検索
3.1.2 データベースの定義・更新・管理
3.2 正規化
3.2.1 更新時異常
3.2.2 関数従属性
3.2.3 完全関数従属性と第2正規形
3.2.4 推移従属性と第3正規形
3.2.5 無損失分解

第4章 データの可視化と分析
4.1 データの可視化による分析
4.2 データベースの可視化
4.2.1 グラフによるデータベースの可視化
4.2.2 表計算ソフトとSQLを用いたデータベースの可視化
4.2.3 データベース可視化ソフトの利用
4.3 OLAP
4.3.1 OLAPの考え方
4.3.2 エクセルのピボットテーブルを用いたOLAP的分析

第5章 NoSQL
5.1 RDBMSの問題とNoSQLの分類
5.2 さまざまなNoSQLデータベース
5.2.1 Key-Value Storeデータベース
5.2.2 列指向データベース
5.2.3 ドキュメント指向データベース
5.2.4 RDFデータベース
5.2.5 グラフデータベース
5.2.6 その他のNoSQLデータベース
5.3 まとめ

第6章 実践的データ分析事例
6.1 RDBMSを用いたWikipediaダンプデータの分析
6.1.1 Wikipediaダンプデータ
6.1.2 言語間リンクを用いた翻訳辞書の構築
6.1.3 リダイレクトを用いた異表記辞書の構築
6.2 その他のソフトウェアと組み合わせたWikipediaダンプデータの分析
6.2.1 Wikipediaの情報を用いた単語の曖昧性解消
6.2.2 実験用データの構築
6.2.3 実験結果とその分析

製品情報

製品名 データサイエンスのためのデータベース
著者名 著:吉岡 真治 著:村井 哲也 編:水田 正弘
発売日 2020年04月20日
価格 定価:2,640円(本体2,400円)
ISBN 978-4-06-519310-5
判型 B5変型
ページ数 160ページ
シリーズ データサイエンス入門シリーズ

著者紹介

著:吉岡 真治(ヨシオカ マサハル)

北海道大学大学院情報科学研究院 教授

著:村井 哲也(ムライ テツヤ)

公立千歳科学技術大学理工学部 教授

編:水田 正弘(ミズタ マサヒロ)

北海道大学情報基盤センター 教授

オンライン書店で見る