データサイエンスのためのデータベース

データサイエンスノタメノデータベース
  • 電子あり
データサイエンスのためのデータベース
自分メモ
気になった本やコミックの情報を自分に送れます

内容紹介

ツールとして不可欠な技術をコンパクトに!

・データベースの活用を目的とし、SQLの操作は「問い合わせ」を中心に、MySQLに準拠して解説!
・関係データベースの基本とその使い方、データの可視化、NoSQLまで網羅!
・実践的なデータ分析事例として、Wikipediaダンプデータの分析を紹介!

【サポートページ】
https://sites.google.com/view/dbfordatascience

【主な内容】
1章 はじめに
2章 関係データベースの基本
3章 SQLと正規化
4章 データの可視化と分析
5章 NoSQL
6章 実践的データ分析事例

【「巻頭言」より抜粋】
文部科学省は「数理及びデータサイエンスに係る教育強化拠点」6 大学(北海道大学、東京大学、滋賀大学、京都大学、大阪大学、九州大学)を選定し、拠点校は「数理・データサイエンス教育強化拠点コンソーシアム」を設立して、全国の大学に向けたデータサイエンス教育の指針や教育コンテンツの作成をおこなっています。
本シリーズは、コンソーシアムのカリキュラム分科会が作成したデータサイエンスに関するスキルセットに準拠した標準的な教科書シリーズを目指して編集されました。またコンソーシアムの教材分科会委員の先生方には各巻の原稿を読んでいただき、貴重なコメントをいただきました。
データサイエンスは、従来からの統計学とデータサイエンスに必要な情報学の二つの分野を基礎としますが、データサイエンスの教育のためには、データという共通点からこれらの二つの分野を融合的に扱うことが必要です。この点で本シリーズは、これまでの統計学やコンピュータ科学の個々の教科書とは性格を異にしており、ビッグデータの時代にふさわしい内容を提供します。本シリーズが全国の大学で活用されることを期待いたします。
――編集委員長 竹村彰通(滋賀大学データサイエンス学部学部長、教授)

【推薦の言葉】
データサイエンスの教育の場や実践の場で利用されることを強く意識して、動機付け、題材選び、説明の仕方、例題選びが工夫されており、従来の教科書とは異なりデータサイエンス向けの入門書となっている。
――北川源四郎(東京大学特任教授、元統計数理研究所所長)

国を挙げて先端IT人材の育成を迅速に進める必要があり、本シリーズはまさにこの目的に合致しています。本シリーズが、初学者にとって信頼できる案内人となることを期待します。
――杉山将(理化学研究所革新知能統合研究センターセンター長、東京大学教授)

目次

第1章 はじめに
1.1 データサイエンスのためのデータベース
1.2 データベースの歴史
1.2.1 関係データベース
1.2.2 NoSQL

第2章 関係データベースの基本
2.1 データの関係モデル
2.1.1 「関係」の概念とそれに基づくデータの表現
2.1.2 データのリレーションによる表現
2.1.3 リレーションのテーブルによる表示
2.1.4 テーブルに関する注意
2.1.5 関係スキーマ
2.1.6 インスタンス
2.1.7 タプルからの成分の切り出し
2.1.8 第1正規形
2.1.9 超キーと候補キー,主キー
2.2 整合性制約
2.2.1 ドメイン制約
2.2.2 主キー制約
2.2.3 外部キーと参照整合性制約
2.3 関係代数
2.3.1 テーブルからのデータ検索
2.3.2 関係代数の集合演算
2.3.3 「関係代数」独自の演算
2.3.4 実テーブルと導出テーブル,ビューテーブル

第3章 SQLと正規化
3.1 SQL
3.1.1 データ検索
3.1.2 データベースの定義・更新・管理
3.2 正規化
3.2.1 更新時異常
3.2.2 関数従属性
3.2.3 完全関数従属性と第2正規形
3.2.4 推移従属性と第3正規形
3.2.5 無損失分解

第4章 データの可視化と分析
4.1 データの可視化による分析
4.2 データベースの可視化
4.2.1 グラフによるデータベースの可視化
4.2.2 表計算ソフトとSQLを用いたデータベースの可視化
4.2.3 データベース可視化ソフトの利用
4.3 OLAP
4.3.1 OLAPの考え方
4.3.2 エクセルのピボットテーブルを用いたOLAP的分析

第5章 NoSQL
5.1 RDBMSの問題とNoSQLの分類
5.2 さまざまなNoSQLデータベース
5.2.1 Key-Value Storeデータベース
5.2.2 列指向データベース
5.2.3 ドキュメント指向データベース
5.2.4 RDFデータベース
5.2.5 グラフデータベース
5.2.6 その他のNoSQLデータベース
5.3 まとめ

第6章 実践的データ分析事例
6.1 RDBMSを用いたWikipediaダンプデータの分析
6.1.1 Wikipediaダンプデータ
6.1.2 言語間リンクを用いた翻訳辞書の構築
6.1.3 リダイレクトを用いた異表記辞書の構築
6.2 その他のソフトウェアと組み合わせたWikipediaダンプデータの分析
6.2.1 Wikipediaの情報を用いた単語の曖昧性解消
6.2.2 実験用データの構築
6.2.3 実験結果とその分析

製品情報

製品名 データサイエンスのためのデータベース
著者名 著:吉岡 真治 著:村井 哲也 編:水田 正弘
発売日 2020年04月20日
価格 定価 : 本体2,400円(税別)
ISBN 978-4-06-519310-5
判型 B5変型
ページ数 160ページ
シリーズ データサイエンス入門シリーズ

著者紹介

著:吉岡 真治(ヨシオカ マサハル)

北海道大学大学院情報科学研究院 教授

著:村井 哲也(ムライ テツヤ)

公立千歳科学技術大学理工学部 教授

編:水田 正弘(ミズタ マサヒロ)

北海道大学情報基盤センター 教授

オンライン書店で見る