Polarsとpandasで学ぶ データ処理アイデアレシピ55

ポーラストパンダスデマナブデータショリアイデアレシピ55
Polarsとpandasで学ぶ データ処理アイデアレシピ55
自分メモ
気になった本やコミックの情報を自分に送れます

内容紹介

+ もっとみる

目次

準備1日目 pandas の概要

準備2日目 Polars の概要

特訓1日目 データの確認
01 データの表示
02 データの列名を確認
03 データの大きさの確認
04 各列のデータ型を確認
05 データの概要を確認
06 列ごとのユニークな要素数の確認
07 列ごとのユニークな要素を確認
08 ユニークな要素ごとに重複数のカウント
09 特定の列に対する統計量の確認

特訓2日目 データの操作
10 ファイルの読み込み
11 データフレームの特定ファイル形式への書き出し
12 データフレームのソート
13 データフレームの複製
14 データフレームの作成

特訓3日目 データの抽出
15 データフレームから複数列を抽出
16 データフレームから特定データ型の列抽出
17 データフレームの特定列の除外
18 データフレームの特定行の抽出
19 特定条件にマッチする行の抽出
20 複数条件にマッチする行の抽出1
21 複数条件にマッチする行の抽出2
22 特定列が欠損値でない行の抽出
23 欠損値を含む行の削除
24 値リストのどれかに合致する要素を持つ行の抽出
25 特定の文字列を含む行の抽出
26 指定された数だけランダムにデータをサンプリング

特訓4日目 データの加工
27 既存列へのデータ処理
28 特定列をデータ処理し、データ型を変更
29 既存列を用いて新規列を作成する
30 条件に応じた値の代入
31 列へのユーザー定義関数の適用
32 データフレームの列名を一括変更
33 データフレームの特定の列名を変更
34 欠損値の補完
35 NumPy 配列への変換
36 データのビニング
37 重複行の削除
38 データフレームの連結
39 データフレームの結合

特訓5日目 データの集計
40 列の集計結果を計算
41 列の集計結果を新規列として追加
42 累積和を計算
43 複数列の集計結果を計算

特訓6日目 時系列データの処理
44 日時データから年と月を取得する
45 時間軸に沿って値をシフトし、過去値の列を作る
46 行の差分を新規の列として追加する
47 時間に基づいた集約を行い、新規列を作成する
48 特定の期間ごとのデータの集計

特訓7日目 遅延評価
49 遅延評価の基礎(Python 編)
50 Polars の遅延評価機能lazy API
51 クエリ最適化とStreaming API

特訓8日目 実践パイプライン
52 EDA
53 前処理と特徴量エンジニアリング
54 機械学習モデルの学習
55 機械学習モデルの評価・推論

製品情報

製品名 Polarsとpandasで学ぶ データ処理アイデアレシピ55
著者名 著:冨山 吉孝 著:早川 裕樹 著:齋藤 慎一朗
発売日 2024年10月11日
価格 定価:3,960円(本体3,600円)
ISBN 978-4-06-536980-7
判型 B5変型
ページ数 368ページ

著者紹介

著:冨山 吉孝(トミヤマ ヨシタカ)

冨山吉孝 @johannyjm1
2015年に大阪大学工学部電子情報工学科を卒業後,大手通信会社にてインフラエンジニアに従事する.
その傍ら機械学習技術やシステム開発に興味を持ち,社内起業プロジェクトにてAIレコーディングアプリの開発・リリースをリード,Kaggleでは2022年にCompetitions Masterの称号を獲得した.
イベントやコミュニティの企画や運営にも積極的に携わり,2023年日本大学文理学部北原研究室との共催で自動作曲コンテストの「AIミュージックバトル!『弁財天』」を開催したほか,Polars の日本語コミュニティ"Polars-ja"の立ち上げに関わる.

著:早川 裕樹(ハヤカワ ユウキ)

早川裕樹 @yuki93753711
ITエンジニアとしてキャリアをスタートし,Kaggleとの出会いをきっかけにデータ分析の世界に浸る.電車の中やキャンプ場など,場所を問わずKaggleをするほどのめり込み,2022年にはKaggle Competitions Masterの称号を獲得した.データ分析コンペを愛するあまり,個人でもデータ分析コンペ「yukiCup」を開催.
現在は,ITコンサルティング企業にて、データ利活用案件を主に担当し顧客が抱える課題解決に向けて日々奮闘中.

著:齋藤 慎一朗(サイトウ シンイチロウ)

齋藤慎一朗 @sinchir0
2015年に東北大学大学院工学研究科を修了.大手日系SIerでシステムエンジニアとして数年の経験を積んだ後,データサイエンティストとしてのキャリアをスタート.機械学習技術の面白さに目覚める.電力,保険,航空など多岐にわたる業界の企業に対するデータ分析業務に従事.その後,特定のプロダクトに情熱を注ぎたいと考え,SaaS企業の研究開発職に就く.
現在は,自然言語処理技術の研究開発およびプロダクトへの適用に従事.Kaggle Competitions Expert.

オンライン書店で見る

ネット書店
  • Amazon
  • e-hon
  • HMV&BOOKS online
  • 紀伊國屋書店
  • セブンネットショッピング
  • TSUTAYA ONLINE
  • honto
  • Honya Club
  • 楽天ブックス