RとPentahoのインストール手順

  • このページでは、Mac OS X上でRおよびPentaho(kettle)をインストールする手順を記します。
  • これをMac上でやりたいが為に書いています。
  • ちなみに、全くの初心者(=何が分からないかがワカラナイ人(=cnomiya))が書いています。
    • なので、正しくない記述があれば、ガシガシと編集していただけると有り難いですっ!
    • 特に 【課題】【TODO】 な箇所が不明なので、分かる方、是非、教えてください!

前提条件

  • X11がインストールされている事

Rのインストール

R for Mac OS X のインストール

tcltk のインストール

Rcmdr のインストール

  1. Rを起動。
    • /Applications/R.app or R64.app をダブルクリック!
  2. メニュー[パッケージとデータ]-[パッケージインストーラ]選択
  3. Rパッケージインストーラの「一覧取得ボタン」クリック
    • (=CRAN mirrorから「Japan (Tokyo)」を選択する)
  4. Rcmdr」でフィルタリング。
  5. パッケージ「Rcmdr」を選択→「パッケージの依存関係を解決」にチェックを入れる→「選択をインストール」クリック!
  6. メニュー[その他]-[X11サーバの起動]を選択
  7. メニュー[パッケージとデータ]-[パッケージマネージャ]を選択。
  8. パッケージ「Rcmdr」を探し、、、「未ロード」の左横のチェックをON!
  • これで、Rcmdrが起動します。
    • Rcmdrの起動を確認後、一度、RcmdrとRを終了します。

~/.Rprofileの作成

  • ~/.Rprofileを作成し、以下を記述する。
    • これで、グラフ描画時の文字化けが解消されます。
      setHook(packageEvent("grDevices", "onLoad"),
                          function(...){
                            grDevices::quartzFonts(sans=grDevices::quartzFont(
                              c("Hiragino Kaku Gothic Pro W3",
                                "Hiragino Kaku Gothic Pro W6",
                                "Hiragino Kaku Gothic Pro W3",
                                "Hiragino Kaku Gothic Pro W6")))
                            grDevices::quartz.options(family="sans")
                          }
      )
      attach(NULL, name = "MacJapanEnv")
      assign("familyset_hook",
             function() { if(names(dev.cur())=="quartz") par(family="sans")},
             pos="MacJapanEnv")
      setHook("plot.new", get("familyset_hook", pos="MacJapanEnv"))
      

RcmdrPlugin?.Qctools(SQC用プラグイン)のインストール

  • 以下をダウンロードしてください。
  • ~/Library/R/2.10/library/RcmdrPlugin.QCtoolsとなるように上記を解凍。
    • 解凍後のtreeは以下の通り。
      $ tree    [~/Library/R/2.10/library/RcmdrPlugin.QCtools]
      .
      |-- DESCRIPTION
      |-- INDEX
      |-- Meta
      |   |-- Rd.rds
      |   |-- data.rds
      |   |-- hsearch.rds
      |   |-- links.rds
      |   `-- package.rds
      |-- R
      |   |-- RcmdrPlugin.QCtools
      |   |-- RcmdrPlugin.QCtools.rdb
      |   `-- RcmdrPlugin.QCtools.rdx
      |-- data
      |   |-- A2.rda
      |   |-- D3.rda
      |   `-- D4.rda
      |-- etc
      |   `-- menus.txt
      |-- help
      |   |-- AnIndex
      |   |-- RcmdrPlugin.QCtools.rdb
      |   |-- RcmdrPlugin.QCtools.rdx
      |   |-- aliases.rds
      |   `-- paths.rds
      `-- html
          `-- 00Index.html
      
      6 directories, 20 files
      
      

関連するライブラリのインストール

  1. Rを起動。
  2. メニュー[パッケージとデータ]-[パッケージインストーラ]選択
  3. Rパッケージインストーラの「一覧取得ボタン」クリック&「qc」でフィルタリング。
  4. 以下のパッケージを選択→「パッケージの依存関係を解決」にチェックを入れる→「選択をインストール」クリック!
  5. メニュー[パッケージとデータ]-[パッケージマネージャ]にて、インストールしたパッケージをロード。

インストールしたパッケージ

  • 以下、QCな図形の描画に必須と思われるパッケージ(【TODO】 過不足あれば編集してっ!)
パッケージ バージョン 備考
qcc 2.0 これは必須!
XML 2.6-0 qccで必要(【TODO】 「パッケージの依存関係を解決」をチェックしていればqccインストール時に自動解決されるかも!?)
histogram 0.0-21 【TODO】 ヒストグラムの描画に必要!?
  • 私(=cnomiya)の環境では、以下もインストールしてあります。(【TODO】 依存関係分かっていません。。。)
パッケージ バージョン 備考
graphicsQC 1.0-4 -
IQCC 1.0 -
QCA 0.6-3 -
QCA3 0.0-2 -
QCAGUI 1.3-7 -
RcmdrPlugin?.qcc 1.0-6 -

ロード済みになっているパッケージ

  • car
  • datasets
  • graphics
  • grDevices
  • histogram
  • methods
  • qcc
  • Rcmdr
  • relimp
  • tcltk
  • stats
  • utils
  • 以下のエラー等、qccのロードに失敗した場合は、qccを再インストールしてください。
    Error in readRDS(mapfile) : 
       ReadItem: 恐らくRの後のバージョンによって書かれた未知のタイプ0 
    Error :  パッケージ 'qcc' 中の R コードをロードできません 
     エラー:  'qcc' に対するパッケージもしくは名前空間のロードが失敗しました 
    > 
    

RcmdrPlugin?.Qctools のロード

  1. Rを起動。
  2. Rコンソールにて以下を実行
    > library(Rcmdr)
    
    • [パッケージマネージャ]でRcmdrをロードするのと同じらしい。
    • これで、Rコマンダーが起動しますっ!
  3. メニュー[ツール]-[Rcmdrプラグインのロード...]を選択。
  4. 先ほどインストールした「RcmdrPlugin?.QCtools」を選択し、OKボタンを押下。
    • Rコマンダーを再起動しないとプラグインを利用できません。再起動しますか?
      • と、聞かれるので、[Yes]を押下。
  5. メニューに[QCツール]が追加されている事を確認する。

試してみよう!

  • Rコマンダーが起動している状態で、、、

  1. メニュー[データ]-[データのインポート]-[テキストファイルまたはクリップボード, URLから...]を選択。
  2. フィールドの区切り記号を、インポートするデータにあわせて選択し、OKを押下。
    • 【TODO】 その他の項目は適当です。。。
      • ここでは、「カンマ」を選択します。
  3. ファイル選択ダイアログが表示されるので、インポートするファイルを選択する。
    • 適当(?)なcsvファイルを選択します。
      • ここでは、これをインポートしました。
  4. Rコマンダー上のボタン[データセットを表示]を押下。
    • インポートしたデータが表示されます。
      • 右にスクロールしないとデータが見えません。
      • データ量が多いと、その分、時間が掛かります。
    • データが表示される事を確認したら、ウィンドウを閉じます。

パレート図の表示

  1. メニュー[QCツール]-[パレート図...]を選択。
  2. 「1つ以上選択」となっている物を選択し、[OK]を押下。
    • ここでは、X変数に「転送容量」、項目名の変数に「SID」を選択しました。
  3. [OK]押下後、[キャンセル]をクリックします。
    • こうしないとパレート図が表示されませんでした。。。

  • これでパレート図が表示されます。
    • 【課題】 図の中の文字が化けている。

ヒストグラムの表示

  1. メニュー[QCツール]-[QCヒストグラム...]を選択
  2. 何も考えず[OK]をクリック!(& 続いて[キャンセル]押下)
  • これでヒストグラムが表示されます。
    • 【課題】 図の中の文字が化けている。
  • 次に、、、
  1. メニュー[QCツール]-[QCヒストグラム...]を選択
  2. [層別のプロット]をクリックし、SIDを選択。
  3. [OK]ボタンをクリック
    • エラーが発生!
      エラー:  
         使われていない引数 (layout = c(1, ng), xlab = "") 
      
      • 意味不明です。。。

Pentaho Data Integration のインストール

  • 上記ディスクイメージを展開すると「Kettle.app」が見えます。
    • これを任意のディレクトリにコピーしてください。
    • 「Kettle.app」が「Pentaho Data Integration」のことです。
      Pentaho Data Integration
      Previously Kettle
      
  • 「Kettle.app」をダブルクリックで起動。
    • [リポジトリを使用しない]ボタンを押下で、あんなデータや、こんなデータを加工可能な画面が表示されます。
    • これがFreeなんて凄いっ!

【課題】

  • 【課題】 ヒストグラムの[層別のプロット]ができない。
  • 【課題】 パッケージの依存関係を全く理解していない。

添付ファイル