RとPentahoのインストール手順
- このページでは、Mac OS X上でRおよびPentaho(kettle)をインストールする手順を記します。
- これをMac上でやりたいが為に書いています。
- ちなみに、全くの初心者(=何が分からないかがワカラナイ人(=cnomiya))が書いています。
- なので、正しくない記述があれば、ガシガシと編集していただけると有り難いですっ!
- 特に 【課題】 や 【TODO】 な箇所が不明なので、分かる方、是非、教えてください!
前提条件
- X11がインストールされている事
Rのインストール
R for Mac OS X のインストール
- R for Mac OS Xを以下よりインストール
- http://cran.r-project.org/bin/macosx/ に行き、、、
- R-2.10.0.pkgをダウンロード&インストール。
tcltk のインストール
- tcltkをインストール
- http://cran.r-project.org/bin/macosx/tools/ に行き、、、
- tcltk-8.5.5-x11.dmgをダウンロード&インストール。
- http://cran.r-project.org/bin/macosx/tools/ に行き、、、
Rcmdr のインストール
- Rを起動。
- /Applications/R.app or R64.app をダブルクリック!
- メニュー[パッケージとデータ]-[パッケージインストーラ]選択
- Rパッケージインストーラの「一覧取得ボタン」クリック
- (=CRAN mirrorから「Japan (Tokyo)」を選択する)
- 「Rcmdr」でフィルタリング。
- パッケージ「Rcmdr」を選択→「パッケージの依存関係を解決」にチェックを入れる→「選択をインストール」クリック!
- メニュー[その他]-[X11サーバの起動]を選択
- メニュー[パッケージとデータ]-[パッケージマネージャ]を選択。
- パッケージ「Rcmdr」を探し、、、「未ロード」の左横のチェックをON!
- これで、Rcmdrが起動します。
- Rcmdrの起動を確認後、一度、RcmdrとRを終了します。
~/.Rprofileの作成
- ~/.Rprofileを作成し、以下を記述する。
- これで、グラフ描画時の文字化けが解消されます。
setHook(packageEvent("grDevices", "onLoad"), function(...){ grDevices::quartzFonts(sans=grDevices::quartzFont( c("Hiragino Kaku Gothic Pro W3", "Hiragino Kaku Gothic Pro W6", "Hiragino Kaku Gothic Pro W3", "Hiragino Kaku Gothic Pro W6"))) grDevices::quartz.options(family="sans") } ) attach(NULL, name = "MacJapanEnv") assign("familyset_hook", function() { if(names(dev.cur())=="quartz") par(family="sans")}, pos="MacJapanEnv") setHook("plot.new", get("familyset_hook", pos="MacJapanEnv"))
- これで、グラフ描画時の文字化けが解消されます。
RcmdrPlugin?.Qctools(SQC用プラグイン)のインストール
- 以下をダウンロードしてください。
- RcmdrPlugin.QCtools_1.02_bin.tar.gz
- ちなみに、このファイル、http://www.ec.kansai-u.ac.jp/user/arakit/RcmdrPlugin.QCtools_1.02.tar.gz をコンパイルした物です。
- が、しかし、、、現在(@2009-11-30)、ダウンロード可能な RcmdrPlugin?.QCtools_1.02.tar.gz が./configure; make; できないので、、、コンパイル済みの物をアップしておきます。
- もし、このような公開方法に問題があるようであれば、削除しますので cnomiya @ intra-mart.org までご連絡ください。
- RcmdrPlugin.QCtools_1.02_bin.tar.gz
- ~/Library/R/2.10/library/RcmdrPlugin.QCtoolsとなるように上記を解凍。
- 解凍後のtreeは以下の通り。
$ tree [~/Library/R/2.10/library/RcmdrPlugin.QCtools] . |-- DESCRIPTION |-- INDEX |-- Meta | |-- Rd.rds | |-- data.rds | |-- hsearch.rds | |-- links.rds | `-- package.rds |-- R | |-- RcmdrPlugin.QCtools | |-- RcmdrPlugin.QCtools.rdb | `-- RcmdrPlugin.QCtools.rdx |-- data | |-- A2.rda | |-- D3.rda | `-- D4.rda |-- etc | `-- menus.txt |-- help | |-- AnIndex | |-- RcmdrPlugin.QCtools.rdb | |-- RcmdrPlugin.QCtools.rdx | |-- aliases.rds | `-- paths.rds `-- html `-- 00Index.html 6 directories, 20 files
- 解凍後のtreeは以下の通り。
関連するライブラリのインストール
- Rを起動。
- メニュー[パッケージとデータ]-[パッケージインストーラ]選択
- Rパッケージインストーラの「一覧取得ボタン」クリック&「qc」でフィルタリング。
- 以下のパッケージを選択→「パッケージの依存関係を解決」にチェックを入れる→「選択をインストール」クリック!
- メニュー[パッケージとデータ]-[パッケージマネージャ]にて、インストールしたパッケージをロード。
インストールしたパッケージ
- 以下、QCな図形の描画に必須と思われるパッケージ(【TODO】 過不足あれば編集してっ!)
| パッケージ | バージョン | 備考 |
| qcc | 2.0 | これは必須! |
| XML | 2.6-0 | qccで必要(【TODO】 「パッケージの依存関係を解決」をチェックしていればqccインストール時に自動解決されるかも!?) |
| histogram | 0.0-21 | 【TODO】 ヒストグラムの描画に必要!? |
- 私(=cnomiya)の環境では、以下もインストールしてあります。(【TODO】 依存関係分かっていません。。。)
| パッケージ | バージョン | 備考 |
| graphicsQC | 1.0-4 | - |
| IQCC | 1.0 | - |
| QCA | 0.6-3 | - |
| QCA3 | 0.0-2 | - |
| QCAGUI | 1.3-7 | - |
| RcmdrPlugin?.qcc | 1.0-6 | - |
ロード済みになっているパッケージ
- car
- datasets
- graphics
- grDevices
- histogram
- methods
- qcc
- Rcmdr
- relimp
- tcltk
- stats
- utils
- 以下のエラー等、qccのロードに失敗した場合は、qccを再インストールしてください。
Error in readRDS(mapfile) : ReadItem: 恐らくRの後のバージョンによって書かれた未知のタイプ0 Error : パッケージ 'qcc' 中の R コードをロードできません エラー: 'qcc' に対するパッケージもしくは名前空間のロードが失敗しました >
RcmdrPlugin?.Qctools のロード
- Rを起動。
- Rコンソールにて以下を実行
> library(Rcmdr)
- [パッケージマネージャ]でRcmdrをロードするのと同じらしい。
- これで、Rコマンダーが起動しますっ!
- メニュー[ツール]-[Rcmdrプラグインのロード...]を選択。
- 先ほどインストールした「RcmdrPlugin?.QCtools」を選択し、OKボタンを押下。
- Rコマンダーを再起動しないとプラグインを利用できません。再起動しますか?
- と、聞かれるので、[Yes]を押下。
- Rコマンダーを再起動しないとプラグインを利用できません。再起動しますか?
- メニューに[QCツール]が追加されている事を確認する。
試してみよう!
- Rコマンダーが起動している状態で、、、
- メニュー[データ]-[データのインポート]-[テキストファイルまたはクリップボード, URLから...]を選択。
- フィールドの区切り記号を、インポートするデータにあわせて選択し、OKを押下。
- 【TODO】 その他の項目は適当です。。。
- ここでは、「カンマ」を選択します。
- 【TODO】 その他の項目は適当です。。。
- ファイル選択ダイアログが表示されるので、インポートするファイルを選択する。
- 適当(?)なcsvファイルを選択します。
- ここでは、これをインポートしました。
- 適当(?)なcsvファイルを選択します。
- Rコマンダー上のボタン[データセットを表示]を押下。
- インポートしたデータが表示されます。
- 右にスクロールしないとデータが見えません。
- データ量が多いと、その分、時間が掛かります。
- データが表示される事を確認したら、ウィンドウを閉じます。
- インポートしたデータが表示されます。
パレート図の表示
- メニュー[QCツール]-[パレート図...]を選択。
- 「1つ以上選択」となっている物を選択し、[OK]を押下。
- ここでは、X変数に「転送容量」、項目名の変数に「SID」を選択しました。
- [OK]押下後、[キャンセル]をクリックします。
- こうしないとパレート図が表示されませんでした。。。
- これでパレート図が表示されます。
- 【課題】 図の中の文字が化けている。
ヒストグラムの表示
- メニュー[QCツール]-[QCヒストグラム...]を選択
- 何も考えず[OK]をクリック!(& 続いて[キャンセル]押下)
- これでヒストグラムが表示されます。
- 【課題】 図の中の文字が化けている。
- 次に、、、
- メニュー[QCツール]-[QCヒストグラム...]を選択
- [層別のプロット]をクリックし、SIDを選択。
- [OK]ボタンをクリック
- エラーが発生!
エラー: 使われていない引数 (layout = c(1, ng), xlab = "")
- 意味不明です。。。
- エラーが発生!
Pentaho Data Integration のインストール
- Pentaho Data Integrationを以下よりインストール
- http://sourceforge.net/projects/pentaho/files/ に行き、、、
- Data Integration - 3.2.0-stable - pdi-ce-3.2.0-stable.dmgをダウンロード。
- 上記ディスクイメージを展開すると「Kettle.app」が見えます。
- これを任意のディレクトリにコピーしてください。
- 「Kettle.app」が「Pentaho Data Integration」のことです。
Pentaho Data Integration Previously Kettle
- 「Kettle.app」をダブルクリックで起動。
- [リポジトリを使用しない]ボタンを押下で、あんなデータや、こんなデータを加工可能な画面が表示されます。
- これがFreeなんて凄いっ!
【課題】
- 【課題】 ヒストグラムの[層別のプロット]ができない。
- 【課題】 パッケージの依存関係を全く理解していない。
添付ファイル
- RcmdrPlugin.QCtools_1.02_bin.tar.gz (30.9 kB) - shinomiya によって 2009/11/30 22:21:49 に登録されました。
- file1_short.csv (140.6 kB) - shinomiya によって 2009/11/30 22:22:11 に登録されました。
