2018/11/01
井出草平
R-Studioの最大の魅力はドキュメントとRの実行が同時にできることである。そのため、レポートの提出や研究ノートの作成に最適なツールとなる。マウス操作で統計分析が簡便になるといった利点はないが、Rを使用する場合の記録やまとめはR-Studioを使うとよい。
R-Studioに含まれるR Markdownでは文章の表示とRの実行が同時にできる。研究ノートをテキストファイルなどで作成し、Rのスクリプトファイルを残すという方法も悪くないが、R Markdownでは、文章の中にコマンドとその実行昨日までを同梱できるため、ファイルが複数になることがない。利点としては以下の4点が考えられる。
Markdownは簡便な文書作成言語の一つ。現在のテクノロジー系の分野で最もよく使われている言語。
1. R Script
Rのスクリプトと同じもの。スクリプトだけ使うのであれば、Rと大差がない。これだけ使うのであれば、R-Studioを使う意味はない。
2. R Notebook
ノート作成に向いている。基本的にHTMLへの出力のためのもの。PDF、Wordにも出力できる。R Markdownと違い作者名や日時等は挿入されない(手動で挿入はできる)。手動で不足情報は補えるため、NotebookとMarkdownには大きな差はない。拡張子も同じRmdである。
3. R Markdown
こちらはレポート提出などを前提とした書式。R Notebookとの違いもほとんどないため、R Markdownで文書作成をするのかよい。
Rではsetwd()
で指定するが、R-StudioではGUIで指定する。
[Tools]→[Global Options]
Default workimg directleyを指定する。
図ではc:/R
。この設定は自由。Dropboxなどのクラウドサービスのフォルダを指定すると、バックアップがとれ、複数のPCで作業ができるという利点がある。ノーマルなRでは複雑なフォルダの指定は手間だったが、R-Studioではそれが可能である。
Rのバージョンアップをした時には、R versionのダイアログを変更すると、新しいRが使用できる。
[File]→[New File]→[R Markdown]
文書作成のダイアログが表示される。
タイトルと著者を入れる。
アウトプット形式をHTML、PDF、Wordの3つの中から選ぶ。
ファイルの書式。
---
title: "Test Doc"
author: "Sohei IDE"
date: "2018年10月24日"
output: html_document
---
htmlをwordに書き換えると出力がWordに変更できるが、html_documentという標記であっても、Wordに出力は可能である。
```{r} summary(cars) ```
{R}をつけるのがポイント。
拡張子を"Rmd"として保存する。
Rは大文字がオフィシャルだが"rmd"でも構わない。
Knitをすると、執筆した文章をみることができる。
レポートを作成する場合はWordへの変換がよいが、研究ノートはHTMLがよい。
Knitをしないと書いた文章が見えないのはR Markdownの弱点の一つ。Atomエディタであれば、リアルタイムにレンダリングでできる。
R Notebookの場合はknitではなくPreviewボタンになる。
R Markdownはサンプルが初期設定で表示される。そのサンプルをレンダリングしたのが以下のもの。
Rのコマンドもすべて実行された形でHTMLになる。
コマンドを書く際には間違い、不完全なものを書くことになるので、最初からknitを実行できるわけではない。
分析一つひとつを確認するには、下の再生ボタンの形をしたものをクリックすると実行ができる。
このような部分をR-Studioではチャンク(chunk)と呼ぶ。実行すると以下のような形になる。
これはRにもともと含まれている自動車(car)のデータ。
最終時な分析をRで行わない時もR Markdownは使い道がある。
例えば、クロス集計表、分散分析、相関係数などの基礎分析はSPSSなどのGUIアプリで行うと非常に手間がかかる。代替案として、SPSSのシンタックスもあるが、SPSSのシンタックスは煩雑であり、書式も覚えにくいため、Rのコマンドの方が手早く書ける。また、研究ノートも同時にとることができるという利点もある。
もちろん、最終分析がRでできるなら、Rですべて計算すれば非常にスムーズであるのは言うまでもない。
R-StudioではデフォルトではUTF-8で作動する。これはWindowsのエンコードをUTF-8に設定しなくてもよい。ノーマルなRではWindowsのエンコードに従うため、日本人が使う多くのPCではRのデータファイルはSift-JISに変更する必要があり、Rを使う際の煩雑さの一つになってた。
R-Studioでエンコードを変更する場合には、[Tools] > [Global Options…] から > [コード]ペインの > [Saving]タブの > [Default text encoding]で変更できる。
[Change]を押すとエンコードが選べる。
現在のOfficeで保存されるファイルはUTF-8であるため、R-Studioではエンコードをせず使える。現在のSPSSやPSPPもcsvを書きだすときはUTF-8なので、他の統計パッケージとの相性もよい。
バージョンによるエンコーディングの設定はこちらのページが詳しい。
http://kitamix.net/archives/default-text-encoding-with-r-studio/900
R-Studioで使用するMarkdown記法は、他のテキストエディタ等でも使用できる。とりわけ文書作成をする際にはAtomエディタとMarkdown Preview Enhancedパッケージを使うのが最適。
Atom
https://atom.io/
Markdown Preview Enhanced
https://shd101wyy.github.io/markdown-preview-enhanced/#/
以下のような使い分けを行う。
個人的には、レイアウトをしっかり決めないといけない文章(例えば調査票や授業のレジメ)ではWordを使う。また、ほとんどの人はWordで文書作成をしているので、共同編集をする時にはWordを使うことになる。
それ以外の文章はMarkdownで書いていることが多い。特に、ブログはMarkdownが標準書式なので、原稿はMarkdownで書かないといけない。
Webページの作成の際に、HTMLファイルを作成するときにも、Markdownは役立つ。本来はこの用途のためにMarkdownは開発されたものである。HTMLを書くよりも、Markdownの方がはるかに簡単である。
同様のことはTexにも言える。TexはコマンドはMarkdownに比べて非常に煩雑である。Texが必要な時には、Markdownで文章を書いて、Texファイルにアウトプット。Texの書式を適用するとう手順で作成すると、非常に簡便である。
Wordなどのワープロソフトは「文章・構造」と「レイアウト」を同時に編集するツールだが、Markdownは文章・構造のみに集中できる利点がある。また、ハイパーリンクを含む場合には、ワープロソフトよりも圧倒的に使いやすい。ちなみに、この文章もAtom+Markdown Preview Enhancedで作成したものである。
なお、共同編集者がMarkdownができる場合には、Dropbox Paperを利用するのも一案である。
便利すぎて手放せない!Dropbox Paperとは&知っておきたい機能8選
https://ferret-plus.com/6826
取っ付きはGoogle Documentsの方が良いが、Markdownを習得すれば、Dropbox Paperで書きにくいということはない。