統計学勉強会 第02回

R-Studioの使い方 基礎編

2018/11/01
井出草平

R-Studioの利点

R-Studioの最大の魅力はドキュメントとRの実行が同時にできることである。そのため、レポートの提出や研究ノートの作成に最適なツールとなる。マウス操作で統計分析が簡便になるといった利点はないが、Rを使用する場合の記録やまとめはR-Studioを使うとよい。

R-Studioに含まれるR Markdownでは文章の表示とRの実行が同時にできる。研究ノートをテキストファイルなどで作成し、Rのスクリプトファイルを残すという方法も悪くないが、R Markdownでは、文章の中にコマンドとその実行昨日までを同梱できるため、ファイルが複数になることがない。利点としては以下の4点が考えられる。

  1. 研究ノートが散逸しにくい
  2. 結果をレポートに貼り付けるなどのコピペミスが発生しない
  3. コマンドも一緒に書かれているので、読む側もどのような分析をしたかがわかる
  4. 分析を再実行・部分変更することが容易

Markdownの利点

Markdownは簡便な文書作成言語の一つ。現在のテクノロジー系の分野で最もよく使われている言語。


参考リンク

◇R-Studioのインストール

◇Markdown記法

◆R-Studioの3つのファイル形式

1. R Script
Rのスクリプトと同じもの。スクリプトだけ使うのであれば、Rと大差がない。これだけ使うのであれば、R-Studioを使う意味はない。


2. R Notebook
ノート作成に向いている。基本的にHTMLへの出力のためのもの。PDF、Wordにも出力できる。R Markdownと違い作者名や日時等は挿入されない(手動で挿入はできる)。手動で不足情報は補えるため、NotebookとMarkdownには大きな差はない。拡張子も同じRmdである。


3. R Markdown
こちらはレポート提出などを前提とした書式。R Notebookとの違いもほとんどないため、R Markdownで文書作成をするのかよい。


◆R Markdownの設定

◇Rの作業フォルダを決める

Rではsetwd()で指定するが、R-StudioではGUIで指定する。

[Tools]→[Global Options]

Default workimg directleyを指定する。

図ではc:/R。この設定は自由。Dropboxなどのクラウドサービスのフォルダを指定すると、バックアップがとれ、複数のPCで作業ができるという利点がある。ノーマルなRでは複雑なフォルダの指定は手間だったが、R-Studioではそれが可能である。

Rのバージョンアップをした時には、R versionのダイアログを変更すると、新しいRが使用できる。


◆R Markdownファイルの作成

[File]→[New File]→[R Markdown]

文書作成のダイアログが表示される。

タイトルと著者を入れる。
アウトプット形式をHTML、PDF、Wordの3つの中から選ぶ。


◆R Markdown作成

◇ヘッダー

ファイルの書式。

---
title: "Test Doc"
author: "Sohei IDE"
date: "2018年10月24日"
output: html_document
---

htmlをwordに書き換えると出力がWordに変更できるが、html_documentという標記であっても、Wordに出力は可能である。

◇Rコマンド

```{r}
summary(cars)
```  

{R}をつけるのがポイント。

◇R Markdownの保存

拡張子を"Rmd"として保存する。
Rは大文字がオフィシャルだが"rmd"でも構わない。

◇レンダリング

Knitをすると、執筆した文章をみることができる。
レポートを作成する場合はWordへの変換がよいが、研究ノートはHTMLがよい。

Knitをしないと書いた文章が見えないのはR Markdownの弱点の一つ。Atomエディタであれば、リアルタイムにレンダリングでできる。

R Notebookの場合はknitではなくPreviewボタンになる。

R Markdownはサンプルが初期設定で表示される。そのサンプルをレンダリングしたのが以下のもの。

Rのコマンドもすべて実行された形でHTMLになる。

◇コマンドを部分的に実行

コマンドを書く際には間違い、不完全なものを書くことになるので、最初からknitを実行できるわけではない。

分析一つひとつを確認するには、下の再生ボタンの形をしたものをクリックすると実行ができる。

このような部分をR-Studioではチャンク(chunk)と呼ぶ。実行すると以下のような形になる。

これはRにもともと含まれている自動車(car)のデータ。


◆R Markdownの使い道

最終時な分析をRで行わない時もR Markdownは使い道がある。

例えば、クロス集計表、分散分析、相関係数などの基礎分析はSPSSなどのGUIアプリで行うと非常に手間がかかる。代替案として、SPSSのシンタックスもあるが、SPSSのシンタックスは煩雑であり、書式も覚えにくいため、Rのコマンドの方が手早く書ける。また、研究ノートも同時にとることができるという利点もある。

もちろん、最終分析がRでできるなら、Rですべて計算すれば非常にスムーズであるのは言うまでもない。


◆R-Studioのエンコード

R-StudioではデフォルトではUTF-8で作動する。これはWindowsのエンコードをUTF-8に設定しなくてもよい。ノーマルなRではWindowsのエンコードに従うため、日本人が使う多くのPCではRのデータファイルはSift-JISに変更する必要があり、Rを使う際の煩雑さの一つになってた。

R-Studioでエンコードを変更する場合には、[Tools] > [Global Options…] から > [コード]ペインの > [Saving]タブの > [Default text encoding]で変更できる。

[Change]を押すとエンコードが選べる。
現在のOfficeで保存されるファイルはUTF-8であるため、R-Studioではエンコードをせず使える。現在のSPSSやPSPPもcsvを書きだすときはUTF-8なので、他の統計パッケージとの相性もよい。

バージョンによるエンコーディングの設定はこちらのページが詳しい。
http://kitamix.net/archives/default-text-encoding-with-r-studio/900


◆Markdownでの文書作成

R-Studioで使用するMarkdown記法は、他のテキストエディタ等でも使用できる。とりわけ文書作成をする際にはAtomエディタとMarkdown Preview Enhancedパッケージを使うのが最適。

Atom
https://atom.io/

Markdown Preview Enhanced
https://shd101wyy.github.io/markdown-preview-enhanced/#/

以下のような使い分けを行う。

個人的には、レイアウトをしっかり決めないといけない文章(例えば調査票や授業のレジメ)ではWordを使う。また、ほとんどの人はWordで文書作成をしているので、共同編集をする時にはWordを使うことになる。

それ以外の文章はMarkdownで書いていることが多い。特に、ブログはMarkdownが標準書式なので、原稿はMarkdownで書かないといけない。

Webページの作成の際に、HTMLファイルを作成するときにも、Markdownは役立つ。本来はこの用途のためにMarkdownは開発されたものである。HTMLを書くよりも、Markdownの方がはるかに簡単である。

同様のことはTexにも言える。TexはコマンドはMarkdownに比べて非常に煩雑である。Texが必要な時には、Markdownで文章を書いて、Texファイルにアウトプット。Texの書式を適用するとう手順で作成すると、非常に簡便である。

Wordなどのワープロソフトは「文章・構造」と「レイアウト」を同時に編集するツールだが、Markdownは文章・構造のみに集中できる利点がある。また、ハイパーリンクを含む場合には、ワープロソフトよりも圧倒的に使いやすい。ちなみに、この文章もAtom+Markdown Preview Enhancedで作成したものである。

なお、共同編集者がMarkdownができる場合には、Dropbox Paperを利用するのも一案である。

便利すぎて手放せない!Dropbox Paperとは&知っておきたい機能8選
https://ferret-plus.com/6826

取っ付きはGoogle Documentsの方が良いが、Markdownを習得すれば、Dropbox Paperで書きにくいということはない。