Chapter 2 Week 1: オリエンテーション、R(Studio)のインストールと操作、R Markdown
2.1 「統計処理」とは
2.1.1 量的研究、質的研究
本講義のタイトルにある「統計処理」は、研究の目的などに応じて得られたデータをまとめたり、可視化したり解析する行為を指す。言語に関する研究の手法は大きく分けて以下の2つがある。
- 量的研究( quantitative research )
- 数量を用いて分析。一般化が目的。「仮説検証型」。
- 質的研究( qualitative research )
- 数量化せずに分析。一般化は目的ではない。「仮説生成型」。
寺井は量的な研究しか経験がないため、本講義では量的な研究を行うことを念頭に統計処理の方法について講義を行う。しかし、それらが質的研究と全く関連がないわけではない(もし質的な研究に関心がある受講生の方がいたら、関連すると思う点を教えてください)。
量的研究では数量を扱うため、統計手法を用いて分析を行うことが多い。よって、量的研究を行う場合、統計に関する知識が必要不可欠。
データ収集の前に分析手法をある程度決めておく必要がある(Garbage in, garbage out. )。使用する統計手法だけでなく、以下のことも十分に考えておくことが必要。
- どんなデータが必要?(What)
- どのようにデータを取ればいい? (How)
- どれくらいのデータが必要? (How many)
- 誰に対してデータを取る?(Who)
2.2 Rとは
Rはプログラム言語の一種で、統計解析向けの言語。統計解析以外にもWebアプリを作ったり資料を作成したりすることも可能(この資料もRを使って作成しています)。Rは無料でインストール・使用することができる。
Rに備わっている機能だけで分析を行うことができるが、世界中のRユーザーが開発した機能(パッケージ)を無料でインストールすることができる。これにより、様々な分析を行うことができるが、それらのアップデートが行われるため注意が必要である(アップデートにより以前と同じように動かないということも起こりうるため)。
- RをiPhone本体、パッケージをXやInstagramなどのアプリとイメージするとよい
Excelなどコードを書かなくても統計解析を行うことができるソフトウェアは多い。しかし、ソフトウェアは無料のものばかりではなく、また実行したい分析を機能として持っていない可能性がある。近年では生成AIなどによって、プログラミングのハードルが以前よりも低くなったと考えられる。ソフトウェアで実行するよりも、プログラミング言語を駆使して分析を行う方が、統計以外の知識にもつながる。最初は「二階から目薬」のような気持ちになるかもしれないが、根気強く、授業者、友人、先輩、そしてAIさん達に頼りながら取り組んでほしい。
2.3 Rのインストール
🔊 Windowsを使用している人で、DocumentsのパスにOne Driveが関係している人は教えてください。
- Rの公式サイトにアクセス( https://www.r-project.org/ )
- CRANをクリック
- Japanのリンクをクリック(Yamagata University)
- 自分のパソコンのOSを選択
- “install R for the first time”をクリック。全部NextでOK!
- インストールが完了したら、Rを立ち上げて以下のコードを入力する。Enterを押すと命令が実行される。
## [1] 21
## [1] 19
## [1] 12
## [1] 2
## [1] 4
2.4 RStudioとは
- Rだけでも分析は可能だが、Rだけの解析は難しい。そこで、よりRでの解析を行いやすくする統合開発環境(RStudio)の中でRを使用する。
- 注意点として、Rのインストールも必ず行う必要がある。
- RStudioはWeb版とローカル版があり、前者はオンライン上で使用するが、後者は各個人のパソコンで使用する。Web版の使用には、サーバーが必要であるため(基本有料)、ローカル版(RStudio Desktop)での使用に慣れる方がよい。
2.5 RStudioのインストール
- RStudioのサイトへ行く( https://posit.co/download/rstudio-desktop/ )
- All Installers and Tarballsで自分自身のパソコンのOSを選び、ダウンロード
2.6 RStudioの機能
4つのペイン:
ソース
- 実行するコードのメモ帳
環境・履歴
- 読み込んだデータを表示したりや過去に実行したコマンドを記録できる
コンソール
- R。ソースペインを実行する場所
ファイル・作図・パッケージ・ヘルプ
- ワーキングディレクトリにあるファイルを表示したり、作成した図を確認したり、インストールされているパッケージを確認したり、パッケージの使い方を確認する
2.7 プロジェクト機能
- プロジェクト = ディレクトリ
- ファイルや操作履歴を保存できる
ディレクトリ(📁)とは、場所のこと。Rは一か所にしか滞在できない、移動する際も、命令してあげないと自分で勝手に移動してくれない。📁ごとが異なる場所であるため、ファイルを読み込んだりする場合も、Rがいる場所と、ファイルがある場所が異なる場合、Rを移動させるか、ファイルをRがいる箇所まで移動させないと読み込むことはできない。
- プロジェクトを作成する利点
- 研究ごとに分析に必要なファイルをまとめることができる
2.7.1 プロジェクトの作成
- ドキュメントディレクトリに新しいフォルダーを作成
名前は、絶対英数字のみ!(Rが関係しそうな場合、ファイル名、フォルダ名に日本語を使わない方が安心です)
作り方を解説しているサイト(私たちのR)
- RStudioを開き、右上の[Project:]ボタンをクリック。
- [New Project]をクリックし、[Existing Directory]から、先ほど作成した名前のディレクトリを選択
- 今後、この講義で配布されたファイルや、作成したファイルは全てそのディレクトリ内に入れるようにしてください
- 今後、この講義でRStudioを使用する場合は必ずこのプロジェクトを開いてください
2.9 R Markdown入門
Rの出力結果を文字や写真、リンクなどと一緒に出力できるもの。
左上の紙のマークを押して、R Markdownを開く
【パーツ1】YAML(YAML Ain’t Markup Language)ヘッダー:文章全体の体裁や情報を操作する
- タイトル、サブタイトル
- 作成者
- 作成した日時、更新日時も設定可能
- どのような形式で作成するか
注意
・ YAMLヘッダーは、RでもMarkdownでもないプログラム言語で記述
【パーツ2】コードチャンク:Rのコードを記述するところ
【パーツ3】ドキュメントチャンク:Markdownと呼ばれるプログラム言語で記述するところ
- 見出し、表、箇条書き、強調、斜体など、Wordのリボン部分にある機能をMarkdownで書く
2.10 ドキュメントチャンク:Markdown記法
2.10.1 覚えるのはマストではない。その都度調べてよく使うものを覚えていく
- Markdownなら生成AIはほぼ完ぺきに正解を教えてくれる
- 必要最低限で覚えておくとよい記法
- 見出し → これはマスト!
- #の数で指定。文字との間を半角あけるのを忘れない。
- 箇条書き
*,+,-のいずれかを入れる。文字との間を半角あけるのを忘れない。- 半角スペースを2つ前(もしくはtab)に入れると、レベル2を作れる。さらに2ついれると、、、
- 強調
- *で挟むと斜体
- **で挟むとBold体
- ***で挟むとどうなるでしょう
- 見出し → これはマスト!
2.11 Let’s 実践
- 以下の文章をR Markdownを使って再現してください。
# 名古屋飯といえば
## ひつまぶし:Hitsumabushi
おすすめは以下のお店です。
- ひつまぶし花岡
- 場所:栄
2.17 参考文献
- 📚竹内・水本(編著)(2023)『外国語教育研究ハンドブック【増補版】―研究手法のより良い理解のために』松柏社
- 📚松村・湯谷・紀ノ定・前田(2021)『改訂2版 RユーザのためのRStudio[実践]入門―tidyverseによるモダンな分析フローの世界』技術評論社
- 💻RStudioの設定変更【見た目】
- 💻私たちのR
