2014年9月10日水曜日

無料で SAS を使ってみよう

今年6月の話ですが、SAS Institute 社 (以下、SAS社) が 無料で使える 「SAS® University Edition」 を提供しました。Windows、OS X、Linux 上で動作します (ただし64bit版のみ)。
参考: SAS、高等教育や社会人学習向けにソフトウェアを無償提供
本日は、この SAS University Edition の
  • Ubuntu でのインストールから起動まで
  • 実際の使用時の特徴・注意点、例えば libname のパスの書き方など
  • について書きたいと思います。
導入の手順は丁寧に書いたつもりですが、SASの詳しい使い方についてはここでは書きません (SASの使用法については、公式ドキュメントなど情報が豊富にあります)。ある程度 SAS の使用法を知っていることを前提とした上での注意点を書いています。なお、SAS Studio はブラウザ上で動かすので、起動後の操作方法はどのOSでもほとんど変わらないようです。そのため、後半は Windows ユーザの方でも参考になると思います。

「University」と銘打っているので、一見すると学生しか使えないのかと思われるかもしれませんが、実際には学生の身分でなくても利用が可能です。使用できる機能は, SAS® Software for Academiaで確認できます。

もう少しちゃんと利用規約を確認してみましょう。 利用規約 (2014年7月14日版) は英語でしかも長いですが、無断複製するなとか、ソフトの著作権を守りなさいとか、大半は常識的なルールの記述です。 つまり、利用するにあたって特に注意すべき制約は
  • 商用利用は禁止。個人的な利用か学術目的のみ可能。
  • 学生・社会人不問 (ただし18歳以上でないと使用できない)。
  • 少なくとも2015年7月31日までこの規約は有効。
の3点ですね。 業務で使用するのではなく、個人的に使用方法を学習するのであれば問題ないはずです (そしてもちろん私は18歳以上です)。

なんらかの統計解析パッケージを使用した経験のある方は、SPSS、R など (あるいはややマイナーですが、Eviews、STATA、Gretl というものもありますね。) と比較して、SAS は「個人利用するには高い」と印象を持たれている方も多いと思います。しかしこれで汚名返上です。 R と同じくらい敷居が下がりました。タダです。 タダ。これは SAS の理解を深める絶好の機会ですね。

というわけで導入方法を紹介します。導入方法はもちろん公式サイトで説明されていますが、現時点でほとんど英語です。

参考: SAS® University Edition

そこで、ここでは英語を読むのが煩わしいという方向けに日本語で解説します。 とはいえ、実は Windows についてはなんと動画で説明してくださってる方がいます。

埋め込み動画がうまく表示されない場合はこちら

こちらのブログでも文章で簡単に紹介されています > SAS University Edition - ついにSASが無料で利用できる時代に -

しかし、私の愛用している OS は Ubuntu (Linux) なので、ここでは Linux での導入方法を画像を交えて紹介したいと思います (実際のところそこまで大きな違いはありませんが……)。

ダウンロード

SAS University Edition には、SAS の仮想イメージファイル以外に、それを起動させる仮想化ソフトが必要です。 今回はやはり無料で使用できる Oracle VM VirtualBox (以下 VirtualBox) を利用します。 バージョンは 4.3.12 であることが望ましいようです (私は 4.3.14 r95030 で動かしました)。 こちらも Oracle 社のサイトからダウンロードし、インストールしておきましょう(.deb ファイルからのインストール方法はわかりますよね? sudo dpkg -i ... です。)。

次に、SAS 社のダウンロードサイト
Free Statistical Software, SAS University Edition
へアクセスしましょう。

このボタンから次のページの 「Get Download」を押します。今回は VirtualBox を使用して起動するので、「SAS® University Edition for VirtualBox」 と書かれてる真下の「Get Download」 ボタンを押します。
この次のページでユーザ登録が必要です。右の 「Create」ボタンでアカウントを作成しましょう。言語、氏名、メールアドレス、所属、国籍が必須記入項目です。
アカウント登録が終わると、利用規約が表示されます。 これは先に説明したところです (ひょっとしたら私が最後に読んだ時と規約が変わっているかもしれませんのでできる限りご自分でも確認された方が良いです。)。

利用規約に同意し、ダウンロードします。 注文ボタンを押してからダウンロード可能になるまで少し時間がかかり、その前にダウンロードしようとしてもエラーが発生します。 ダウンロード可能になるとメールで通知が来るのでのんびりと待ちましょう。ダウンロードファイルの拡張子は .ova です。

インストールと設定

仮想イメージのダウンロードが終わったら、VirtualBox を起動します。
メニューバーの「ファイル」から「仮想アプライアンスのインポート」を選びます。現れたウィンドウに、先ほどダウンロードした .ova ファイルをインポートするよう入力します。
それ以降の設定は基本的に変更する必要はないと思いますが、以下が正しく設定されているかは確認しましょう。 インポート中か、もしくはインポート完了後に「設定」ボタンを押して設定を確認します。

  • 「システム」では
    • メインメモリは最低 1GB (1024MB)、最高で「物理メモリの半分未満」でなければなりません。 特にこだわりがないなら 1GB で十分でしょう。
    • 「プロセッサ数」は変更できません。
  • 「共有フォルダ」は、仮想マシンに割り当てる記憶領域です。
  • 適当なところに
    "SAS"
    というフォルダを作成し、さらにその直下に
    "myfolders"
    というフォルダを作成します。 このフォルダ名は大文字小文字を区別します。 公式のチュートリアルでは、"SASUniversityEdition" の下に "myfolders" を作成するよう書かれていますが、親フォルダは別にどんな名前でもいいようです。 "myfolders" のみ一致すれば問題なく動きます。

これを共有フォルダに設定します。 設定ウィンドウだと、「共有フォルダ」を選択するとウィンドウ右端に共有フォルダを追加するアイコンがあります。 さきほどの "myfolders" を設定し、さらに
  • 「自動マウント」にチェックを入れ
  • 「読み込み専用専用」にチェックを入れない
ことを確認します。 共有フォルダは複数追加できますが、以上の "myfolders" は必須です。 また、自動マウント・読み込み専用の設定も同じです。

ところで、私は Windows とマルチブートできるようにしているのですが、共用したいファイルを FAT32 のパーティションに入れています。 この際に注意なのですが、FAT32 のファイルシステムをそのまま使おうとするとうまくいかないので、 Ext4にしておきましょう。

起動

以上の設定が終われば、「起動」ボタンを押して起動します。 起動にはやや時間がかかります。
静止画ではわかりにくいですが、Throbber (読み込み時のアニメーション) が円ではなく「∞」を描くように回っています。

しばらくすると下のような画面がでます。
この状態で、ウィンドウを閉じずに、新たにウェブブラウザを起動します。ブラウザは Google Chrome または Mozilla FireFox のみ対応と書かれていますが、私はこっそり SRWare Iron (Ver. 35.0.1900.0) を使いましたが、問題なく動きました。 Chromium 系なら問題なく動きそうです。

ブラウザから、http://localhost:10080 にアクセスします。
「SAS Studio を始める」 を押して SAS を開始します。
読み込みが終わるとこのような画像が現れます。
では簡単な動作確認をしてみましょう。
サブミットすると……
無事、エラーもなく put ステートメントで「NI BLOG!」と表示されました。
これで SAS が私物の PC でも使えるようになりました!

とはいえ、これで終わりにするのも物足りないので、この環境での使用法の特徴・注意点についていくつか書いておきます。

SAS Studio の特徴・注意点

データセットやカタログファイル、.sas ファイルの保存について

ご存知の通り、work ライブラリはセッションごとにリセットされるのでデータセット等の保存はできません。 ユーザライブラリに指定できるフォルダは、最初に作成した myfolders 内だけです。 その際、
libname ライブラリ名 '/folders/myfolders/フォルダ名';
のように指定します ("myfolders" そのものでも可能です)。
ここでは "testlib" と言うフォルダを myfolders 直下にあらかじめ作成しておきました。

libname testlib '/folders/myfolders/testlib';
data testlib.data1;
 var ='test';
run;

を実行してみます。testlib フォルダに "data1.sas7bdat" ファイルが保存されるはずです。
エラーもなかったので、フォルダを確認したところ、たしかにファイルが作られています
再び SAS に戻り、中身も確認しましょう。

無事作成されています。

なお、SAS Studio 起動中にフォルダを追加するには、ターミナルや他のソフトを使って作成します (細かく調べてはいませんが、sysexecdcreate ではうまく行かない?)。 作成後、左の「フォルダ」タブを開いて「最新の情報に更新」ボタンを押すと再読み込みして追加されたフォルダ認識してくれます。 フォルダタブから作成する場合、マイフォルダ直下以外であれば、フォルダを作成できます。 .sas ファイルも同様に "/folders/myfolders/" 以下もしくは他の共有フォルダにのみ保存できます。
(参考: How do I create a folder shortcut to my existing SAS files?)

また、VirtualBox の共有フォルダで myfolders 以外のフォルダも設定していた場合は、「フォルダショートカット」にリンクされています。 パスは
/folders/myfolders/設定したフォルダ名
になります。 下の画像では、"folder1" というフォルダを作成しています。
一旦 SAS を終了した後、Nautilus でフォルダを作成し、
VirtualBox で共有フォルダを設定します。
再び SAS を起動すると、フォルダショートカットに "folder1" が追加されています。

オートコンプリート機能

コード入力を予測してくれる機能があります。 英語ですが説明文も表示されます。

スニペット機能

SAS は
proc sql;
...;
quit; 
とか
proc hoge data=data1...;
...:
run;

のように長めの定型文をよく使います。 スニペットではそのような定型文がいくつか用意されており、すぐにペーストできます。 自分で登録することも可能です。

なお、SAS Studio の操作方法には、下記のように公式の動画チュートリアルがあります (英語ですが日本語字幕があります。) ので、こちらも参考になります。また、googleで検索したところ、SAS Studioの公式日本語マニュアルのpdfファイルもあるのでこちらも参考になりそうです (なぜか公式サイトからのリンクが見つかりませんでしたが)。

埋め込み動画がうまく表示されない場合はこちら
動画冒頭ではサーバとPCを接続すると説明していますが、この SAS University Edition ではローカルで実行できます。 よってインストールが終わればネット接続できない状況でも使用できます (ただし更新チェックはできなくなりますが)。

仮想マシン上で動かすため、あまり大掛かりなことはできないでしょうが、 そもそも個人利用なら十分すぎるほど機能が充実していますし、これまで SAS は敷居が高いと感じていた方はこれを機に試してみてはいかがでしょうか。

1 件のコメント:

  1. 非常に分かりやすいご説明ありがとうございます。

    わたくしは横着して、投稿者様のブログ(本ブログ)からURL「http://localhost10080」をコピペしましたが、「localhost」と「10080」の間の「:」が抜けているため、これでは開始画面にたどり着きません。
    投稿者様に非はありませんが、わたくしと同じような方がいたらと思い、コメントさせていただきました。

    正しいURL「http://localhost:10080」

    返信削除

ツイート数からみる"バーチャルYouTuber"ブーム

今や YouTuber の話題の半分を占めるほどのクチコミ数に 当社が提供するソーシャルビッグデータ検索ツールの「 beInsight (ビーインサイト)」を使って、話題の「バーチャル YouTuber 」について調べてみました。 「バーチャル YouTuber...