2013年8月27日火曜日

Rって知ってますか -- 統計処理ソフトR

インターネットの話題として少し前までクラウドという言葉をよく聞きましたが、、最近は、ビッグデータ、データサイエンティストという言葉がよく聞かれます。私は「統計」とは程遠いヒトです。8月初旬にHBSの井本先生(人類遺伝学分野)からメールがあり、「「R」を広めませんか!」というメールをいただきました。私は、「R」という言葉を聞いたことはありますが、統計処理ソフトということしかしりません。当然、触れたこともないし、統計学というと、数学がバシバシ使いこなせないとダメだというイメージです。噂では、グーグルさんでもビッグデータの統計処理に「R」が使われているということです。「R」ってどんなプログラミング言語だろうと少し興味がフツフツと脳裏に湧いてきました。それで、井本先生に入門書を教えてもらいました。その一冊が「Rによるやさしい統計学」(オーム社)という本です。この本は(前半の基礎編の少ししか読んでいないのですが。。)数学的な数式はあまり記載されていないので、私にもどうにか読み進めることができています。この本は統計の基礎を丁寧に説明した上で、「R(言語)」を説明する形式になっているので、統計学の基本が解っていなくても、「R」を学習していく際には、とてもよい教科書となる感じです。ネット上にもいろいろ「R]についての入門的なドキュメントもたくさんあるようですが、個人的な目標として、取り敢えず「基礎編」までがんばることにしています。蔵本図書館をよく利用している学生さんに聞いたところ、統計処理はエクセルで行っているとのことでした。(「R」って知ってると聞いたところ、全然知らないということでした。)学生さんの多くがエクセルを使っているのでしょうか。このブログを読んだのを機会に、初心者からプロフェッショナルまで利用できる「R」ってなにか調べてみませんか。生命科学系の学生さんにとっても有意義なツールとなるのではないかと思います。言い忘れましたが、この「R」はオープンソースソフトウェアで、無料で利用できます。Windowsへのインストールはとても簡単でした。クリックのみでした。井本先生もオススメなので、生命科学系学生さんに興味を持っていただけばと思います。時々このブログに「R」ネタを投稿しますので、読んで下さい。

参考に「R」のわかりやすいインストール手順を掲載したサイトをご紹介します。(適当にググってみました。)他にも、いろいろなサイトがあります。

Rのダウンロードとインストール(Windows)
1から16までの手順でインストール完了です。インストール後、「R」を立ちあげた場合は、quit() コマンドを入力して終わってください。

では、今日はこの辺で。