機械学習と自然言語処理のためのPython3開発環境構築
はじめに
機械学習と自然言語処理の勉強を始めるにあたって、Pythonの開発環境を構築しました。
というか、いろいろインストールしていったら、途中で上手くいかなくなったので、AnacondaというPythonのディストリビューションを入れました。
Anacondaには、NumPy、SciPy、matplotlib、scikit-learnといった、機械学習に必要な基本的なライブラリが最初からインストールされています。
日本語形態素解析のMeCabや、gensimは別途インストールが必要です。
そのあたりの環境構築のメモを残しておきます。
環境
Ubuntu14.04
Pythonは3系を利用
Anacondaのインストール
公式サイトからダウンロードします。
ダウンロードしたディレクトリで、Anaconda---.shを実行します。
bash Anaconda3-4.0.0-Linux-x86_64.sh
最後にPathを追加するか聞かれるのでyesを入力します。
MeCabのインストール
sudo apt-get install libmecab-dev sudo apt-get install mecab mecab-ipadic-utf8 sudo apt-get install build-essential conda install pip pip install mecab-python3
gensimのインストール
pip install gensim
まとめ
すごく簡単に環境構築ができました。
最初の苦労はなんだったのか…。