とある三流プログラマーの覚書

機械学習、自然言語処理を中心にIT系の話題を書いていく予定です

機械学習と自然言語処理のためのPython3開発環境構築 

はじめに

機械学習自然言語処理の勉強を始めるにあたって、Pythonの開発環境を構築しました。

というか、いろいろインストールしていったら、途中で上手くいかなくなったので、AnacondaというPythonディストリビューションを入れました。

Anacondaには、NumPy、SciPy、matplotlib、scikit-learnといった、機械学習に必要な基本的なライブラリが最初からインストールされています。

日本語形態素解析MeCabや、gensimは別途インストールが必要です。

そのあたりの環境構築のメモを残しておきます。

環境

Ubuntu14.04

Pythonは3系を利用

Anacondaのインストール

公式サイトからダウンロードします。

ダウンロードしたディレクトリで、Anaconda---.shを実行します。

bash Anaconda3-4.0.0-Linux-x86_64.sh

最後にPathを追加するか聞かれるのでyesを入力します。

MeCabのインストール

sudo apt-get install libmecab-dev
sudo apt-get install mecab mecab-ipadic-utf8
sudo apt-get install build-essential

conda install pip
pip install mecab-python3

gensimのインストール

pip install gensim

まとめ

すごく簡単に環境構築ができました。

最初の苦労はなんだったのか…。