2016-04-01から1ヶ月間の記事一覧
はじめに 『実践機械学習システム』のお勉強、第2章です。 scikit-learnのインストールに非常に苦労しました。 環境構築については、前回の記事で。 2章の内容 2章はクラス分類(classification)の話です。 可視化や理解のしやすい小さなデータセットを使…
はじめに 機械学習と自然言語処理の勉強を始めるにあたって、Pythonの開発環境を構築しました。 というか、いろいろインストールしていったら、途中で上手くいかなくなったので、AnacondaというPythonのディストリビューションを入れました。 Anacondaには、…
2016年4月に考えた人工知能に置き換えられる職業 はじめに ITmediaに「人工知能に置き換えられる職業と置き換えられない職業」という記事を見つけました。 元ネタは、野村総研が2015年の12月に出した「2030年の日本に備える」というレポートらしいです。 12…
『実践機械学習システム』1章をやってみた記録 はじめに 機械学習勉強のために、O'Reillyの『実践機械学習システム』を買ってきました。 とりあえず理論は置いといて、コード書いて試してみること優先です。 ちなみに例の黄色い本を本屋で軽く読んでみまし…
はじめに 前回、ラノベの内容紹介をトピックモデルで解析しました。 同じデータを今度はDoc2Vecにかけて遊んでみます。 Doc2Vecとは、文書(Document)のベクトル表現で、文書同士の類似度を算出したり、文書間で足し算や引き算ができるらしいです。 これで好…
ライトノベルの内容紹介をトピックモデルで解析 はじめに 最近、機械学習とか自然言語処理に興味があります。 まずは、理論は置いといてライブラリで遊んでみようということで、 小説家になろうのランキングをトピックモデルで解析(gensim) を参考にgensimの…