とある三流プログラマーの覚書

機械学習、自然言語処理を中心にIT系の話題を書いていく予定です

2016-04-01から1ヶ月間の記事一覧

実践機械学習システム2章

はじめに 『実践機械学習システム』のお勉強、第2章です。 scikit-learnのインストールに非常に苦労しました。 環境構築については、前回の記事で。 2章の内容 2章はクラス分類(classification)の話です。 可視化や理解のしやすい小さなデータセットを使…

機械学習と自然言語処理のためのPython3開発環境構築 

はじめに 機械学習と自然言語処理の勉強を始めるにあたって、Pythonの開発環境を構築しました。 というか、いろいろインストールしていったら、途中で上手くいかなくなったので、AnacondaというPythonのディストリビューションを入れました。 Anacondaには、…

人工知能に置き換えられる職業について考えてみた

2016年4月に考えた人工知能に置き換えられる職業 はじめに ITmediaに「人工知能に置き換えられる職業と置き換えられない職業」という記事を見つけました。 元ネタは、野村総研が2015年の12月に出した「2030年の日本に備える」というレポートらしいです。 12…

『実践機械学習システム』1章

『実践機械学習システム』1章をやってみた記録 はじめに 機械学習勉強のために、O'Reillyの『実践機械学習システム』を買ってきました。 とりあえず理論は置いといて、コード書いて試してみること優先です。 ちなみに例の黄色い本を本屋で軽く読んでみまし…

Doc2Vecでライトノベルの内容紹介を解析

はじめに 前回、ラノベの内容紹介をトピックモデルで解析しました。 同じデータを今度はDoc2Vecにかけて遊んでみます。 Doc2Vecとは、文書(Document)のベクトル表現で、文書同士の類似度を算出したり、文書間で足し算や引き算ができるらしいです。 これで好…

ライトノベルの内容紹介をトピックモデルで解析

ライトノベルの内容紹介をトピックモデルで解析 はじめに 最近、機械学習とか自然言語処理に興味があります。 まずは、理論は置いといてライブラリで遊んでみようということで、 小説家になろうのランキングをトピックモデルで解析(gensim) を参考にgensimの…