とある三流プログラマーの覚書

機械学習、自然言語処理を中心にIT系の話題を書いていく予定です

ライトノベル

ライトノベルの感想をDoc2Vecで解析 可視化編

はじめに ライトノベルの感想をDoc2Vecで解析では、ラノベの感想をgensimのDoc2Vecを使って、200次元のベクトルデータとして表現しました。 ベクトルデータなので、類似度の計算ができましたが、200次元といわれても、われわれにはイメージできません…

ライトノベル感想類似度検索を実装してみた

はじめに 前回の記事にたくさんブクマをいただいたので、とりあえずWEBアプリとして実装してみました。 デザインが全然できないので、Bootstrapのデフォルトで作ってあります。 紹介 リンクはこちら 検索ボックスでラノベのタイトルを検索します。 タイト…

ライトノベルの感想をDoc2Vecで解析してみた

はじめに 前回ラノベの内容紹介をDoc2Vecで解析して遊んでみましたが、あまり面白い結果になりませんでした。 今回はアマゾンレビューなどから収集してきた、ラノベの感想を使ってみます。 感想が近い小説は読み味も近いだろうという予測がたつので、今度こ…

Doc2Vecでライトノベルの内容紹介を解析

はじめに 前回、ラノベの内容紹介をトピックモデルで解析しました。 同じデータを今度はDoc2Vecにかけて遊んでみます。 Doc2Vecとは、文書(Document)のベクトル表現で、文書同士の類似度を算出したり、文書間で足し算や引き算ができるらしいです。 これで好…

ライトノベルの内容紹介をトピックモデルで解析

ライトノベルの内容紹介をトピックモデルで解析 はじめに 最近、機械学習とか自然言語処理に興味があります。 まずは、理論は置いといてライブラリで遊んでみようということで、 小説家になろうのランキングをトピックモデルで解析(gensim) を参考にgensimの…