自然言語処理
はじめに ライトノベルの感想をDoc2Vecで解析では、ラノベの感想をgensimのDoc2Vecを使って、200次元のベクトルデータとして表現しました。 ベクトルデータなので、類似度の計算ができましたが、200次元といわれても、われわれにはイメージできません…
はじめに 前回の記事にたくさんブクマをいただいたので、とりあえずWEBアプリとして実装してみました。 デザインが全然できないので、Bootstrapのデフォルトで作ってあります。 紹介 リンクはこちら 検索ボックスでラノベのタイトルを検索します。 タイト…
はじめに 前回ラノベの内容紹介をDoc2Vecで解析して遊んでみましたが、あまり面白い結果になりませんでした。 今回はアマゾンレビューなどから収集してきた、ラノベの感想を使ってみます。 感想が近い小説は読み味も近いだろうという予測がたつので、今度こ…
はじめに 前回、ラノベの内容紹介をトピックモデルで解析しました。 同じデータを今度はDoc2Vecにかけて遊んでみます。 Doc2Vecとは、文書(Document)のベクトル表現で、文書同士の類似度を算出したり、文書間で足し算や引き算ができるらしいです。 これで好…
ライトノベルの内容紹介をトピックモデルで解析 はじめに 最近、機械学習とか自然言語処理に興味があります。 まずは、理論は置いといてライブラリで遊んでみようということで、 小説家になろうのランキングをトピックモデルで解析(gensim) を参考にgensimの…