文書推薦
更新日:2019.04.27
作成日:2016.08.12
Hugoで関連記事を表示させるためは、ある記事がどの記事と似ているかを機械的に処理する必要があります。では、この判断をどのようにすればいいのでしょうか?
この記事に書いてあること
- 関連記事を出すために考えること
- 文書推薦のための手法(コンテンツベース、協調フィルタリング)
- 実装方法
- word2doc
word2doc
名前は聞いたことがあったが、なんのためにどうやって使うのか全然わからなかった。
文書推薦とは?
- コンテンツベース
- 協調フィルタリング
コンテンツベースとは、文章の内容を元に判断するアルゴリズムであり、
協調フィルタリングとは、Amazonのレコメンドエンジンのように誰々がオススメするものみたいなイメージを持ちました。
TF-IDFによる文書推薦
以下の「プログラマのための文書推薦入門」は、分かりやすかったので一読をお勧めします。
あとは、以下のブログで、コードを見ながら雰囲気を掴みました。
Pythonでcos類似度とTF-IDFを用いた文章の類似度算出 - 元理系院生の新入社員がPythonとJavaで色々頑張るブログ
Related contents
TECH
2016.09.18
building machine learning systems with python
TECH
2016.09.06
Hugoで人気記事を表示するためJSONを返すAPIサーバを作りData-driven Contentを試してみた
TECH
2016.08.13
PythonでTF-IDFによる文書推薦
TECH
2016.08.11
Hugoで関連記事を表示する方法
TECH
2021.03.27
【Tableau】Personal Access TokensでTableau REST APIを利用する
TECH
2017.06.18
EDINETとXBRLとは何か?Pythonで財務諸表のデータを取得する
TECH
2012.01.28
短縮URLを展開する
TECH
2011.11.21
Pythonのループの書き方いろいろ