前回の「SlideShareの機械学習に関するスライドを大量に集めてみた」でSlideShareの検索機能に不満のある方が、やはりおられたようなので、他のバージョンも作っていきます。今回はGoogleのsiteコマンド検索( 「データマイニング site:slideshare.net 」)でヒットした520件を対象にWebスクレイピングし、タイトルで検索できるようになっています。前回からの改良点は、URLがリンクになっている点です。(スマホユーザーも嬉しい)
ビュー数順に並んでいますが、TablePressのビュー数でソートするとどうやら整数と認識されていないようで、うまく並び替えができないようです。
たまに企業での分析事例共有などのスライドもあるので、仕事のアイデアも手に入ったりします。書籍になっていなかったりするし、Google検索だけで見つけようとすると大変なので、この試みは当分続けていこうと思います。本文内のテキストを取得してタグ付けしておくのも行う予定です。
[table id=4 /]