Skip to content

Latest commit

 

History

History
25 lines (17 loc) · 657 Bytes

README.md

File metadata and controls

25 lines (17 loc) · 657 Bytes

前提条件

  • Apache MADlib 1.10.0以降がインストールされていること

データセット

データ準備手順

  • データセットをダウンロード
  • zip imdb-5000-movie-dataset.zip を展開、csvファイル movie_metadata.csv を取得
  • movie_metadata.py を実行してSQLファイルを生成
  • SQLファイルを実行してテーブル movie_metadata を作成
  • vectorize.sql を実行してテーブル movie_metadata_vec を作成

検索

  • query.sql を実行

以上。