gitextract_pzr7p8zx/ ├── README.md ├── Restaurants (Yelp) Dataset-EDA.ipynb ├── TripAdvisor_Crawler_Parser.ipynb ├── attraction_etl.ipynb ├── attractions_crawler.ipynb ├── attractions_details_crawler.ipynb ├── attractions_recc.py ├── combine_batches.ipynb ├── etl/ │ ├── attraction_reviews/ │ │ ├── part-00000-49e3efc3-a4b7-41e8-b45e-c3f57c21a6a5-c000.snappy.parquet │ │ ├── part-00001-49e3efc3-a4b7-41e8-b45e-c3f57c21a6a5-c000.snappy.parquet │ │ ├── part-00002-49e3efc3-a4b7-41e8-b45e-c3f57c21a6a5-c000.snappy.parquet │ │ └── part-00003-49e3efc3-a4b7-41e8-b45e-c3f57c21a6a5-c000.snappy.parquet │ ├── attraction_reviews.json │ ├── attractions.json │ ├── del_dup/ │ │ ├── part-00000-c453ac1f-d0ec-49e3-8984-030e500feb5f-c000.json │ │ ├── part-00001-c453ac1f-d0ec-49e3-8984-030e500feb5f-c000.json │ │ ├── part-00002-c453ac1f-d0ec-49e3-8984-030e500feb5f-c000.json │ │ └── part-00003-c453ac1f-d0ec-49e3-8984-030e500feb5f-c000.json │ ├── newh_df/ │ │ ├── part-00000-8b7be6b6-c958-4a62-847d-550064dd5a78-c000.json │ │ ├── part-00001-8b7be6b6-c958-4a62-847d-550064dd5a78-c000.json │ │ ├── part-00002-8b7be6b6-c958-4a62-847d-550064dd5a78-c000.json │ │ └── part-00003-8b7be6b6-c958-4a62-847d-550064dd5a78-c000.json │ └── u_id_df/ │ ├── part-00000-c0814be7-b91e-4586-9388-7a44d9ed338e-c000.json │ ├── part-00001-c0814be7-b91e-4586-9388-7a44d9ed338e-c000.json │ ├── part-00002-c0814be7-b91e-4586-9388-7a44d9ed338e-c000.json │ └── part-00003-c0814be7-b91e-4586-9388-7a44d9ed338e-c000.json ├── final_hotel_recc.ipynb ├── get_att_recc.ipynb ├── hotel_etl.ipynb ├── hotel_recc.py ├── mf_models/ │ └── model_file/ │ ├── itemFactors/ │ │ ├── part-00000-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00001-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00002-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00003-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00004-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00005-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00006-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00007-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ ├── part-00008-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ │ └── part-00009-daa146bf-1542-404b-b7b1-a4e3cff69a72-c000.snappy.parquet │ ├── metadata/ │ │ └── part-00000 │ └── userFactors/ │ ├── part-00000-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00001-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00002-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00003-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00004-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00005-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00006-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00007-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ ├── part-00008-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet │ └── part-00009-1ce6925f-8f15-4e37-b696-1731c4499927-c000.snappy.parquet ├── outputs/ │ ├── attraction_details/ │ │ ├── part-00000-24d79c41-ab21-4f52-bb5e-fed77bf823f8-c000.snappy.parquet │ │ ├── part-00000-8b76e71d-55f4-47ef-a621-b32a2f3e1179-c000.snappy.parquet │ │ ├── part-00001-24d79c41-ab21-4f52-bb5e-fed77bf823f8-c000.snappy.parquet │ │ ├── part-00001-8b76e71d-55f4-47ef-a621-b32a2f3e1179-c000.snappy.parquet │ │ ├── part-00002-8b76e71d-55f4-47ef-a621-b32a2f3e1179-c000.snappy.parquet │ │ └── part-00003-8b76e71d-55f4-47ef-a621-b32a2f3e1179-c000.snappy.parquet │ ├── attraction_reviews/ │ │ ├── part-00000-01b23ac3-b793-40dc-b90a-93a239db5d07-c000.snappy.parquet │ │ ├── part-00000-603b562f-5b1d-4e02-9a5d-f66acc3232a1-c000.snappy.parquet │ │ ├── part-00002-01b23ac3-b793-40dc-b90a-93a239db5d07-c000.snappy.parquet │ │ └── part-00002-603b562f-5b1d-4e02-9a5d-f66acc3232a1-c000.snappy.parquet │ ├── attractions_cat.json │ ├── attractions_details_batch1.json │ ├── attractions_details_batch2.json │ ├── attractions_reviews_batch1.json │ └── attractions_reviews_batch2.json ├── rbm.py ├── rbm_training.ipynb ├── recommendations/ │ ├── e10_r5000_lr0.01_hu64_bs8/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ ├── e20_r20000_lr0.01_hu128_bs16/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ ├── e20_r20000_lr0.01_hu64_bs16/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ ├── e20_r40000_lr0.01_hu128_bs8/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ ├── e20_r5000_lr0.01_hu128_bs8/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ ├── e50_r40000_lr0.01_hu128_bs16/ │ │ ├── hb.npy │ │ ├── user1_seen.csv │ │ ├── user1_unseen.csv │ │ ├── vb.npy │ │ └── w.npy │ └── e50_r40000_lr0.01_hu256_bs16/ │ ├── hb.npy │ ├── user1_seen.csv │ ├── user1_unseen.csv │ └── vb.npy ├── requirements.txt ├── sample_table_widget.ipynb ├── tripadvisor_hotel_output/ │ ├── file_mainpage_url.txt │ ├── hotel_info.csv │ ├── hotel_info.json │ ├── hotel_info_dedup.csv │ ├── hotel_info_dedup.json │ ├── reviews_dedup.csv │ └── reviews_dedup.json └── utils.py