--

13 (1) 2018

Sử dụng kỹ thuật so sánh chuỗi kết hợp trên các chuỗi có độ dài chênh lệch


Tác giả - Nơi làm việc:
Lưu Vĩnh Trung - Trường Đại học Mở Thành phố Hồ Chí Minh , Việt Nam
Tác giả liên hệ, Email: Lưu Vĩnh Trung - trung.lv@ou.edu.vn

Tóm tắt
Bài báo này giới thiệu một thang đo kết hợp các thuật giải so sánh chuỗi toàn cục và cục bộ để đánh giá sự tương tự giữa các cặp chuỗi ký tự. Qua thực nghiệm, thang đo được chứng minh về hiệu quả khi làm việc trên các chuỗi có độ dài chênh lệch so với các thang đo khác. Thang đo hữu ích trong việc phân cụm người dùng web, nhằm dự đoán và đáp ứng yêu cầu về thông tin của các nhóm người dùng khác nhau trong thời gian thực.

Từ khóa
khai phá dữ liệu web, phân loại người dùng, so sánh chuỗi, thương mại điện tử, E-commerce, sequence alignment, user segmentation, web mining

Toàn văn:
PDF

Tài liệu tham khảo

Chordia, B. S., & Adhiya, K. P. (2011). Grouping web access sequences using sequence alignment method. Indian Journal of Computer Science and Engineering (IJCSE), 2(3), 308-314.


Dimopoulos, C., Makris, C., Panagis, Y., Theodoridis, E., & Tsakalidis, A. (2010). A web page usage prediction scheme using sequence indexing and clustering techniques. Data & Knowledge Engineering, 69(4), 371-382.


Luu, T. V. (2017). Phân loại người dùng web sử dụng kỹ thuật so sánh chuỗi [Categorize web users using string comparison technique]. Tạp chí Khoa học Đại học Mở Thành phố Hồ Chí Minh, 55(4), 12-17.


Petitjean, F., Forestier, G., Webb, G., Nicholson, A.E., Chen, Y., & Keogh, E. (2014). Dynamic time warping averaging of time series allows faster and more accurate classication. Paper presented at International Conference on Data Mining, IEEE, Shenzhen, China.


Punj, G., & Stewart, D. W. (1983). Cluster analysis in marketing research: Review and suggestions for application. Journal of Marketing Research, 20, 134-148.



Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.