Thư Viện Tài Liệu Tổng Hợp

Thư Viện Tài Liệu Tổng Hợp (http://tailieutonghop.com/free/home.php)
-   Công nghệ - Thông tin (http://tailieutonghop.com/free/f156/)
-   -   Nghiên cứu ứng dụng mã nguồn mở Lucene để xây dụng phần mềm tìm kiếm thông tin trên văn bản (http://tailieutonghop.com/free/nghien-cuu-ung-dung-ma-nguon-mo-lucene-de-xay-dung-phan-mem-tim-kiem-thong-tin-tren-van-ban_f156-32603.html)

dovanluon 08-26-2013 09:41 PM

Nghiên cứu ứng dụng mã nguồn mở Lucene để xây dụng phần mềm tìm kiếm thông tin trên văn bản
 
Trong bài báo này chúng tôi giới thiệu những nghiên cứu về mã nguồn mở Lucene và chỉ ra cách thức ứng dụng nó trong hệ thống tìm kiếm. Lucene là dự án mã nguồn mở được cung cấp và quản lý bởi tổ chức Apache Software Foundation, đây là công cụ lập chỉ mục cho văn bản, sử dụng trong hệ thống tìm kiếm. Lucene cho phép xử lý các văn bản đầu vào ở dạng văn bản (text) để tạo ra tập chỉ mục và cung cấp phương thức tìm kiếm trên tập chỉ mục đó. Nó cũng cho phép người dùng kế thừa và phát triển để phù hợp với nhiều ngôn ngữ khác nhau. Chúng tôi đề xuất mô hình ứng dụng Lucene để phát triển hệ thống tìm kiếm trên các văn bản lưu trữ. Trong mô hình này, chúng tôi sử dụng mã nguồn của Lucene và xây dựng một số xử lý cho ngôn ngữ tiếng Việt. Đầu tiên, chúng tôi tiến hành tách nội dung của các loại văn bản, sau đó thực hiện một số xử lý cho tiếng Việt và lập chỉ mục cho các văn bản, cuối cùng chúng tôi xây dựng các ứng dụng tìm kiếm sử dụng tập chỉ mục này để truy vấn và lấy về tài liệu liên quan.


Xin thông báo, bây giờ là 06:52 PM